Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Бакаев Методы статистических испытаний 2007

.pdf
Скачиваний:
57
Добавлен:
16.08.2013
Размер:
2.2 Mб
Скачать

тестируется и оптимизируется на историческом временном ряде цен некоторого одного актива. Для создания хорошей МТС крайне важно обеспечить предотвращение ее подгонки под конкретные исторические данные, которые заведомо не повторятся в будущем. Одним из наиболее эффективных способов проверки МТС на излишнюю подгонку является ее апробация на исторических рядах цен других активов без изменения параметров системы. Если при неизменных параметрах МТС продолжает демонстрировать хорошие результаты и для других активов, то это позволяет рассчитывать, что данная система окажется эффективной и в реальной торговле. Следует учитывать, что ценность проверки МТС при смене активов существенно снижается, если активы сильно коррелированы. С другой стороны, если активы высококоррелированы, а МТС демонстрирует сбои при смене одного такого актива на другой, то пользоваться такой системой категорически не рекомендуется.

Тестирование механических торговых систем проводится при различных значениях оптимизируемых параметров, в результате чего формируются соответствующие отчеты.1 На основании анализа этих отчетов подбираются значения параметров системы, которые являются в определенном смысле оптимальными для трейдера. Основной целью в данной книге является демонстрация некоторых возможностей методов МонтеКарло при обработке отчетов о тестировании МТС.

7.1 Вероятность получения убытка в серии последовательных сделок

Рассмотрим возможный метод Монте-Карло для оценки вероятности получения убытка в серии последовательных сделок. Такая оценка вероятности основана на многократном численном моделировании результатов серии сделок на базе

1 Примеры отчетов о тестировании МТС можно найти в книге С.В. Булашева [4].

131

статистических испытаний. Предполагается, что исходные данные для статистического моделирования берутся из отчета о тестировании данной МТС.

Обозначим:

Q – полное число проведенных сделок;

П(k ) – относительная прибыль (норма прибыли) по

итогам первых k сделок;

М – длина анализируемой серии сделок.

Исходному ряду П(k ) поставим

в соответствие

вспомогательный ряд x(k ) = ln (1 + П(k )),

k =1,2,...,Q. Затем

по ряду

x

строится гистограмма относительных частот и

 

k

 

 

 

далее

выборочная

функция

распределения,

соответствующая выборке значений x(k ), k =1,2,...,Q. 2

Используя генератор псевдослучайных чисел, при помощи метода обратных функций смоделируем выборку y(k ) k=1,2,…,M, длина которой совпадает с длиной М

анализируемой серии сделок и распределение которой соответствует построенной выше выборочной функции

M

распределения. Фиксируем значение параметра ξ = ∑ y(k ) и

k =1

параметра

1,

ξ0 ,

ν =

ξ>0 .

0,

Повторяя с независимо генерируемыми псевдослучайными числами данный этап статистического моделирования N раз, где N – достаточно велико, получим соответствующие выборки ξ12,N и ν12,N . Таким

2 Методику построения гистограмм и выборочных функций распределения можно посмотреть, например, в книгах [4, глава 6] и [8, глава 15].

132

образом, приходим к статистической оценке для вероятности

убытка (уб) в серии из М сделок:

ν .

 

PN = 1

 

 

уб

N

N i=1 i

Вычисляя как обычно выборочное среднее квадратичное отклонение

1

 

 

 

 

 

 

1

 

N

2

 

1 N

 

2

2

 

sN =

 

νi

 

 

νi

 

(7.1)

 

 

 

N i =1

 

 

N i =1

 

 

 

 

 

 

 

 

 

 

 

 

и задаваясь некоторой

доверительной

вероятностью

β (0;1) , можно также

 

указать

соответствующую

приближенную интервальную оценку для вероятности

 

 

 

 

 

 

 

 

 

и I заменены,

убытка в форме

(6.6),

в которой

Y N

соответственно, на

 

 

уб

и

Pуб , где

Pуб

точное значение

 

 

 

PN

вероятности убытка.

7.2 Вероятность разорения в серии последовательных сделок

Вероятностью разорения принято называть вероятность того, что в серии последовательных сделок, проводимых на основании сигналов МТС, накопившаяся величина убытков превысит заранее заданное критическое значение, которое можно интерпретировать как капитал, которым располагает трейдер перед началом данной серии. Вероятность разорения является важной характеристикой хотя бы потому, что она имеет ненулевое значение даже для прибыльных в целом МТС, и это может привести к неверному решению об отказе от пользования такой МТС.

Очевидно, что вероятность разорения помимо всего прочего зависит от характера чередования прибыльных и убыточных сделок. В принципе даже при работе с

133

приносящей прибыль системой в силу неблагоприятного стечения случайных обстоятельств может сформироваться такая последовательность следующих друг за другом убыточных сделок, что разорение, как возможный случайный исход, может наступить раньше, чем система проявит свое среднестатистическое свойство приносить прибыль. Таким образом, при оценке вероятности разорения необходимо не только принимать во внимание соотношение между количествами прибыльных и убыточных сделок, но также и учитывать всевозможные последовательности сделок. Методы статистического моделирования как раз хорошо приспособлены для решения такого типа трудоемких задач.

Рассмотрим далее простейший метод Монте-Карло, позволяющий дать статистическую оценку вероятности разорения вместе с соответствующим доверительным интервалом. Пусть Q, П(k )и M имеют тот же смысл, что и в

параграфе 7.1 и пусть L – критическое относительное значение убытка, соответствующее порогу разорения. Как и раньше, исходному ряду П(k ) поставим в соответствие

вспомогательный ряд x(k ) = ln (1 + П(k )), k =1,2,...,Q . Затем по ряду x(k ) построим гистограмму относительных частот и далее выборочную функцию распределения, соответствующую выборке значений x(k ), k =1,2,...,Q.

Используя генератор псевдослучайных чисел, при помощи метода обратных функций смоделируем выборку y(k ), k =1,2,...,M , длина которой совпадает с длиной М

анализируемой серии сделок и распределение которой соответствует построенной выше выборочной функции распределения. При каждом m = 1, 2,…,М последовательно

 

m

 

вычисляем

ξm = ∑ y(k )

и делаем проверку на факт

k =1

134

наступления разорения: если ξm ln(1L), то разорение в данной серии сделок наступило и дальнейшее увеличение m не производится – в противном случае т далее последовательно увеличивается (если только т не достигло уже значения М) и проверка на разорение повторяется при

каждом новом значении m M . Как результат обработки данной серии из М сделок вычисляется значение параметра

ν :

 

 

при некотором m M , .

1;

ξm ln(1L)

ν =

0 ;

ξm > ln(1L)

при всех

m M.

 

Как и в параграфе 7.1, повторяя с независимо генерируемыми псевдослучайными числами данный этап статистического моделирования N раз, где N – достаточно велико, получим соответствующую выборку ν12,...,νN .

Усредняя выборочные значения, приходим к статистической оценке для вероятности разорения в серии из М сделок:

 

 

PN

= 1 ν .

 

 

 

 

 

разор

 

 

 

N

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

N i=1

 

 

Вычисляя по формуле (7.1) выборочное среднее

квадратичное

отклонение

и

 

задаваясь

некоторой

доверительной

вероятностью

 

 

β ( 0;1) ,

можно также

указать соответствующую приближенную

 

интервальную

оценку для вероятности разорения в форме (6.6), в которой

 

 

 

 

разор

и Pразор , где

Y N и I

заменены, соответственно, на PN

Pразор – точное значение вероятности разорения.

135

Глава 8 Моделирование работы систем массового обслуживания

Рассмотрим модель одной из простейших систем массового обслуживания, которая состоит из п линий (или каналов, или пунктов) обслуживания, каждая (каждый) из которых может независимо "обслуживать" поступающие заявки, но каждая линия в данный момент способна обслуживать не более одной заявки. Предполагается, что в систему поступает случайный (дискретный) поток заявок с заданными вероятностными характеристиками. Если на момент поступления очередной заявки в системе имеются свободные линии, то одна из них принимает на себя обслуживание этой заявки, при этом правило, определяющее, какая из свободных на данный момент линий возьмет на себя обслуживание поступившей заявки, считается заданным. Также считается, что продолжительность обслуживания заявки i-й линией – случайная величина с плотностью распределения pi (t), предполагаемой известной. Наконец,

считается, что если в данный момент времени все линии заняты, то система выдает отказ и заявка остается не обслуженной.

Такие системы массового обслуживания называются системами с отказами. Примером системы с отказами может служить, например, телефонная станция или многоканальный телефонный номер (линии – каналы связи, заявки – вызовы абонентов). В принципе аналогично могут быть смоделированы и другие классы систем массового обслуживания, в частности системы с ожиданием, к которым

можно

отнести

автозаправочные

станции

или

парикмахерские,

но для определенности

будем

рассматривать только системы с отказами. О других типах систем массового обслуживания, равно как и о

дополнительных

сведениях

из

теории

массового

 

136

 

 

 

обслуживания можно прочитать, например, в книгах Г. Я. Волошина [7, глава 9], А. Н. Ильченко [11, глава 2],

Н. Б. Кобелева [12, глава

5], В. И. Курбатова и

Г. А. Угольницкого [17, глава 7],

Г. П. Фомина [21, глава 6].

Конкретизируем далее для удобства изложения наши предположения, а именно, будем считать, что на вход системы с отказами поступает стационарный пуассоновский

поток заявок

– это

означает,

что случайная величина

Θk = tk tk 1 ,

равная

интервалу

времени между двумя

последовательными заявками, не зависит от предыстории поступления заявок (другими словами, Θk и Θj независимы

при j k ) и подчиняется экспоненциальному закону

распределения, то есть функция распределения для всех Θk равна

F(t)=1e a t ,

0 t < ∞ .

(8.1)

При этом величина a =

1

 

называется интенсивностью

M[Θ ]

 

 

 

 

k

 

 

потока заявок. Также будем считать, что в системе установлена фиксированная нумерация линий и что работа системы подчиняется следующему правилу выбора свободной линии: очередная заявка поступает на линию, которая освободилась раньше всех, а если таких более одной, то на ту из них, которая имеет наименьший номер.

Поставим задачу: оценить среднее число обслуженных заявок в данной системе за промежуток времени [0;Т] и будем решать эту задачу, применяя технику Монте-Карло. Для каждого момента времени и для каждой линии с номером i введем случайную величину τi – момент

освобождения этой линии к данному моменту времени t (должно выполняться τi t ); если линия в данный момент

137

времени занята, то полагаем τi = ∞ . В каждый момент времени будем контролировать величину1

τ = min τi .

(8.2)

1i n

Γ1, Γ2 ,через

Как и прежде, будем обозначать

последовательность независимых случайных чисел. Кроме того, обозначая через v количество обслуженных системой заказов, перед тем как начать моделирование, положим

ν = 0 .

Момент поступления 1-й заявки смоделируем по формуле

t1 = − 1a ln Γ1 .

Эта формула получается, если применить метод обратных функций, в котором задействована функция распределения (8.1), и положить Γ1 вместо 1Γ1 . Тогда 1-ю заявку будет

обслуживать 1-я линия, при этом время обслуживания определится согласно методу обратных функций из условия

0p1(y) dy = Γ2 .

Таким образом, 1-я линия будет занята вплоть до момента τ1 = t1 + . По формуле (8.2) вычисляется также новое

значение τ ; очевидно, последняя величина равна 0, если в

системе не меньше двух линий. Кроме того, положим

ν: = ν+1

Применим теперь принцип индукции для описания последующих шагов процесса моделирования. Предположим, что сделано (k – 1) шагов этого процесса, то есть полностью смоделирован процесс обслуживания всех заявок вплоть до (k – 1) -й. Далее моделируется момент поступления k-й заявки:

1 Напомним, что через n обозначено общее число линий.

138

tk = tk 1 1a ln Γ2k 1

ипроверяется условие наличия свободных линий:

τtk .

(8.3)

Если условие (8.3) выполнено, то система выбирает линию с наименьшим номером i, для которой τi =τ , и эта линия

принимает данную (k-ю) заявку для обслуживания. Продолжительность обслуживания определяется из условия

0pi (y)dy = Γ2k ,

а далее вычисляются новые значения τi = tk + и τ по

формуле (8.2). Наконец, изменяется на единицу количество обслуженных заказов: ν :=ν +1 и на этом моделирование k- го шага завершается. Если же условие (8.3) не выполняется

(это означает, что в момент времени tk все линии заняты), то

система выдает отказ, данная (k-я) заявка остается необслуженной, а моделирование k-го шага процесса опять же завершается. При этом величина ν – счетчика числа обслуженных заявок, сохраняет свое прежнее значение.

Моделирование обслуживания поступающих заявок продолжается до тех пор, пока момент поступления очередной заявки не превысит значение Т. К этому моменту содержание счетчика обслуженных заявок будет иметь определенное значение ν .

При практическом компьютерном моделировании вместо каждого случайного числа Γj возможно генерировать лишь

серию его независимых реализаций, например при помощи некоторого генератора псевдослучайных чисел. Поэтому компьютерная реализация описанного выше алгоритма должна проводиться путем N -кратного повторения (N – достаточно большое) указанных выше этапов моделирования с различными независимыми последовательностями случайных чисел, что приведет к N

139

смоделированным

значениям

ν1 ,ν2 ,...,νN

количества

обслуженных заказов. Отсюда можно получить статистическую оценку для среднего числа обслуженных системой заявок за промежуток времени [0;T]:

νN = 1 N νi .

N i =1

Для указания погрешности этой оценки нужно вычислить выборочное среднее квадратичное отклонение sN по формуле (7.1) и воспользоваться далее формулой (6.6), в

которой Y N и I должны быть заменены, соответственно, на

ν N и νср ,

где νср

истинное значение

среднего

числа

обслуженных

заявок

в промежутке

времени

[0;T].

140