Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Бакаев Методы статистических испытаний 2007

.pdf
Скачиваний:
57
Добавлен:
16.08.2013
Размер:
2.2 Mб
Скачать

=

9

~

=

9

νi

=

+ ~

νi

 

νij ,

ν j

 

νij ,

νi

νi .

 

 

j=0

 

 

i=0

 

 

 

Ясно, что ν€ – количество цифр, равных i среди ε1 ,ε3 ,,ε N 1 ,

i

 

 

 

ν~i – количество

цифр, равных i среди

ε2 ,ε4 ,,ε N ,

νi – количество цифр, равных i, среди цифр всей таблицы.

Найденные

значения ν ,ν ,ν€

~

могут быть теперь

 

ij i i

i

 

использованы в рамках критерия χ2 для разнообразных

проверок. В наиболее

важных из них величины χN2

вычисляются по формулам:

 

 

9

 

χN2 =

10 ( νi 0,1N ) 2

 

N i=0

 

с 9 степенями свободы (для проверки частот), а также

 

9

(νi, j 0,01N ' )2

χN2 =

100'

 

N i, j=0

 

с 99 степенями свободы (для проверки пар).33 В некоторых тестах также дополнительно используются величины

χN2 = 10' 9 (ν€i 0,1N ' )2

N i=0

и

χN2 = 10' 9 (νi 0,1N ' )2 ,

N i=0

каждая с 9 степенями свободы; эти величины соответствуют проверке частот среди цифр с четными и нечетными номерами.

33 При проверке частот параметр r, регулирующий разбивку на группы, выбирается естественным образом равным 10, так как количество различных цифр равно 10. Из аналогичных соображений при проверке пар принимается r =100.

51

Второй тест (проверка серий). Пусть nl – количество серий длины l в последовательности цифр ε1,ε2,,ε N

при l = 1,2,…,m и пусть n'm+1 – количество серий с l ≥ m+1 (все такие серии объединяются в одну группу). Обозначим

общее

количество

серий

через

 

n := n1 + n2 + ...+ nm + n'm+1

и

вычислим величину

 

 

 

 

 

 

 

 

2

m

(nl n pl )2

 

(n'm+1 n p'm+1 )2

 

 

 

χN

= ∑

 

 

+

 

,

 

 

n pl

n p'm+1

 

 

 

l =1

 

 

 

с m

степенями свободы,

где

принимается

pl = 9 10l

и

p'm+1 =10m .

 

 

 

 

 

 

 

Для комментария последней формулы обозначим через

λ

случайную длину серии, начинающейся с цифры εk +1 (то есть должно выполняться εk +1 εk . ). Очевидно,

pl = P ({λ = l})= P ({εk +1 = εk +2 = ... = εk +l εk +l +1})= = (0,1)l1 0,9 = 9 10l ,

откуда следует, что pl не зависит от k – номера, после которого начинается серия. Таким образом, каждая серия может с вероятностью pl иметь длину l. Количество nl серий длины l среди n серий очевидно подчиняется биномиальному распределению с математическим ожиданием M[n ] = n p , что

иобъясняет выписанную выше структуру выражения для χN .

Вкачестве примера в таблице приведено распределение поl l 2

длине серий, полученных И.М. Соболем при проверке таблицы из N=50000 цифр.34

34 См.: Соболь И. М. //Теория вероятностей и ее применения Т.3. 1958.

2. С. 205-211.

52

 

n1

n2

n3

n'4

 

n

 

Теоретические

40500

4050

405

45

 

45000

 

значения

 

 

 

 

 

 

 

Эмпирические

40568

4010

417

40

 

45035

 

значения

 

 

 

 

 

 

 

npl

40531,5

4053,2

405,3

45,0

 

-

 

По данным последних двух строк вычисляется

χN2 = 1,39. При

m = 3 это значение допустимо, например,

при уровне

значимости 1 – β = 0,1.

На настоящее время известно много весьма изощренных тестов. Как уже упоминалось ранее, все эти тесты до некоторой степени условны, так как всегда найдется тест, который уличит заданную априори таблицу в “неслучайности”.

Как проверять псевдослучайные числа?

Фактически, при проверке псевдослучайных чисел используются те же приемы, что и при проверке таблиц случайных цифр, поскольку, как мы установили, достаточно проверять на случайность не сами числа, а их цифры. При этом, очень часто тщательно проверяются только первые десятичные цифры у каждого числа из данного набора псевдослучайных чисел. Последующие цифры тоже проверяются, но уже менее тщательно, так что для их проверки как правило используются более простые (практически – менее трудоемкие) критерии – чем ближе к концу цифровой записи числа, тем проще критерий используется.

Отметим также, что более детальную в принципе проверку можно осуществить при помощи критерия ω2.

53

Наконец, укажем, что по наблюдениям И.М. Соболя в литературе фактически нет примеров, когда числа, прошедшие все тесты, оказались бы непригодными для решения конкретной задачи, если только в ней не предъявлялись повышенные требования к точности решения. В то же время существуют примеры неудачных расчетов с помощью чисел, которые не удовлетворяли какому-либо из тестов. Однако сам И.М. Соболь указывает только один пример в подтверждение своих слов (это пример неудачного расчета).35 Так или иначе, считается, что разумность приведенных выше тестов является эмпирическим фактором. Понимая, однако, что никакие тесты не являются универсальными во всех случаях жизни, при решении конкретной задачи специалисты рекомендуют вводить дополнительные тесты, ориентированные на использование специфики этой задачи. С другой стороны, успешное решение нужной задачи само по себе является лучшей проверкой выбранного генератора чисел.

35 См. [18, п. 3.3].

54

Глава 4 Генерация случайных величин с заданными законами распределения

”Well”, said Owl,”the customary procedure in such cases is as follows.”

”What does Crustimoney Proseedcake mean?” said Pooh. ”For I am a Bear of Very Little Brain, and long words Bother me.”

”It means the thing to do.” А. A. Milne

Обычно генераторы случайных чисел предусматривают генерацию значений одномерной случайной величины, распределенной равномерно на интервале (0;1). Если же по условиям задачи необходимо работать с другими законами распределения – в частности, если необходимо сгенерировать значения многомерной случайной величины, то используют определенные преобразования случайных чисел, поступаемых с генератора. Эти вопросы предстоит обсудить в этой главе.

4.1 Метод обратных функций

Метод обратных функций является фактически общим приемом для практического перехода от одномерного закона распределения к другому одномерному. Рассмотрим его применения в различных ситуациях.

Генерация дискретной случайной величины

Пусть дискретная случайная величина X задана законом распределения

x(1)

x(2)

x(n)

, (4.1)

p1

p2

pn

 

55

где pi = Ρ ({X = x(i ) }). Разобьем интервал

(0;1) на попарно

непересекающиеся промежутки 1 , ∆2 ,, ∆n

ненулевой длины,

все из которых являются открытыми слева полуинтервалами за исключением последнего, являющегося интервалом, так что

 

(0;1)= n

.

 

 

i=1

i

 

При этом обозначим pi := длина i ,

i =1, 2,, n . Тогда,

если Γ распределена

равномерно

в

интервале (0;1), то

случайная величина X, заданная формулой

 

X = xi

при Γ ∆i ,

i =1, 2,, n,

будет иметь как раз закон распределения (4.1). Действительно,

Ρ({X

= x(i ) })= Ρ({Γ ∆i })= длина i = pi , i =1, 2,, n.

Поэтому, имея в распоряжении последовательность

случайных

чисел γ1 ,γ2 ,, можно построить последо-

вательность x1 , x2 ,, подчиненную закону распределения

(4.1), если осуществлять переход от первой последовательности по формуле

xj = x(i ) если γj i , i =1, 2,, n, j =1, 2,

Очевидно, данный результат легко обобщается на случай, когда случайная величина X имеет счетное множество значений.

Моделирование случайных событий

Пусть

задана полная группа

случайных событий

A1, A2,…, An

и Ρ(Ai )= pi, i =1, 2,, n.

Пусть далее случайная

величина X – это номер i наступившего в эксперименте события

56

Ai. Тогда распределение случайной величины X

задается

таблицей

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

2

 

n

 

,

(4.2)

 

 

p1

 

p2

 

pn

 

 

 

Как и выше,

 

интервал

(0;1) разбит

на

промежутки i

ненулевой длины

pi , i =1, 2,, n . Так как Ai

= {X = i}, то для

моделирования группы случайных событий A1, A2, …, An достаточно смоделировать случайную величину X с законом распределения (4.2). Другими словами, если задана последовательность случайных чисел γ1 ,γ 2,, то по каждому

элементу этой последовательности моделируется одно из событий данной полной группы, а именно элементу γ j

ставится в соответствие то событие Ai с номером i, для которого

γj i .

В частном случае, когда n = 2, обозначим p := p1,

тогда

p2=1 – p. Если γj p , то моделируется событие

A1, в

противоположном случае – событие A2.

На практике часто возникает необходимость моделировать зависимость случайных событий. Для этой цели можно воспользоваться изложенной выше идеей формирования полной группы событий и соответствующей ей дискретной случайной величины. Для иллюстрации рассмотрим простой случай двух зависимых событий A и B, для которых задана исходная информация

Ρ(A)= pA , Ρ(B) = pB , Ρ(A B)= pA B .

Введем теперь полную группу попарно несовместных

событий:1

A := A B, A := A

 

, A :=

 

B, A :=

 

 

 

.

 

 

 

B

A

A

B

 

1

2

3

4

 

 

 

 

1 Через A обозначается событие, противоположное к A.

57

Вычислим соответствующий набор вероятностей для этой группы. Прежде всего, имеем p1 = pA B . Далее, используя закон умножения вероятностей, получаем2

p2 = Ρ(A B ) = Ρ(A)Ρ(B A)= P(A)(1Ρ(B A))=

= Ρ(A)P(A B)= pA pA B .

Аналогично вычисляется p3 = pB pA B .

Наконец,

p4 =1p1 p2 p3 =1pA pB + pA B . Заметим

теперь, что

событие A наступает в случае наступления A1 или A2, а событие B наступает при наступлении A1 или A3. Поэтому, если фиксируется элемент γj последовательности случайных чисел

γ1 ,γ2 ,, то

моделируется

наступление

события A,

если

γ j p1 + p2 ,

и наступление

события B,

если γj p1

или

p1 + p2 < γj p1 + p2 + p3 .

 

 

 

Моделирование непрерывных случайных величин

Пусть непрерывная случайная величина X принимает

значения

в интервале (a;b) и характеризуется плотностью

распределения p(x), которая принимает строго положительные

значения

при

x (a;b).3 Обозначая через F(x) функцию

распределения

данной случайной величины, получим

1,

x b ,

 

F(x)= ∫ x p(t)d t, x (a;b),

(4.3)

 

0

x a .

 

 

0,

 

2 Через P(B A) обозначается условная вероятность события B при

условии, что событие A уже наступило. 3 Очевидно, p(x) = 0, если x [a;b].

58

В принципе допускается ситуация, когда a = −∞ и/или b = ∞ . Заметим, что так как p(x) > 0 при x (a;b), то F(x) строго возрастает на интервале (a;b).

Согласно методу обратных функций предлагается моделировать случайную величину X на основе решения уравнения

F(X) = Г ,

где случайная величина Г равномерно распределена на интервале (0;1). С практической точки зрения такой подход означает, что если задана последовательность случайных чисел γ1, γ2 ,…, то последовательность значений x1 x2,…, подчиненных закону распределения (4.3), генерируется на основе решения уравнения

F (xj )= γj , j =1, 2,

При этом считается, что решением уравнения

F(x) = 0

является множество (-∞; a ], а решением уравнения

F(x) = 1

является множество [ b; ∞ ). Кроме того, так как F(x) строго возрастает на интервале (a;b) от 0 до 1, то при любом y (0;1) существует единственное решение уравнения

F(x) = y,

причем x (a;b).

Для обоснования данного метода заметим, что так как случайная величина Г распределена равномерно в интервале

(0;1), то

P({F(x) < Γ < F(x+ d x)})= F(x+ d x) F(x) = p(x)d x.

59

С другой стороны, ввиду наложенной связи между случайными величинами X и Γ должно выполняться равенство

P({F(x) < Γ < F(x+ d x)})= P({x < X < x+ d x }),

и из сравнения с предыдущим равенством следует

P ({x < X <x+ d x })= p(x) d x .

Таким образом, случайная величина X имеет плотность распределения p(x) или, что эквивалентно, функцию распределения (4.3).

Если известно аналитическое выражение для функции F -1(y), обратной к F(x), то для моделирования случайной величины X можно пользоваться явной формулой

X = F -1( Г ) .

Если же аналитическое выражение для F -1(y) неизвестно или не существует, то для ее вычисления можно применять численные методы.

Пример 4.1. Предположим, что случайная величина X имеет плотность распределения

p(x) = 12 ex .

Вычислим функцию распределения:

 

1

 

 

 

 

1

e

x

, x 0 ,

x

x

t

 

 

 

2

 

F(x) = ∫−∞ p(t) d t =

2

−∞ e

 

 

d t =

1

ex

, x > 0 .

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

Таким образом легко получить явное выражение для обратной функции

60