Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лабораторные работы по теории вер..pdf
Скачиваний:
40
Добавлен:
04.06.2015
Размер:
2.62 Mб
Скачать

Нормальное распределение

Плотность вероятности нормально распределённой случайной величины определяется формулой

 

 

1

e

( x a)2

 

f (x) =

σ

2σ 2

,

(4.12)

 

2π

 

 

 

 

где a и σ – параметры распределения, являющиеся математическим ожиданием и среднеквадратическим отклонением случайной величины соответственно:

M (X ) = a ; D(X ) =σ 2. При любых значениях параметров для распределения

(4.12) выполняется условие нормировки (4.7).

Функция (4.12) определена для любых значений аргумента x . График симметричен относительно линии x = a ; в точке x = a функция имеет максимум. При x = a ±σ имеются перегибы графика. При x →±∞ f (x) асимптоти-

чески приближается к нулю.

Пример 12. На рис. 4.1 изображены три нормальные кривые со следующими параметрами: 1) a = 2, σ =1; 2) a =1, σ =1; 3) a = 2, σ = 2 .

 

0,5

f(x)

 

 

 

 

 

 

 

 

 

 

 

0,4

 

 

 

 

1

 

0,3

 

 

 

 

2

 

 

 

 

 

3

 

 

 

 

 

 

 

0,2

 

 

 

 

 

 

0,1

 

 

 

 

 

 

0

 

 

 

 

x

-1

0

1

2

3

4

5

Рис. 4.1. Нормальные кривые (пример 12)

При уменьшении параметра a кривая, не изменяя формы, смещается влево, при увеличении – вправо. С ростом σ максимальное значение f (x) снижа-

ется, кривая становится более пологой.

Площадь фигуры, заключённой между любой нормальной кривой и осью абсцисс, в силу выполнения условия нормировки, стремится к 1.

Для нормальной случайной величины X вероятность попадания в заданный интервал (α,β) равна

 

β a

 

α a

,

(4.13)

P(α < X < β) = Φ

σ

 

−Φ

σ

 

 

 

 

 

 

 

49

где Φ(t) – интегральная функция Лапласа:

t

1

e

z 2

 

Φ(t) = ϕ(z)dz, ϕ(z) =

2

.

(4.14)

0

2π

 

 

 

 

Значения функций ϕ(z) и Φ(t) помещены в приложении 2. Подынтегральная функция ϕ(z) (приложение 1), которую часто называют функцией Гаусса, есть

не что иное, как функция плотности нормального распределения (4.12) при a = 0 и σ =1 – положительная, чётная, быстро убывающая с ростом модуля z. Функция Лапласа Φ(t) – нечётная, проходит через начало координат, при

t →±∞ асимптотически приближается к значению ± 1/2 (рис. 4.2).

 

 

0

,6

Ф ( t

)

 

 

 

 

 

 

 

 

0

,4

 

 

 

 

 

0

,2

 

 

 

 

 

 

0

 

 

t

- 4

- 2

- 0 ,2

0

2

4

 

 

- 0 ,4

 

 

 

 

 

- 0

,6

 

 

 

Рис. 4.2. Интегральная функция Лапласса

Вероятность попадания нормальной случайной величины X в симметричный относительно математического ожидания интервал полуширины δ равна

 

 

 

 

P(

 

X a

 

<δ) = 2Φ δ .

(4.15)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так, например,

 

P(

 

X a

 

<σ) = 2Φ(1) = 0,6826,

 

 

 

 

P(

 

 

 

X a

 

 

 

< 2σ) = 2Φ(2) = 0,9544,

 

 

 

 

P(

 

X a

 

<3σ) = 2Φ(3) = 0,9973.

 

 

 

 

В последнем случае вероятность попадания случайной величины в интервал всего лишь на 0,0027 меньше единицы. Таким образом, выход случайной величины за пределы указанного интервала почти невозможен (правило трёх сиг-

ма).

50

Понятие о центральной предельной теореме

Суть центральной предельной теоремы (ЦПТ): случайная величина, яв-

ляющаяся суммой достаточно большого числа взаимно независимых случайных величин, каждая из которых мало влияет на всю сумму, имеет распределение, близкое к нормальному.

Пример 13. Исследуем распределение вероятностей случайной величины X – числа шестёрок, выпадающих при бросании 600 игральных костей.

Эта величина имеет биномиальное распределение (2.5) с n = 600 , p = 16 :

P(X = k) = C600k (16)k (56)600k , k = 0,1, ..., 600 .

(4.16)

Числовые характеристики биномиального распределения могут быть найдены по формулам

M (X ) = pn,

σ(X ) = p(1p)n .

(4.17)

В нашем случае M (X ) =100,

σ(X ) 9,13.

 

При выполнении задания 4.1 на компьютере вы убедитесь в том, что график биномиального распределения (4.16) прекрасно согласуется с кривой нормального распределения (4.12) при a =100, σ =9,13. Это объясняется тем, что

случайная величина X удовлетворяет условиям ЦПТ, поскольку может быть

600

представлена в виде X = Xi , где X i — число появлений шестёрки при бро-

i =1

сании i-й кости (0 или 1).

Локальная и интегральная теоремы Лапласа, формула Пуассона

Основываясь на ЦПТ, можно получить приближённую формулу для распределения вероятностей случайной величины X – числа наступлений некоторого события в достаточно длинной серии однородных независимых испытаний (что является альтернативой не очень удобной для этого случая формуле Бернулли).

Локальная теорема Лапласа утверждает, что для случайной величины X

 

ϕ(zk )

 

1

 

z2

 

 

k pn

 

 

P(X = k)

p(1

p)n

; ϕ(z) =

2π

e

2

;

zk =

p(1 p)n

,

(4.18)

 

 

 

 

 

 

 

 

 

 

где n – число испытаний,

p – вероятность наступления события в отдельном

испытании. Так, в условиях примера

13, при

 

k =100

получаем:

zk = 0,

ϕ(zk ) = 0,399 , P(X =100) =0,044. Это хоть и малое, но, тем не менее,

макси-

мальное значение вероятности. Например,

P(X =90) = P(X =110) =0,024.

51

Распределение (4.18) есть не что иное, как нормальное распределение (4.12) с параметрами a = pn , σ = p(1p)n . Действительно, переходя от дис-

кретной к непрерывной случайной величине, можно на основании формулы (4.5) записать:

P(X = k) = P(k 12 < X < k + 12) f (k)x = f (k) ,

из чего следует, что (4.18) можно рассматривать не только как распределение вероятностей дискретной случайной величины, но и как закон распределения плотности непрерывной случайной величины.

Иногда вместо формулы Бернулли применяют очень удобную формулу Пуассона. При большом числе испытаний n и малом значении вероятности p наступления события в каждом отдельном испытании биномиальный закон распределения вероятностей аппроксимируется законом Пуассона (законом редких событий):

P(X = k) =

λk eλ

, λ = pn, k = 0,1, 2, ..., n .

(4.19)

k!

 

 

 

В условиях примера 13 формула Пуассона плохо применима, поскольку одно из обязательных условий (малое значение вероятности p) не выполнено.

Перейдём к интегральной теореме Лапласа: вероятность того, что в серии однородных независимых испытаний число наступлений события окажется не меньше k1 и не больше k2 , приближённо равна

 

 

 

 

 

) −Φ(z ), Φ(t) = 1

t

e

z 2

z = k1,2 pn

 

P(k

X k

2

) = Φ(z

2

2

dz,

. (4.20)

1

 

 

1

2π

0

 

 

 

1,2

p(1

p)n

 

 

 

 

 

 

 

 

 

 

 

 

Так, в условиях примера 13 вероятность того, что среди 600 брошенных костей окажется от 90 до 105 шестёрок, приближённо равна

P(90 X 105) = Φ( 0,55) − Φ(1,10) = 0,209 + 0,364 = 0,573.

Разыгрывание непрерывной случайной величины, разыгрывание нормальной случайной величины

Рассмотрим подход к разыгрыванию непрерывной случайной величины X по её функции распределения F(x). Имея случайное число γ , равномерно

распределённое на интервале (0, 1), следует определять случайное число x (значение случайной величины X ) как решение уравнения

F(x) =γ .

(4.21)

Например, для равномерного распределения

F(x) =

x a

, a < x < b ,

b a

 

 

52

и, следовательно,

 

 

 

x a

= γ x = (b a)γ + a .

(4.22)

 

 

 

b a

 

 

Заметим, что в данном случае связь между γ

и x

достаточно очевидна:

умножение на (b a) изменяет длину интервала,

добавление a смещает его

начало.

Разыгрывание нормальной случайной величины основано на другой идее. Рассмотрим случайную величину Z , равномерно распределённую в интервале

(0, 1). Её числовые характеристики: M (Z) =0,5 ,

D(Z ) = 1

. Перейдём к слу-

чайной величине

12

 

 

 

12

 

 

X = Zi 6 ,

 

(4.23)

i =1

 

 

где Zi – независимые случайные величины с таким же распределением, как Z . Согласно свойствам математического ожидания и дисперсии,

12

 

 

M (X ) = M Zi 6

=12M (Z ) 6 =12 ×0,5 6 = 0,

i=1

 

 

 

12

 

D(X ) = D Zi 6

=12D(Z ) =1.

i=1

 

Так как случайная величина Z удовлетворяет условиям ЦПТ, она имеет рас-

пределение близкое к нормальному с параметрами a = 0 , σ =1. Если же нам требуется приближённо разыграть нормальную случайную величину с произвольными параметрами a и σ , то следует случайное значение величины X (4.23) преобразовать в соответствии с формулой

Z =σX + a .

(4.24)

Для примера 13 разыгрывание числа шестёрок, выпавших на 600 костях, будет реализовываться по следующей схеме.

1.Разыгрываем случайную величину X по формуле (4.23).

2.Полученное случайное значение преобразуем в соответствии с формулой

(4.24), где a = pn, σ = p(1p)n , p = 16 , n = 600 .

Задание для лабораторной работы

4.1. Получить распределение случайной величины X – числа шестёрок, выпадающих при бросании 600 игральных костей (см. выше пример 13), применив следующие подходы:

53

4.1.1.биномиальное распределение (точный подход);

4.1.2.распределение Пуассона (в данном случае – грубое приближение);

4.1.3.нормальное распределение (приближение в соответствии с локальной теоремой Лапласа);

4.1.4.статистическое распределение, возникающее при разыгрывании нормальной случайной величины по методу Монте-Карло.

Кроме этого, применив интегральную теорему Лапласа, получить приближённо вероятность того, среди 600 брошенных костей окажется от 90 до 105 шестёрок, и сравнить с точным значением, вычисленным через формулу Бернулли (биномиальное распределение). Используя статистическое распределение, проверить выполнение правила трёх сигма.

Смысл настоящей работы состоит в том, чтобы сравнить различные модели числа наступлений события в серии однородных независимых опытов, уяснив условия их применения.

Инструкция по выполнению задания в Excel

Введите в отдельные ячейки значения вероятности наступления события в отдельном испытании ( p = 16 ), числа испытаний ( n = 600 ), математического

ожидания ( pn ) и среднеквадратического отклонения ( p(1p)n ). После этого приступайте к составлению таблицы, столбцами которой будут:

A.возможные значения случайной величины X ;

B.значения вероятностей, вычисленные по формуле Бернулли (биномиальное распределение);

C.значения вероятностей, вычисленные по формуле Пуассона;

D.значения вероятностей, вычисленные через локальную теорему Лапласа (нормальное распределение);

E.значения интегральной функции нормального распределения;

F.количества опытов, в которых случайная величина X приняла данные возможные значения (метод Монте-Карло);

G.соответствующие оценки вероятностей (метод Монте-Карло).

Дадим некоторые советы.

A.Не следует рассматривать весь массив значений X от 0 до 600; вполне достаточно задать значения 50, 51, …, 149, 150.

B.Вместо того, чтобы вводить формулу Бернулли (2.5), можно воспользоваться функцией =БИНОМРАСП (число успешных испытаний; 600; 1/6; 0), где первый аргумент будет представлять собой ссылку на значение в 1-ом столбце.

C.Вместо того, чтобы вводить формулу Пуассона (4.19), можно воспользоваться функцией =ПУАССОН (число успешных испытаний; 100; 0).

D.Для задания вероятностей, вычисленных через локальную теорему Лапласа, можно просто обратиться к функции =НОРМРАСП (значение случай-

54

ной величины; среднее значение; стандартное отклонение; 0). «Стандартное отклонение» – это синоним среднеквадратического отклонения.

E. Интегральная функция нормального распределения, которая выражается через интегральную функцию Лапласа формулой

x a

 

1

(4.25)

F(x) = P(−∞ < X < x) = Φ

 

 

+

2

σ

 

 

 

 

(см. 4.13), может быть найдена с помощью той же функции =НОРМРАСП, но в качестве последнего аргумента необходимо задать не 0 (как для столбца D), а 1.

Для заполнения столбцов F и G необходимо предварительно (на другом поле электронной таблицы) организовать разыгрывание нормальной случайной

величины с параметрами a = pn и σ = p(1p)n . Данная процедура осущест-

вляется по формулам (4.2.3) и (4.2.4). Каждая строка таблицы будет соответствовать одной реализации. В 12 столбцах будут генерироваться независимые 12 случайных чисел (=СЛЧИС()), а в 13-ом столбце – число, определяемое формулой

=ОКРУГЛ (среднеквадратическое отклонение* (СУММ (диапазон, содержащий 12 случайных чисел) – 6) (4.26)

+математическое ожидание; 0).

Данная формула будет округлять генерированное число до целого значения (число выпавших шестёрок должно быть целым). Как и в предыдущих работах, растягиваем таблицу до 10000 строк.

Возвращаемся к заданию столбцов F и G. В столбце F должны стоять числа, определяемые формулой

=СЧЁТЕСЛИ (диапазон значений, генерированных по формуле (4.26); возможное значение случайной величины),

а в столбце G – соответствующие оценки вероятностей, т.е. значения из предыдущего столбца, поделенные на число реализаций (10000).

55

 

0,05

 

 

 

 

 

 

 

 

 

 

 

0,045

 

 

 

 

 

 

 

 

 

 

 

0,04

 

 

 

 

 

 

 

Формула Бернулли

 

 

0,035

 

 

 

 

 

 

 

Лок. теорема Лапласа

 

 

 

 

 

 

 

 

Формула Пуассона

 

 

 

 

 

 

 

 

 

 

 

вероятности

0,03

 

 

 

 

 

 

 

Метод Монте-Карло

0,025

 

 

 

 

 

 

 

 

 

 

0,02

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,015

 

 

 

 

 

 

 

 

 

 

 

0,01

 

 

 

 

 

 

 

 

 

 

 

0,005

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

50

60

70

80

90

100

110

120

130

140

150

 

 

 

X , число шестёрок, выпадающих при бросании 600 игральныхкостей

 

 

 

 

Рис. 4.3. Различные модели числа наступлений события в серии опытов

 

Постройте диаграмму, отобразив на ней результаты, полученные с помощью всех четырёх моделей (рис. 4.3). Кривая, соответствующая методу МонтеКарло, разумеется, будет изменяться с каждой новой реализацией. Результаты, полученные по локальной теореме Лапласа, практически не отличаются от точного расчёта (по формуле Бернулли), хотя относительная ошибка в области малых значений вероятности может быть очень существенной. Даже формула Пуассона, которая в данной задаче плохо применима (не выполнено условие p <<1), дала совсем не плохой результат (ошибка менее 10 процентов в облас-

ти максимума вероятности). Разыгрывание нормальной случайной величины (метод Монте-Карло) при оценивании вероятности приводит к типичной ошибке порядка нескольких процентов величины.

Для того чтобы приближённо подсчитать вероятность попадания случайной величины X в заданный интервал, можно воспользоваться интегральной функцией нормального распределения. Так, вероятность того, что среди 600 брошенных костей окажется от 90 до 105 шестёрок, в соответствии с интегральной теоремой Лапласа (4.20) можно вычислить как разность значений в столбце E, относящихся к X =105 и X = 90 . Для проверки правила трёх сигма найдите сумму вероятностей, найденных методом Монте-Карло, для значений

73 < X <127 .

56

Инструкция по выполнению задания в Mathcad

Вдокументе Mathcad задайте значения вероятности наступления события

вотдельном испытании p := 16 , числа испытаний n := 600 . Математическое

ожидание и среднеквадратическое отклонение вычислим по формулам m := p n и d := p (1 p) n соответственно. Напомним, что знак умножения

вводим клавишей « * », знак деления – клавишей « / », для вычисления корня квадратного воспользуемся вкладкой «Калькулятор».

После этого приступим к вычислению векторов, содержащих следующие значения:

x – возможные значения случайной величины X ;

pb – значения вероятностей, вычисленные по формуле Бернулли (биномиальное распределение);

pp – значения вероятностей, вычисленные по формуле Пуассона;

pll –значения вероятностей, вычисленные через локальную теорему Лапласа (нормальное распределение);

pil значения интегральной функции нормального распределения. Дадим некоторые советы.

Не следует рассматривать весь массив значений X от 0 до 600; вполне достаточно задать значения 50, 51, …, 149, 150. Поэтому дискретной переменной i зададим значения от 50 до 150. Напомним, что дискретная переменная задается в виде i := 50 . . 150, где знак « . . » вводится нажатием клавиши « ; ».

Вместо того, чтобы вводить формулу Бернулли (2.5), можно воспользоваться уже известной вам по работе 2 функцией dbinom(k, n, р), которая возвращает вероятности биномиального распределения. Нужно присвоить pbi:=dbinom (xi, 600, p).

Вместо того, чтобы вводить формулу Пуассона (4.19), можно воспользоваться функцией dpois(k, l) из категории Probability Density (Плотность вероятности), которая возвращает вероятности распределения Пуассона со средним l. Нужно присвоить ppi:=dpois (xi, m).

Для задания вероятностей, вычисленных через локальную теорему Лапласа, можно обратиться к функции dnorm(x, mu, sigma) из категории Probability Density (Плотность вероятности), которая возвращает плотность вероятности нормального распределения со средним mu и среднеквадратическим отклонением sigma. То есть нужно присвоить plli:=dnorm (xi,m,d).

Перейдем к разыгрыванию нормальной случайной величины с параметрами a = pn и σ = p(1p)n по методу Монте-Карло. Данная процедура осу-

ществляется по формулам (4.23) и (4.24).

Элементами вектора xm будут количества опытов, в которых случайная величина Х приняла данные возможные значения. Элементами вектора рm -- соответствующие оценки вероятностей.

Программа, формирующая указанные векторы, приведена ниже.

57

f4(n ,m,d) :=

for

i 50.. 150

 

 

xi

0

 

 

for

k 1.. n

 

 

 

 

a runif(12,0,1)

 

 

 

 

 

 

z ceil d

a 6 + m

 

 

 

 

 

 

 

 

j z

 

 

 

 

xj xj + 1

 

 

x

 

 

В данной программе использована новая для нас функция runif(m, a, b) категории Random numbers (Случайные числа), которая возвращает вектор из m случайных чисел, имеющих равномерное распределение на интервале (a, b). Задавая m=12, а=0, b=1, получим сразу 12 случайных чисел, используемых в фор-

муле (4.23).

Следующая строка программы реализует вычисление по формулам (4.23).и (4.24). Чтобы подсчитать сумму элементов вектора используем опера-

тор суммы на панели инструментов Матрицы

Функция ceil(z) будет округлять полученное генерированное число до целого значения (число выпавших шестёрок должно быть целым). Затем мы просто добавляем 1 к элементу, номер которого совпадает с полученным значением. Выполнив эту операцию, скажем, 10000 раз, мы определим, сколько раз выпало то или иное число шестерок. Сформируем искомый вектор xm, присвоив ему значение полученной функции f4. Вектор рm вычислим с использованием дискретных переменных, поделив соответствующие элементы вектора xm на число испытаний (10000):

xm := f 4(10000,m,d )

i := 50. . 150

pmi :=

 

xmi

10000

 

 

 

Построим диаграмму, отобразив на ней результаты, полученные с помощью всех четырёх моделей (рис. 4.4). Кривая, соответствующая методу МонтеКарло, разумеется, будет «живой», т.е. меняющейся с каждой новой реализацией (при нажатии сочетания клавиш <Ctrl> + <F9>). Результаты, полученные по локальной теореме Лапласа, визуально вообще не отличаются от точного расчёта (по формуле Бернулли), хотя относительная ошибка в области малых значений вероятности может быть очень существенной. От формулы Пуассона в данной задаче не стоило ожидать хорошей точности (не выполнено условие p <<1), так что ошибка менее 10 процентов в области максимума вероятности

кажется совсем не плохим результатом. Разыгрывание нормальной случайной

58

величины (метод Монте-Карло) при оценивании вероятности приводит к типичной ошибке порядка нескольких процентов величины.

 

 

0.06

 

 

 

Вероятности

pbi

0.04

 

 

 

pp i

 

 

 

 

 

 

 

plli

 

 

 

 

pmi

0.02

 

 

 

 

 

 

 

 

 

0

50

100

150

 

 

 

 

i

 

 

 

 

Число шестёрок при бросании 600 костей

Рис. 4.4. Моделирование числа наступлений события в серии однородных независимых испытаний

Для того, чтобы приближённо подсчитать вероятность попадания случайной величины X в заданный интервал, можно воспользоваться интегральной функцией нормального распределения, которая может быть найдена с помощью

функции pnorm(x, mu, sigma) из категории Probability Distribution (Распреде-

ление вероятностей). Эта функция возвращает кумулятивное нормальное распределение вероятностей со средним mu и среднеквадратическим отклонением sigma. Нужно присвоить pili:=pnorm (xi,m,d).

Так, вероятность того, что среди 600 брошенных костей окажется от 90 до 105 шестёрок, в соответствии с интегральной теоремой Лапласа (4.20) можно

вычислить как разность pil105 – pil90 .

Точное значение P(90 X 105) может быть вычислено через суммиро-

вание элементов вектора pbi, при i от 90 до 105.

Для проверки правила трёх сигма найдите сумму вероятностей, найденных методом Монте-Карло, для значений 73 < X <127 , то есть сложите элементы вектора pmi, при i от 73 до 127.

Контрольные вопросы

1.Сформулируйте условия применимости формулы Пуассона и локальной теоремы Лапласа в задачах о числе наступлений события в серии однородных независимых опытов.

2.Дайте определение функции распределения и плотности распределения вероятностей случайной величины.

59