Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Г.Д, Ковалева, А.С. Липин -Теория вероятностей для социологов и менеджеров

.pdf
Скачиваний:
265
Добавлен:
28.03.2016
Размер:
1.22 Mб
Скачать

Глава 4. Случайные величины

ГЛАВА 4. СЛУЧАЙНЫЕ ВЕЛИЧИНЫ

4.1. Случайные величины и их распределения

Случайная величина (с.в.) – функция : R , если x R : x – собы-

тие.

Условие x – событие, необходимо для расчета вероятности в пространстве

, ,P .

Задание в виде : x – предмет договоренности. Потенциально возможно было любое другое, например в виде : x, y .

Стандартное задание случайной величины:

стрелок попал 1

.

стрелок промахнулся 0

На основе пространства , , P может быть задано бесконечное множество с.в., од-

нако по ним не всегда можно восстановить информацию о случайном эксперименте.

Две одинаковые с.в. , могут быть определены на разных вероятностных пространствах.

Распределение случайной величины – это соответствие значения с.в. вероятности его принять:

x P x ;

для множества на прямой – соответствие вероятности в него попасть:

a x b P a,b .

Аналогично заданию с.в., одинаково распределенные с.в. могут быть различными.

С.в. имеет дискретное распределение, если существует конечный или счетный набор чисел a1, a2, :

P ai 1.

i 1

Функция распределения с.в. – функция F :R 0,1 :

F x P x P : x .

Функция распределения описывает все распределение с.в. Аналогично введенным абстракциям, у разных с.в. могут быть одинаковые функции распределения.

Свойства функции распределения случайной величины

1) Ограниченность: 0 F x 1.

Следствие того, что функция распределения определяется, как P x , которая по

определению вероятностной меры лежит в интервале от 0 до 1.

2) Существование пределов: limF x 1,

lim F x 0.

x

x

Доказательство для правого предела следует из того, что

lim F x lim P x 1. ■

x

x

31

Теория вероятностей

3) Непрерывность слева

x x 0

 

x

 

 

 

 

0

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

lim

F

 

F

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4) F x0 0 F x0 P x0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Данное свойство определяет величину скачка функции распределения в точке x0 , кото-

рый равен вероятности P x0 . Докажем свойство для дискретного распределения.

 

 

 

 

 

F x0 P x0

P ak

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k:ak x0

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

x0 0 P x0 0

P ak

 

 

 

 

 

 

 

 

 

 

F

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k:ak x0

 

 

 

 

 

 

 

 

 

 

Соответствующая разность равна: P x0 .

 

 

 

 

 

 

 

 

 

 

 

 

 

5) P a b F b F a .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

 

a b

 

P

 

a

 

 

P

a

 

P

b

P

a

.

 

 

 

 

 

 

b

 

 

 

 

 

 

 

b

 

Учитывая, что a b, P a b 1 и P a 1 P a получим:

P a b P a b 1 P a P b 1

P b P a F b F a .▄

6) Неубывание: x1 x2 F x1 F x2 .

F x1 F x2 F x2 F x1 P x1 x2 0 . ■

Известные нам случайные величины – это Bp , Bn, p , , гипергеометрическая с.в. Из дискретных распределений стоит отметить еще несколько распределений.

Тривиальный случай случайной величины – вырожденная случайная величина, которая принимает одно значение a с вероятностью 1. Обозначается Ia .

Таблица распределения в данном случае – простейшая:

a

P 1.

Отрицательное биномиальное распределение – распределение с.в., распределенной как количество неудач до s -го успеха в схеме Бернулли, NBs, p .

Вероятность k неудач:

P k Ckk s 1ps 1 p k .

Таблица распределения с.в.:

 

 

0

 

1

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

P

 

pr

 

rpr 1 p

 

 

 

Ckk r 1 pr 1 p k

 

 

Геометрические распределение – распределение с.в., распределенной как номер первого успешного испытания в схеме Бернулли, Gp :

P k p 1 p k 1.

Таблица распределения с.в.:

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

 

 

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

P

 

p

 

p 1 p

 

 

 

p 1 p k 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

32

Глава 4. Случайные величины

Геометрическое распределение единственное из дискретных обладает свойством «нестарения» или «отсутствия памяти»:

P x y x P y ,

которое трактуется следующим образом – количество прошлых «неудач» (x) не влияет на количество будущих «неудач» (y).

Свойство «нестарения» очень удобное в прикладном смысле – время работы прибора до поломки не зависит от того, как долго он до этого работал безотказно. На самом деле мы уже сталкивались со свойством «нестарения» – это свойство отсутствия последействия у простейшего потока в § 3.7.

Геометрическое распределение является частным случаем отрицательного биномиаль-

ного распределения: Gp NB1, p . Более того, для независимого набора с.в. i 1,n i Gp :

n

i NBn,p . i 1

Пример 4.1. Построим график дискретной функции распределения с.в. Bp .

По определению функции распределения F x P x .

Таблица распределения Бернулли:

 

 

 

0

1

.

 

 

 

P

1 p

p

Если x 0, то событие x

не содержит элементарных исходов, т.е. P x 0.

Если 0 x 1, то событие

x

сдержит один элементарных исход 0 , поэтому

P x P 0 p .

 

 

 

 

 

 

Если 1 x, то событие x сдержит два элементарных исход 0, 1 , поэтому

P x P 0 P 1 p 1 p 1.

Аналитически функция распределения записывается в виде кусочно-разрывной функции:

0,x 0

F x 1 p,0 x 1.1,1 x

График такой функции имеет типичную для дискретного распределения форму – ступенчатую, а «высота ступени» равна скачку функции распределения. см. рис. 4.1.

F x

1 p

1 p

0

1

x

Рис. 4.1. Функция распределения биномиальной с.в.

Скачек в точке нуль: F 0 0 F 0 1 p 0 1 p P 0 . Скачек в точке x 1: F 1 0 F 1 1 1 p = p= P 1 .

33

Теория вероятностей

4.2.Абсолютно непрерывные случайные величины

Впредыдущем параграфе были даны общие определения случайной величины и функции распределения с.в. и примеры дискретных случайных величин. Однако кроме дискретных случайных величин, заданных на счетном пространстве элементарных исходов, нам известны непрерывные пространства значений, например в задаче о встрече.

Для непрерывных мы использовали инструменты, отличающиеся от случая дискретных пространств. Например, формулу геометрической вероятности вместо расчета мощности множеств. Так и для случайных величин в непрерывных пространствах необходимы новые инструменты, т. к. они обладают некоторыми специфичными свойствами.

4.2.1. Плотность распределения случайной величины

Случайная величина имеет абсолютно непрерывное распределение, если существует неотрицательная функция f x :

x

 

 

F x

f t dt ,

(4.1)

 

 

 

где f x плотность распределения с.в.

Свойства плотности распределения с.в.

1) f x 0.

d

2) f x dx F x .

3) Условие нормировки f x dx 1.

Интеграл можно заменить следующим пределом:

 

f x dx lim

x

f t dt limF x 1. ■

 

 

x

x

 

 

 

 

b

4) P a b F b F a f x dx .

a

Более того, верна формула: P a b P a b P a b P a b , так

как вероятность с.в., имеющей непрерывную функцию распределения, попасть в точку равна нулю:

F a F a 0 F a F a F a 0.

5) Если пределы lim f x и

lim f x существуют, то они равны нулю.

x

x

На рис. 4.2 показано соответствие между функцией распределения и плотностью распределения с.в. Согласно определению плотности (4.1), заштрихованная область (площадь под графиком функции плотности на интервале ,x0 ) соответствует значению функции

распределения в точке x0 , т. е. F x0 .

По определению плотности, она существует только у абсолютно непрерывного распределения, а у дискретного нет. Стоит отметить распространенное заблуждение – «плотность существует только у дифференцируемых F x ». У всех дискретных с.в., которые мы упо-

минали, функции распределения дифференцируемы, существует производная, которая равна нулю. Поэтому производная есть, но плотности нет.

34

Глава 4. Случайные величины

F x

1

F x0

x0

x

f x

x0

x

Рис. 4.2. Функция распределения F x и плотность

f x абсолютно непрерывного распределения

У дискретных случайных величин аналогом плотности является таблица распределе-

ния.

4.2.2. Равномерное распределение

Рассмотрим случайную величину, равномерно распределенную на отрезке a,b . При-

мером случайного эксперимента, дающего такую случайную величину, является бросание точки на отрезок. Главным свойством такой случайной величины является то, что вероятность попадания в точку равномерно «размазана» по всему отрезку. Вероятность попадания точки в область не зависит от расположения этой области на отрезке, а только от его размера. Интуитивно можно заключить, что плотность распределения такой с.в. одинакова во всех точках, в которых эта плотность не равна нулю.

Вероятности событий F x P x для случаев x a и x b равны, соответствен-

но 0 и 1. Это является следствием того, что координата точки лежит в отрезке a,b и первое

событие является невозможным, а второе достоверным. Вероятность для интервала a x b

определяется по формуле геометрической вероятности и равна x a . b a

Функция распределения с.в. , имеющей равномерное распределение на отрезке a,b

выглядит следующим образом (см. рис. 4.3):

 

 

0,если x a

 

 

 

 

 

 

 

 

x a

 

 

 

 

F x

 

 

,если a x b.

 

 

 

 

 

 

 

 

b a

 

 

 

 

1,если x b

 

 

 

 

 

 

Плотность распределения с.в. найдем, взяв производную функции распределения

(см. рис. 4.3). Теперь можно определить равномерную с.в., на основании плотности.

 

Случайная величина

имеет равномерное распределение на отрезке a,b ,

Ua,b ,

если плотность распределения

постоянна на отрезке a,b и равна нулю вне его:

 

 

 

1

,если x a,b

 

 

 

 

 

 

 

 

 

 

 

 

 

f x b a

.

 

0,если x a,b

35

Теория вероятностей

Замечание. Равномерное распределение в литературе имеет еще одно название – прямоугольное распределение. Очевидно, что это следствие постоянства плотности.

Случайная величина , получаемая преобразованием с.в. Ua,b

,

a

имеет равномер-

 

ное распределение на интервале 0,1 :

 

 

 

b a

 

 

 

 

 

1,если x 0,1

 

 

 

f x 0,если x

 

0,1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F x

1

F x0

f x

a

x0

b

x

1

b a

a

x0

b

x

Рис. 4.3. Функция распределения и плотность распределения Ua,b

В параграфе, посвященном преобразованиям случайных величин, будет в общем виде показано, как преобразование случайной величины меняет ее характеристики.

4.2.3. Показательное распределение

Это распределение времени до прихода первого посетителя, начиная с заданного момента, времени отказа прибора и т.п. Похожая случайная величина возникала при анализе пуассоновского потока событий.

В рамках задачи о простейшем потоке событий предположим, что в единицу времени происходит в среднем успехов в большом количестве испытаний (число посетителей, число отказов аппаратуры и т.п.). Тогда за промежуток времени длины x происходит x успешных испытаний. Соответственно, вероятность того, что за промежуток времени x в испытаниях не будет ни одного успеха, равна P 0 e x .

Обозначим за с.в. время до наступления первого успеха. Тогда событие {за проме-

жуток времени x не было ни одного успеха} совпадает с событием x . В соответствии с этим:

P x 1 P x 1 e x .

Таким образом, функция распределения с.в.

равна:

 

x

,если x 0

1 e

 

F x

 

.

0,если x 0

Соответственно плотность распределения с.в. равна:

36

Глава 4. Случайные величины

 

 

x

,если x 0

 

e

 

 

f x

 

.

 

0,если x 0

F x

 

 

 

1

 

 

 

F x0

 

 

 

f x

x0

 

x

 

 

 

 

x0

x

Рис. 4.4. Функция распределения и плотность распределения E

Случайная величина, имеющая показательное распределение, обозначается E . Гра-

фик функции распределения и плотности распределения показательной с.в. представлен на рис. 4.4.

Замечание. Альтернативное название показательного распределения – экспоненциальное, что связано с наличием экспоненты.

Показательное распределение единственное из абсолютно непрерывных обладает свойством «нестарения»:

P x y x P y .

В этом оно аналогично геометрическому, поэтому его называют непрерывным аналогом геометрического распределения.

4.2.4. Нормальное распределение

Случайная величина имеет нормальное (гауссово) распределение с параметрами

a R и 0 , Na, 2 , если плотность распределения выглядит следующим образом:

f x

1 e

 

x a 2

2 2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 2

 

 

Из всех перечисленных в этом параграфе распределений нормальное распределение будет наиболее часто упоминаться в дальнейшем и не только в курсе теории вероятностей, но и математической статистики и далее – в эконометрии и пр.

Плотность нормального распределения имеет куполообразную форму, см. рис. 4.5. В отличие от прочих распределений функция распределения нормального распределения не выражается через элементарные, т.к. не имеет первообразной. Поэтому записывается только в виде определенного интеграла:

x

1

 

 

t a 2

 

F x

 

 

 

 

 

 

 

 

e 2

2 dt .

(4.2)

 

 

 

2 2

 

 

 

 

 

 

 

Интеграл (4.2) имеет особое обозначение a, 2 x .

37

Теория вероятностей

F x

1

F x0

f x

x0

x

1

2 2

x0

a

x

Рис. 4.5. Функция распределения и плотность распределения Na, 2

Если случайная величина распределена по закону N0,1, то она называется стандарти-

зованной нормальной случайной величиной, а распределение – стандартным нормальным. Функция распределения стандартного нормального распределения обозначается:

 

x

 

1

x

 

t2

 

0,1

 

 

e 2 dt .

 

 

 

2

 

 

 

 

 

 

Отсутствие первообразной, выраженной через элементарные функции означает, что в аналитическом виде интеграл (4.2) не представим в элементарных функциях. В этом случае можно считают интеграл численно как площадь под графиком функции плотности и табулируют.

Естественно, что для каждой случайной величины (с произвольными параметрами a и2 ) рассчитывать численно функцию a, 2 x было бы излишне, поэтому табулирована

только функция 0,1 x и существует механизм перехода к функции a, 2 x .

Из-за широкой распространенности распределения существует несколько обозначений этого интеграла. Основные это: 0,1 x 1 0,1 x и функция Лапласа, определяемая

0,1 x 0,1 x 0,5. Функция Лапласа нечетна: 0,1( x) 0,1 x .

Свойства плотности распределения с.в.

x a

 

 

 

 

 

 

 

 

 

 

 

1) a, 2 x 0,1

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

1

 

 

 

t a 2

 

 

 

a, 2 x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e

2 2 dt .

(4.3)

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

 

t a

 

 

Проведем замену переменных в интеграле (4.3): y

. Тогда t a y, соответст-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

венно dt dy . Пределы интегрирование изменятся следующим образом:

 

 

 

t x

 

 

 

x a

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

.

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

После замены переменных интеграл (4.3) будет выглядеть:

38

Глава 4. Случайные величины

 

 

x a

 

 

 

 

 

y2

 

x a

 

 

 

 

 

y2

 

 

 

 

 

 

 

1

 

 

 

 

 

1

 

 

 

 

x a

 

2 x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e

 

2 dy

 

 

 

 

 

e

 

2 dy 0,1

 

 

.▄

 

 

 

 

 

 

 

2 2

2

a,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2) Если с.в. имеет стандартное нормальное распределение, а с.в.

получена преобразова-

нием a , где 0, то Na, 2 .

Докажем это свойство, получив функцию распределения с.в. , зная функцию распре-

деления с.в. и использованное преобразование.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F x P x P a x

P

x a

 

 

 

 

 

x a

.

 

 

 

 

0,1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Последнее равенство по свойству 1) означает, что F x a, 2

x , т.е. Na, 2 .▄

3) Если Na, 2 , то верны следующие соотношения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

a

 

 

 

 

x a

P x1 x2 a, 2 x2 a, 2 x1

0,1

 

 

2

 

 

 

 

0,1

1

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4) Симметричность функции плотности N0,1 : 0,1 x 1 0,1 x .

 

 

 

 

 

 

 

 

 

x

1

 

 

 

 

t2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,1 x

 

 

 

 

 

e

 

2 dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

x

 

 

1

 

 

 

 

t

2

 

 

 

1

 

 

 

t

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 0,1 x

1

 

 

 

 

 

 

 

e

 

2 dt

 

 

 

 

e

2 dt

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

проведя замену переменных y t во втором интеграле, в точности получим первый. ■ Графически симметричность изображена на рис. 4.6.

f t

x

x

t

Рис. 4.6. Симметричность плотность распределения N0,1

Очевидное следствие симметричности плотности: 0,1 0 0,5.

5) Если с.в. имеет стандартное нормальное распределение, то

P

 

x =P x x

0,1 x 0,1 x 1 2 0,1 x 2 0,1 x 1.

6) Правило «трех сигм». Если Na, 2

, то P

 

a

 

3 0,0027 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P

a

3 1 P

a

3 1 P

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 1 2 0,1 3 2 0,1 3 2 0,00135 0,0027.

39

Теория вероятностей

fa, 2 x

0,9973

a 3

a

a 3

x

Рис. 4.7. Геометрическая интерпретация правила «трех сигм»

 

Значение площади 0,9973 означает, что почти все распределение сконцентрировано в

границах a 3 , a 3 , а вероятность с.в.

 

попасть за эти границы достаточно мала и

равна 0,0027, см. рис. 4.7.

 

 

 

Для сравнения можно рассчитать следующие вероятности: 5

P a 3 0,9973

P a 2 0,9545.

P a 1 0,6827

Как видно, в границах «трех сигм» от a стандартная нормальная случайная величина принимает 99,73% всех своих значений.

4.2.5. Гамма-распределение

Случайная величина имеет гамма-распределение, , с параметрами , 0,

если ее плотность выглядит следующим образом:

 

 

 

x 1e x, если x 0

 

 

 

 

 

f x

.

0,иначе

Гамма-функция определяется:

 

 

x 1e xdx.

(4.4)

0

 

Из курса математического анализа известно, что первообразная интегралов (4.4) находится с помощью метода интегрирования по частям. Интегрирование данного интеграла приводит к следующему равенству 1 1 .

Очевидно, что для целых выполняется равенство 1 !. Интерес представ-

1

ляет еще одно значение: .

2

Как и в случае нормального распределения, функция гамма-распределения в явном виде не выражается через элементарные функции, но записывается через соответствующий интеграл:

F x

 

x

 

 

t 1e tdt .

(4.5)

 

 

 

 

5 Вероятности стандартного нормального распределения находятся по таблице распределения.

40