Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Учебное пособие мат. статистика+контрольные работы

.pdf
Скачиваний:
11
Добавлен:
30.11.2016
Размер:
811.62 Кб
Скачать

Между функцией и плотностью распределения непрерывной двумерной случайной величины существует простая связь:

f(x; y) = @2F (x; y); @x@y

Zx Zy

F (x; y) =

f(x; y) dx dy:

¡1 ¡1

МАРГИНАЛЬНЫЕ РАСПРЕДЕЛЕНИЯ

Маргинальным называется распределение части координат случайного вектора. Для двумерной случайной величины (X; Y ) существуют две маргинальные функции распределения:

Fx(x) = F (x; 1) и Fy(y) = F (1; y);

и две маргинальные плотности распределения:

fx(x) =

Z¡1 f(x; y) dy

и fy(y) =

Z¡1 f(x; y) dx:

 

1

 

1

УСЛОВНЫЕ РАСПРЕДЕЛЕНИЯ

Подобно тому, как для случайных событий вводились понятия условных вероятностей, для случайных величин могут использоваться условные распределения. Условные распределения в случае непрерывных случайных величин получаются с помощью формул:

j

 

f(x; y)

 

 

f(x; y)

 

 

 

 

 

 

 

 

 

 

f(xx; y)

 

R¡1 f(x; y) dy

 

f(y

x) =

f (x)

=

 

1

 

;

f(xjy) =

 

=

f(x; y)

:

 

 

fy(y)

R¡11 f(x; y) dx

ЧИСЛОВЫЕ ХАРАКТЕРИСТИКИ СЛУЧАЙНЫХ ВЕЛИЧИН

21

В практических задачах случайные величины характеризуются некоторыми числовыми характеристиками, представляющими так называемые моментные характеристики.

Все они основаны на понятии математического ожидания. Математическое ожидание дискретной случайной величины X вы-

числяется по формуле

Xn

mx = MX = xip(xi);

i=1

а непрерывной случайной величины:

Z 1

mx = MX = xf(x) dx:

¡1

В этих формулах используется операторное обозначение математического ожидания MX. Буква M (или E) перед случайной величиной указывает, что случайная величина подвергается операции вычисления математического ожидания.

Общая формула для вычисления функции '(X) от случайной вели-

чины X имеет вид:

Xn

M'(X) = '(xi)p(xi);

i=1

в дискретном случае, и

Z 1

M'(X) = '(x)f(x) dx

¡1

в непрерывном.

Эта же формула принимается, как определение, и в многомерном случае, если сумму или интеграл брать, соответственно, многомерными.

МОМЕНТНЫЕ ХАРАКТЕРИСТИКИ

Начальным моментом порядка k случайной величины X называется

число

ºk = MXk:

Особое значение имеет начальный момент первого порядка, который называется математическим ожиданием: mx = º1.

Центральным моментом порядка k случайной величины X называет-

ся число

¹k = M(X ¡ º1)k = M(X ¡ mx)k:

22

Особое значение имеет центральный момент второго порядка, который называется дисперсией

DX = M(X ¡ mx)2:

В последней форме используется операторное обозначение операции вычисления дисперсии: DX. Также часто используется обозначение дисперсии DX=¾2, где корень квадратный из дисперсии называется среднеквадратичным или стандартным отклонением ¾.

Моментные характеристики также определяются в случае многомерных случайных величин. Так для q-мерной случайной величины начальный момент порядка k определяется формулой

ºk1:::kq = MX1k1 : : : Xqkq ;

где k = k1+k2+ : : : +kq, а центральный момент порядка k – формулой

¹k1:::kq = M[(X1¡mx1 )k1 : : : (Xq¡mxq )kq ]:

У случайного вектора размерности q есть q математических ожиданий, которые обычно представляются как вектор математических ожи-

даний и

q2¡q

центральных моментов 2-го порядка, которые записывают-

2

ся

в

виде

квадратной

матрицы

§ = (¾ij), где ¾ij=M[(xi¡mxi )(xj¡mxj )]. Матрица § называется ковариационной или корреляционной матрицей.

Коэффициенты ковариационной матрицы, находящиеся на главной диагонали, представляют дисперсии составляющих случайного вектора. Коэффициенты, не находящиеся на главной диагонали, представляют смешанные моменты второго порядка

¾ij=M[(Xi¡mxi )(Xj¡mxj )]. Они используются для расч¸та коэффициентов корреляции , которые применяются в качестве меры зависимости случайных величин. Коэффициент корреляции rij составляющих Xi и Xj случайного вектора X определяется по формуле

rij = p¾¾ij ¾ : p

ii jj

Коэффициент корреляции принимает значения между ¡1 и 1. Если случайные величины независимы, коэффициент корреляции равен нулю, если случайные величины линейно связаны, коэффициент корреляции равен единице или минус единице. На практике считают, что большое по модулю значение коэффициента корреляции свидетельствует о сильной зависимости между случайными величинами (в действительности, это свидетельствует о сильной линейной составляющей зависимости).

23

НОРМАЛЬНОЕ И СВЯЗАННЫЕ С НИМ РАСПРЕДЕЛЕНИЯ

Одномерное нормальное распределение

В реальных ситуациях наиболее часто применяется нормальное (или гауссово ) распределение. Оно зависит от двух параметров ¹ и ¾. Случайная величина » имеет нормальное распределение, если е¸ плотность распределения равна

 

1

 

 

¡

(x ¡ ¹)2

 

 

 

 

 

2¾2

 

 

f(x) = p

 

exp

:

(2)

2¼¾

 

 

 

Параметр ¹ представляет математическое ожидание, параметр ¾ среднеквадратичное (или стандартное ) отклонение. Среднеквадратичное отклонение равно корню квадратному из дисперсии. Именно по этой причине дисперсия часто обозначается как ¾2.

Случайную величину, распределенную по нормальному закону с параметрами ¹ и ¾ часто обозначают N(¹; ¾).

При ¹ = 0 и ¾ = 1 получается стандартное нормальное распределение N(0; 1).

Нормальная плотность распределения представляет колоколообразную кривую, симметрично расположенную относительно значения x, равного математическому ожиданию ¹, с быстро приближающимися к оси x “хвостами”.

Как видно из формулы плотности нормального распределения, нормально распределенная случайная величина теоретически может принимать любые числовые значения от ¡1 до +1. Но практически, отклонения значений случайной величины от математического ожидания ¹, превышающие утроенное среднеквадратичное отклонение очень мало вероятны (так называемое правило трех сигм):

P (j» ¡ ¹j > 3¾) ¼ 0; 0027 ¼ 0:

Вероятность попадания значений нормально распредел¸нной случай-

ной величины в заданный интервал вычисляется по формуле

 

µ

¾

¡

µ

¾

 

P (a < » < b) = ©

 

b ¡ ¹

 

©

a ¡ ¹

;

(3)

 

 

 

 

где

 

 

 

e¡ 2

dt:

 

 

 

©(x) = p2¼ Z0

 

 

 

1

x

 

 

 

 

 

 

t2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

24

Таблица значений функции ©(x) дана в ПРИЛОЖЕНИИ 1. При пользовании таблицей надо учесть, что в ней содержатся только положительные значения аргумента x, а значения ©(x) для отрицательных значений

xопределяются по правилу ©(¡x) = ¡©(x). Кроме того, если аргумент

xбольше имеющегося в таблице (x > 5), надо принимать ©(x) = 0; 5.

Например, надо определить вероятность того, что нормально распредел¸н- ная случайная величина X с математическим ожиданием, равным 2 и среднеквадратичным отклонением, равным 0,5, находится в интервале между единицей и пятью: (1 < X < 5).

По формуле (3) получаем

µ ¶ µ ¶

P (1 < X < 5) = © 5 ¡ 2 ¡ © 1 ¡ 2 = © (6) ¡ © (¡2) : 0; 5 0; 5

Обращаясь к таблице, находим ©(¡2)=¡0; 4772, ©(6)=0; 5, поэтому P (1<X<5)=0; 9772.

Важность рассмотрения нормального закона объясняется тем, что нормальный закон распределения является одним из так называемых предельных законов теории вероятностей.

Математические законы теории вероятностей получены абстрагированием реально наблюдаемых статистических закономерностей, свойственных массовым случайным явлениям: в природе наблюдается устойчивость массовых случайных явлений. Именно такая устойчивость позволяет предсказывать средние результаты массовых случайных явлений.

Теоретически это свойство массовых случайных явлений формулируется в терминах так называемых предельных теорем теории вероятностей. Предельные теоремы позволяют не только прогнозировать результаты случайных явлений, но и оценивать точность этих прогнозов.

Касательно законов распределения, возникающих в массовых случайных явлениях доказан ряд так называемых центральных предельных теорем теории вероятностей. Все формы центральной предельной теоремы определяют условия, при которых возникает нормальный закон распределения. Так как эти условия на практике весьма часто выполняются, нормальный закон распределения является самым распростран¸нным, наиболее часто встречающимся в природных явлениях. Он возникает во всех случаях, когда исследуемая случайная величина может быть представлена в форме суммы независимых (или слабо зависимых) случайных слагаемых, когда ни одно из слагаемых не является доминирующим (то есть каждое из слагаемых в отдельности весьма слабо влияет на сумму).

Например, из статистических данных известно, что параметры человека: рост, вес, продолжительность жизни и так далее, как случайные

25

величины, относящиеся к большому количеству индивидуумов, подчиняются нормальным распределениям. Объяснение этому простое: отдельные характеристики индивидуума, как реализации случайной величины, являются результатом влияния многих факторов: генетики, местности, где индивидуум жив¸т, болезней, которыми переболел, занимается ли спортом, как питался в детстве и т.д. Все эти факторы, “складываясь”, приводят к тому, что при статистической обработке получаются законы распределения, близкие к нормальным.

Практически, целесообразно пользоваться следующим эмпирическим правилом:

Если нет веских оснований считать обратное, принимайте, что интересующая вас случайная величина подчиняется нормальному закону распределения.

Под веским основанием понимается то, что из исследования изучаемого явления вытекают какие-то особенности распределения, не позволяющие считать его нормальным. Например, при округлении положительных чисел возникает случайная ошибка, величина которой меняется между нулем и последним оставшимся разрядом, причем естественно считать что вероятности любых значений в этом интервале одинаковы (равномерное распределение). Или, ещ¸ один пример, если интересующая случайная величина равна квадрату нормально распределенной, то можно сразу сказать, что е¸ закон распределения отличен от нормального.

Многомерное нормальное распределение

Случайный вектор » = (»1; : : : ; »n) (набор из n случайных величин) называется невырожденным нормальным (гауссовским) случайным вектором , если его многомерная плотность распределения задается формулой

f(x) = f(x1; : : : ; xn) =

 

 

 

 

1

exp µ¡

1

(x ¡ ¹)T §¡1(x ¡ ¹

(4)

=

 

 

:

(2¼)n=2j§j1=2

2

Здесь вектор ¹ представляет вектор математических ожиданий случайного вектора », а невырожденная, положительно определенная матрица § – это ковариационная или корреляционная матрица вектора »:

01

¾11

: : :

¾1n

§ = @B¾n1

¢ ¢...¢

¾nnAC:

26

Коэффициенты матрицы § представляют центральные моменты второго порядка:

¾ij = E(»i ¡ ¹i)(»j ¡ ¹j):

На главной диагонали расположены дисперсии отдельных составляющих вектора », а вне главной диагонали находятся смешанные центральные моменты второго порядка различных составляющих вектора ». Смешанные моменты, по определению, равны произведению соответствующего коэффициента корреляции на среднеквадратичные значения случайных величин: ¾ij = p¾iip¾jjrij;

где rij – коэффициент корреляции i-той и j-той составляющих вектора

».

Многомерное нормальное распределение полностью задается вектором математических ожиданий и ковариационной матрицей. Поэтому зная, что распределение нормальное, можно ограничиться определением математического ожидания и ковариационной матрицы и не выписывать формулу для плотности вероятностей.

Условие невырожденности матрицы § не обязательно для нормального распределения. Оно необходимо только для существования плотности распределения. Если матрица § вырождена, часть составляющих вектора » являются линейными функциями остальных и плотность распределения определена только для независимых составляющих вектора

».

Для многомерного нормального распределения также доказывается центральная предельная теорема. Поэтому, при рассмотрении практических задач, в которых фигурируют многомерные случайные величины, если нет веских оснований предполагать противоположное, можно считать, что случайный вектор (несколько случайных величин) имеет нормальное распределение.

Формально все доказательства проводятся совершенно одинаково, как для одномерных, так и и для многомерных случайных величин. Некоторые свойства встречаются при рассмотрении многомерных случайных величин, но, поскольку конкретные результаты , связанные с определением вероятности нахождения случайной величины в заданном интервале, интересны только для одномерной случайной величины, выше был описан способ определения этой вероятности именно для одномерной.

В отдельных практических задачах, например, в задаче определения вероятности поражения цели при стрельбе, когда поражение происходит при попадании двумерной случайной величины в заданную область (проекцию цели на картинную плоскость, где картинная плоскость – это

27

плоскость в которой видно изображение цели), разработаны специальные способы расчета такой вероятности, однако в экономических приложениях задачи, в которых возникает необходимость расчета вероятности попадания нормально распределенной случайной величины в заданную многомерную область нам неизвестны.

Одним из важнейших свойств нормально распределенных случайных величин является их инвариантность при линейных преобразованиях. Это свойство является, впрочем, следствием центральной предельной теоремы, но может быть доказано и независимо, применением общих формул расчета законов распределения функций от случайных величин к линейным функциям.

Оно заключается в следующем. Если векторная случайная величина ´ является линейной функцией от нормально распределенной случайной величины »:

´ = A»;

где A – оператор линейного преобразования, то ´ имеет нормальное распределение с математическим ожиданием и ковариационной матрицей равными

¹´ = »: §´ = AT §»A:

(5)

Формулы (5) показывают, что математическое ожидание ¹´ получается из ¹» по той же формуле, что и ´ получается из ».

Для получения ковариационной матрицы §´ надо матрицу §» умножить слева на транспонированную матрицу преобразования, а справа

– на матрицу преобразования.

Применяя это свойство, можно существенно упростить все расчеты с нормально распределенными случайными величинами. Вместо того, чтобы применять общие формулы для вычисления распределений функций от случайных величин, можно использовать формулы для вычисления моментов первого и второго порядка (вектора математических ожиданий и ковариационной матрицы), подсчитав которые, можно определить результирующий нормальный закон распределения, по которому вычисляются соответствующие вероятности.

Очень часто на практике возникает необходимость вычисления математического ожидания и дисперсии случайной величины, являющейся линейной функцией нормально распределенных случайных величин. В этом случае можно поступить ещ¸ проще, чем использовать формулы

(5) и аппарат векторно-матричной алгебры.

Покажем это на примере линейной комбинации двух случайных величин.

28

Пусть ´ = 1+2, где »1 и »2 – нормально распределенные случайные величины с математическими ожиданиями ¹»1 и ¹»2 , среднеквадратичными отклонениями ¾»1 и ¾»2 и коэффициентом корреляции r. Смешанный центральный момент случайных величин »1 и »2 равен ¾»1»2 = »1 ¾»2 .

Имеем:

´ = 1 + 2:

Применяя к этому равенству операцию вычисления математического ожидания, получаем

¹´ = »1 + »2 :

Вычитая это равенство из предыдущего, получаем равенство относительно централизованных случайных величин (централизованная случайная величина получается из исходной вычитанием математического ожидания):

´ ¡ ¹´ = a(»1 ¡ ¹»1 ) + b(»2 ¡ ¹»2 ):

Возводя левую и правую части этого равенства в квадрат и применяя к полученному соотношению операцию вычисления математического ожидания, находим выражение для дисперсии ¾´2:

¾´2 = a2¾»21 + 2ab r¾»1 ¾»2 + b2¾»22 :

В качестве примера рассмотрим следующую задачу. Пусть рост человека подчиняется нормальному распределению с математическим ожиданием ¹ = 175 см и среднеквадратичным отклонением ¾ = 10 см. Человек носит каблуки, высота которых подчиняется нормальному распределению с математическим ожиданием ¹ = 2см и среднеквадратичным отклонением ¾ = 1 см. Притолока двери равна 2 м (200 см). Какова вероятность того, что входящий в помещение человек толкнется лбом о притолоку? Очевидно, это произойдет в том случае, если высота человека в обуви на каблуках превысит 200 см.

Между случайными величинами

рост,

высота каблука и

H – высота человека в обуви существует соотношение

H = + :

Вначале рассмотрим не совсем практически обоснованную ситуацию, когда

Pи K независимы.

Вэтом случае математическое ожидание высоты индивидуума в обуви равно сумме его роста и высоты каблуков: 175+2=177 см.

29

Дисперсия величины H равна сумме дисперсий слагаемых и :

¾H2 = ¾2 + ¾2 = 102 + 12 = 101cм2:

Вероятность не стукнуться о притолоку равна

P (H < 200) = P (¡1 < H < 200) =

 

¡1 ¡ 177

 

= ©

200 ¡ 177

 

©

=

µ

p

 

 

¡

µ

p

 

 

101

101

=©(2; 28) ¡ ©(¡1) = 0; 48 + 0; 5 = 0; 98:

Сматематической точки зрения полученное решение является правильным. Но с точки исследуемого явления полученная вероятность является заниженной, поскольку не учитывается тот факт, что случайные величины и являются зависимыми. Действительно, высокие люди предпочитают носить низкие каблуки, и наоборот.

Предположим, что коэффициент корреляции между ростом человека и высотой каблуков его обуви равен -0,8 (высокий человек предпочитает низкие каблуки, низкий – высокие, поэтому корреляция отрицательна). В этом случае момент второго порядка между величинами и равен ¡0; 8 ¢ 10 ¢ 1 = ¡8.

Теперь дисперсия должна вычисляться с учетом коэффициента корреля-

ции:

¾H2 = ¾2 ¡ 2r ¾¾ + ¾2 = 102 ¡ 2 ¢ 0; 8 ¢ 10 ¢ 1 + 12 = 85см2

Откуда, вероятность не столкнуться с притолокой равна:

P (H < 200) = P (¡1 < H < 200) =

 

¡1 ¡ 177

 

= ©

200 ¡ 177

 

©

=

µ

p

 

 

¡

µ

p

 

 

85

85

=©(2; 49) ¡ ©(¡1) = 0; 493 + 0; 5 = 0; 993:

Сучетом корреляции между ростом и длиной каблука вероятность не столкнуться с притолокой получилась большей, как и следовало ожидать, но увеличилась не сильно, поскольку длина каблука всегда небольшая (в рассматриваемом примере она не превышает ¹ + 3¾ = 2 + 3 = 5см).

Некоторые специальные распределения, связанные с нормальным

Применяемые при анализе точности оценивания формулы зависят от трех распределений, связанных с нормальным распределением: хиквадрат, Стьюдента и Фишера.

30