Добавил:

Studfiles2 Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"

Предмет:

Анализ и интерпретация данных

Файл:

ander2_2_1

.doc

Скачиваний:

Добавлен:

01.05.2014

Размер:

1.06 Mб

Скачать

☆

(45)

(46)

положителен. Поэтому (для невырожденных распределений, см. § 2.4).

В качестве особого случая изложенной теории мы рассмотрим двумерное нормальное распределение. Среднее значение вектора равно

(47)

ковариационная матрица может быть записана следующим образом:

(48)

где является дисперсией Х₁,— дисперсией Х₂ и — коэффициентом корреляции между Х₁и Х₂ . Легко проверить, что обращение (48) есть

(49)

Плотность вероятности Х₁ и Х₂ равна

. (50)

Ниже будет показано, что если = 0, то Х₁ и Х₂ независимы; если > 0, то между Х₁ и Х₂ существует положительная связь; и если < 0, то между Х₁ и Х₂ — отрицательная связь.

Отметим, что плотность вероятности (43) в р-мерном евклидовом пространстве постоянна на эллипсоидах

(51)

для каждого положительного значения с. Центром каждого эллипсоида является точка. Форма и положение эллипсоида определяются значением, а размеры (при фиксированном )— значением с.

Рассмотрим подробно двумерный случай плотности вероятности (50). Преобразуем координаты посредством равенства (i = 1, 2) так, чтобы центры линий, на которых плотность распределения постоянна, находились в начале координат. Эти линии определяются уравнениями

(52)

Отрезки, отсекаемые на осях у₁ и у₂, равны между собой. Если > 0, то большая ось эллипса наклонена под углом 45° к оси х и ее длина равна, а длина малой оси равна . Если < 0, то большая ось эллипса наклонена под углом 135° к оси х и ее длина равна , а длина малой оси равна .В рассматриваемом случае мы можем считать, что плотность распределения графически изображается поверхностью над плоскостью. Контуры равных плотностей аналогичны контурам равных высот на топографической карте; они показывают форму «холма» (или вероятностной поверхности). Если > О, то эта поверхность простирается вдоль линии с положительным наклоном; большая часть «холма» в этом случае находится в первом и третьем квадратах. При обратном переходе к координатам мы растягиваем каждый контур, в раз в направлении i-й оси и переносим центр в точку

Численные значения функции распределения одномерной нормальной случайной величины могут быть получены из таблиц, приводимых в большинстве учебников по статистике. Численные значения для

(53)

где и можно найти у Пирсона [2], [3]. Пирсон также показал, что

(54)

где так называемые четырехклеточные (тетрахорические) функции табулированы у Пирсона [2], [3] до Кэндалл [2] показал, что выражение (54) может быть распространено на F(x₁ ,..., х_n).

2.4. Распределение линейной комбинации нормально

распределенных величин; независимость величин;

частные распределения

Одной из причин изучения многомерных нормальных распределений является то, что частные и условные распределения, полученные из многомерных нормальных распределений также нормальны. Более того, линейные комбинации нормально распределенных величин также распределены нормально. Сперва мы покажем, что в результате невырожденного линейного преобразования вектора, совместное распределение компонент которого нормально, мы получаем вектор, совместное распределение компонент которого также нормально.

Теорема 2.4.1. Пусть р-мерный вектор X распределен .

Тогда

Y = CX . (1)

распределен для невырожденных С.

Доказательство. Плотность распределения Y получается из плотности распределения X путем замены х на у такое, что

(2)

и умножением на определитель преобразования (2), который равен Этот определитель можно представить в виде

(3)

Квадратичная форма в показателе плотности есть

(4) Преобразование (2) переводит Q в

(5)

так как согласно свойству транспонированных матриц, и СС ^-1 = I . Таким образом, плотность распределения вероятностей Y будет

Теорема доказана.

Пусть теперь рассматриваются два множества случайных величин

Х₁, ..., X_q и Х_q₊₁, ..., X_р, заданные в виде векторов

(7)

Эти случайные величины образуют случайный вектор

(8)

Предположим теперь, что р величин имеют совместное нормальное распределение со средними значениями

(9) и ковариациями

(10)

(11)

(12)

Мы говорим, что случайный вектор X был расчленен в (8) на подвекторы так, что вектор

(13)

был расчленен подобным же образом на подвекторы и что матрица

(14)

была таким же образом расчленена на подматрицы

Покажем, что X ⁽¹⁾ и X⁽²⁾ независимы и нормально распределены. Обратная к матрица

⁽¹⁵⁾

Таким образом, квадратичная форма в показателе плотности есть

где

(17)

Отметим также, что Плотность распределения X может быть записана следующим образом:

(18)

Частная плотность распределения X ⁽¹⁾ дается в виде интеграла

Таким образом, частное распределение Х⁽¹⁾ будет ; точно так же частное распределение X ⁽²⁾ будет .Значит, совместная плотность распределения Х₁, ...., X_pявляется произведением плотности частного распределения

Х₁,…, X_qи плотности частного распределенияХ_q₊₁, ..., X_р,, поэтому оба множества величин независимы. Если мы имеем некоторое подмножество множества случайных величин, то мы всегда так можем перенумеровать эти величины, что данное подмножество образует Х⁽¹⁾. Этим доказывается достаточность условия следующей теоремы.

Теорема 2.4.2. Если совместное распределение величин X_l,…, Х_р нормально, то необходимым и достаточным условием того, что некоторое подмножество этих величин не зависит от подмножества, состоящего из остальных величин, является равенство нулю всех ковариаций величин одного подмножества и величин другого.

Необходимость следует из того факта, что если X_i из одного подмножества, а X_j из другого, то для любой плотности распределения вероятности (см. § 2.2.3)

Так как и (мы молчаливо предполагаем, что невырожденная), то условие эквивалентно тому, что . Таким образом, если одно множество величин некоррелировано с остальными величинами, то оба множества являются независимыми. Следует подчеркнуть, что заключение о независимости величин при равенстве нулю их корреляции делается в предположении, что эти величины нормально распределены, но обратное утверждение всегда верно.

Рассмотрим случай двумерного нормального распределения. Тогда Х⁽¹⁾ = Х₁, Х⁽²⁾= Х₂,,

Поэтому если X₁ и Х₂ имеют двумерное нормальное распределение, то они независимы тогда и только тогда, когда они некоррелированы. Если они некоррелированы, то частное распределение X_i нормально с математическим ожиданием и дисперсией Приведенное выше рассуждение доказывает также следующее следствие.

Следствие 2.4.1. Если X распределен и если некоторое множество компонент X некоррелировано с другими, компонентами, то частное распределение этого множества является многомерным нормальным распределением со средними значениями, дисперсиями и ковариациями, определяемыми из соответствующих компоненти .

Теперь покажем, что это следствие справедливо также, если два множества не являются независимыми. Мы расчленили как и раньше. Произведем невырожденное линейное преобразование подвекторов

(21) (22)

где Т выбирается так, чтобы компоненты Y⁽¹⁾ были некоррелированы с компонентами

У⁽²⁾=Х^{2). Матрица Т должна удовлетворять уравнению

(23)

Таким образом, и

(24)

Вектор

(25)

Соседние файлы в папке page14-58

#
01.05.20141.23 Mб60ander2_1.doc
#
01.05.20141.06 Mб50ander2_2_1.doc
#
01.05.2014733.7 Кб52ander2_2_2.doc
#
01.05.20141.3 Mб50ander2_3.doc