Введение в многомерный статистический анализ / page14-58 / ander2_2_1
.doc(45)
положителен. Поэтому (для невырожденных распределений, см. § 2.4).
В качестве особого случая изложенной теории мы рассмотрим двумерное нормальное распределение. Среднее значение вектора равно
(47)
ковариационная матрица может быть записана следующим образом:
(48)
где является дисперсией Х1 ,— дисперсией Х2 и — коэффициентом корреляции между Х1 и Х2 . Легко проверить, что обращение (48) есть
(49)
Плотность вероятности Х1 и Х2 равна
. (50)
Ниже будет показано, что если = 0, то Х1 и Х2 независимы; если > 0, то между Х1 и Х2 существует положительная связь; и если < 0, то между Х1 и Х2 — отрицательная связь.
Отметим, что плотность вероятности (43) в р-мерном евклидовом пространстве постоянна на эллипсоидах
(51)
для каждого положительного значения с. Центром каждого эллипсоида является точка. Форма и положение эллипсоида определяются значением, а размеры (при фиксированном )— значением с.
Рассмотрим подробно двумерный случай плотности вероятности (50). Преобразуем координаты посредством равенства (i = 1, 2) так, чтобы центры линий, на которых плотность распределения постоянна, находились в начале координат. Эти линии определяются уравнениями
(52)
Отрезки, отсекаемые на осях у1 и у2, равны между собой. Если > 0, то большая ось эллипса наклонена под углом 45° к оси х и ее длина равна, а длина малой оси равна . Если < 0, то большая ось эллипса наклонена под углом 135° к оси х и ее длина равна , а длина малой оси равна .В рассматриваемом случае мы можем считать, что плотность распределения графически изображается поверхностью над плоскостью. Контуры равных плотностей аналогичны контурам равных высот на топографической карте; они показывают форму «холма» (или вероятностной поверхности). Если > О, то эта поверхность простирается вдоль линии с положительным наклоном; большая часть «холма» в этом случае находится в первом и третьем квадратах. При обратном переходе к координатам мы растягиваем каждый контур, в раз в направлении i-й оси и переносим центр в точку
Численные значения функции распределения одномерной нормальной случайной величины могут быть получены из таблиц, приводимых в большинстве учебников по статистике. Численные значения для
(53)
где и можно найти у Пирсона [2], [3]. Пирсон также показал, что
(54)
где так называемые четырехклеточные (тетрахорические) функции табулированы у Пирсона [2], [3] до Кэндалл [2] показал, что выражение (54) может быть распространено на F(x1 ,..., хn).
2.4. Распределение линейной комбинации нормально
распределенных величин; независимость величин;
частные распределения
Одной из причин изучения многомерных нормальных распределений является то, что частные и условные распределения, полученные из многомерных нормальных распределений также нормальны. Более того, линейные комбинации нормально распределенных величин также распределены нормально. Сперва мы покажем, что в результате невырожденного линейного преобразования вектора, совместное распределение компонент которого нормально, мы получаем вектор, совместное распределение компонент которого также нормально.
Теорема 2.4.1. Пусть р-мерный вектор X распределен .
Тогда
Y = CX . (1)
распределен для невырожденных С.
Доказательство. Плотность распределения Y получается из плотности распределения X путем замены х на у такое, что
(2)
и умножением на определитель преобразования (2), который равен Этот определитель можно представить в виде
(3)
Квадратичная форма в показателе плотности есть
(4) Преобразование (2) переводит Q в
(5)
так как согласно свойству транспонированных матриц, и СС -1 = I . Таким образом, плотность распределения вероятностей Y будет
Теорема доказана.
Х1, ..., Xq и Хq+1, ..., Xр, заданные в виде векторов
(7)
Эти случайные величины образуют случайный вектор
(8)
Предположим теперь, что р величин имеют совместное нормальное распределение со средними значениями
(9) и ковариациями
(10)
(11)
(12)
Мы говорим, что случайный вектор X был расчленен в (8) на подвекторы так, что вектор
(13)
был расчленен подобным же образом на подвекторы и что матрица
(14)
была таким же образом расчленена на подматрицы
Покажем, что X (1) и X(2) независимы и нормально распределены. Обратная к матрица
(15)
Таким образом, квадратичная форма в показателе плотности есть
где
(17)
Отметим также, что Плотность распределения X может быть записана следующим образом:
(18)
Частная плотность распределения X (1) дается в виде интеграла
Таким образом, частное распределение Х(1) будет ; точно так же частное распределение X (2) будет .Значит, совместная плотность распределения Х1 , ...., Xp является произведением плотности частного распределения
Х1,…, Xq и плотности частного распределенияХq+1, ..., Xр,, поэтому оба множества величин независимы. Если мы имеем некоторое подмножество множества случайных величин, то мы всегда так можем перенумеровать эти величины, что данное подмножество образует Х(1). Этим доказывается достаточность условия следующей теоремы.
Теорема 2.4.2. Если совместное распределение величин Xl ,…, Хр нормально, то необходимым и достаточным условием того, что некоторое подмножество этих величин не зависит от подмножества, состоящего из остальных величин, является равенство нулю всех ковариаций величин одного подмножества и величин другого.
Необходимость следует из того факта, что если Xi из одного подмножества, а Xj из другого, то для любой плотности распределения вероятности (см. § 2.2.3)
Так как и (мы молчаливо предполагаем, что невырожденная), то условие эквивалентно тому, что . Таким образом, если одно множество величин некоррелировано с остальными величинами, то оба множества являются независимыми. Следует подчеркнуть, что заключение о независимости величин при равенстве нулю их корреляции делается в предположении, что эти величины нормально распределены, но обратное утверждение всегда верно.
Рассмотрим случай двумерного нормального распределения. Тогда Х(1) = Х1 , Х(2) = Х2,,
и
Поэтому если X1 и Х2 имеют двумерное нормальное распределение, то они независимы тогда и только тогда, когда они некоррелированы. Если они некоррелированы, то частное распределение Xi нормально с математическим ожиданием и дисперсией Приведенное выше рассуждение доказывает также следующее следствие.
Следствие 2.4.1. Если X распределен и если некоторое множество компонент X некоррелировано с другими, компонентами, то частное распределение этого множества является многомерным нормальным распределением со средними значениями, дисперсиями и ковариациями, определяемыми из соответствующих компоненти .
Теперь покажем, что это следствие справедливо также, если два множества не являются независимыми. Мы расчленили как и раньше. Произведем невырожденное линейное преобразование подвекторов
(21) (22)
где Т выбирается так, чтобы компоненты Y(1) были некоррелированы с компонентами
У(2) =Х{2). Матрица Т должна удовлетворять уравнению
(23)
Таким образом, и
(24)
Вектор
(25)