- •Глава 3 оценка вектора среднего значения и ковариационной матрицы
- •3.1. Введение
- •3.2. Оценки наибольшего правдоподобиядля вектора среднего значения и ковариационной матрицы
- •74 75 3.3. Распределение вектора выборочного среднего; заключение о среднем значении, когда ковариационная матрица известна
- •§ 3.3. Р. Бозе [1], [2]; с. К. Бозе [1], [2]; Даш [1]; Крамер [21; Махаланобис [1], [2]; к. Пирсон [2], [4], [5]; у ил к с [2], [10], стр. 100—101, 103—105, 120—121.
74 75 3.3. Распределение вектора выборочного среднего; заключение о среднем значении, когда ковариационная матрица известна
3.3.1. Теория распределения. В одномерном случае выборочное среднее распределено нормально и не зависит от выборочной дисперсии. Аналогично выборочное среднее , определенное в § 3.2, распределено нормально и не зависит от .
Чтобы доказать этот результат, мы произведем преобразование множества векторов наблюдений. В связи с тем, что этот вид преобразований применяется неоднократно в этой книге, сначала докажем более общую теорему.
Теорема 3.3.1. Допустим, что X1 ..., XN независимы, причем распределен. ПустьС=-ортогональная матрица. Тогда распределенN(,), гдеи независимы.
Доказательство. Совместное распределение множества векторов {} нормально, так как все множество компонент является множеством линейных комбинаций компонент{Х},совместное распределение которых нормально. Математическое ожидание , равно
(1)
Ковариационная матрица векторов и равна
(2)
где есть символ Кронекера (= 1 прии=0 при). Отсюда видно, что не зависит от и имеет ковариационную матрицу .
Применим также следующую общую лемму.
Лемма 3.3.1. Если С= ортогональна, то =, где
Доказательство.
(3)
Пусть независимы и одинаково распределены с законом распределения
N(). Существует ортогональная матрицаВ = ()порядка последняя строка которой будет
. (4)
Это преобразование можно представить в виде поворота в N-мерном пространстве, при котором прямая, образующая равные углы с осями координат, переходит в N-ю ось координат (см. § 3.2). Пусть A=N^, где определена в § 3.2, и пусть
.(5)
Тогда
. (6)
Согласно лемме 3.3.1,
(7)
Так как не зависит от, то не зависит от А. Так как
, (8)
то ZN распределен иZN распределен . Заметим, что
, (9)
Теорема З.З.2. Среднее значение выборки объема N из генеральной совокупности распределено N не зависит от , являющейся оценкой наибольшего правдоподобия для . N распределена как , где , pacnpeдeлeн N (0,) и не зависит от.
(10)
Таким образом, является смещенной оценкой. Поэтому мы определим
(11)
как выборочную ковариационную матрицу. Она является несмещенной оценкой , и ее диагональные элементы являются обычными (несмещенными) выборочными дисперсиями компонентX.
3.3.2. Критерии и доверительные области для , когдаизвестна. Важными статистическими проблемами являются проблема проверки гипотезы о том, что вектор среднего значения нормального распределения является данным вектором, и связанная с ней проблема определения доверительной области для неизвестного вектора среднего значения. Мы рассмотрим здесь эти проблемы в предположении, что ковариационная матрица известна. В главе 5 мы рассмотрим случай, когда ковариационная матрица неизвестна.
Для одномерного случая основой для выбора критерия, или доверительного интервала служит тот факт, что разность между средними значениями выборки и генеральной совокупности распределена нормально с математическим ожиданием, равным нулю, и известной дисперсией; тогда таблицы нормального распределения могут быть использованы для точечных оценок или вычисления доверительных интервалов. В многомерном случае будет использован тот факт, что разность между векторами среднего значения выборки и среднего значения генеральной совокупности распределена нормально с вектором среднего значения, равным нулю, и известной ковариационной матрицей. Можно установить пределы для каждой компоненты на основании распределения, но неудобства такой процедуры состоят в том, что сам выбор пределов является отчасти произвольным и дает критерии, довольно бедные в некотором отношении; больше того, такие пределы трудно вычислять, так как таблицы пригодны только для двумерного случая. Методы, приведенные ниже, дают возможность простых вычислений и к тому же могут быть подвергнуты общей интуитивной теоретической проверке.
Эти методы основываются на следующей теореме.
Теорема 3.3.3. Если т-мерный вектор Y распределен N(0,T) (невырожденное распределение), то имеетраспределение с т степенями свободы.
Доказательство. Пусть С— невырожденная матрица, такая, что СТС' = I, и положим
Z = CY. Тогда Z нормально распределен со средним значением MZ = CMY = 0 и ковариационной матрицей
MZZ' = МСYY'C' = СТС' == I.
Но
,
что является суммой квадратов компонент Z. Так как компоненты Z независимы и распределены N (0, 1), то Z'Z= Y' T-1Y имеет -распределение сm степенями свободы (см. задачу 5 главы 7).
Так как распределенN(0,), то из теоремы следует, что
(12)
имеет -распределение ср степенями свободы. Это важное положение мы применим при выборе критериев и доверительных областей для .
79
(13)
Тогда
(14)
Для проверки гипотезы о том, что , где— определенный вектор, мы используем в качестве критической области
(15)
Если мы получим выборку, удовлетворяющую (15), то нулевая гипотеза отвергается. Интуитивно ясно, что вероятность отбросить гипотезу больше , если значительно отличается от , так как в пространстве (15) определяет эллипс с центром в , и еслиотстоит далеко от, то плотность вероятности сосредоточена в точке у границы или вне эллипса. Доказательство теоремы 3.3.3 может быть расширено, чтобы показать, что имеет нецентральное-распределение ср степенями свободы и параметром , когдаX есть среднее значение выборки объема N из совокупности N () (дано Р. Бозе [1], [2]). Теорему 3.3.3 первым доказал К. Пирсон [2].
Теперь рассмотрим следующее утверждение, сделанное на основе выборки со средним значением : «Среднее значение распределения удовлетворяет условию
(16)
как неравенству относительно ». Из (14) видно, что вероятность получения выборки, для которой указанное утверждение правильно, равна 1—, так как событие в (14) эквивалентно тому, что это утверждение ложно. Таким образом, множество*, удовлетворяющих (16), является определением доверительной области дляс доверительным уровнем 1 —. В р-мерном пространстве (15) является поверхностью и внешней частью эллипсоида с центром в , форма эллипсоида зависит от, а объем — от (1/N)при данном. В p-мерном пространстве * (16) является поверхностью и внутренней частью эллипсоида с центром в. Если то (14) говорит, чтоесть вероятность того, что расстояние между и больше, чем
Теорема 3.3.4. Если —среднее значение выборки объемаN, взятой из совокупности N (), и известна, то (15) определяет критическую область вероятности для проверки гипотезы и (16) дает доверительную область для с доверительным уровнем 1 —.выбирается так, чтобы удовлетворить (13).
Такая же техника может быть использована для соответствующих проблем в случае двух выборок. Предположим, что у нас имеется выборка () из совокупности, распределенной, и выборка()из другой нормальной совокупностис той же ковариационной матрицей. Тогда оба выборочных средних
(17)
независимы и распределены иN [] соответственно. Разность двух выборочных средниху =распределена , где. Таким образом,
(18)
является доверительной областью для разности двух векторов средних значений, а критическая область для проверки гипотезыдана неравенством
. (19)
81
как меру расстояния между двумя совокупностями.
3.3.3. Достаточные статистики для и.Было показано, что
. (20)
(21)
Таким образом, совместная плотность может быть записана следующим образом:
(22)
Таким образом, и (1/N)A образуют достаточные статистики для , и. Еслиизвестна, то: является достаточной статистикой для. Однако если известен, то(1/N)A не является достаточной статистикой для , но
является достаточной статистикой для . Напомним, чтоt является достаточной статистикой для , если
(23)
где есть плотность вероятности для-го наблюдения;g(t;) — плотность распределения t и h(x1, ..., хn) не зависит от 6 (Крамер [2]).
Если среднее значение q-мерного случайного вектора Y равно МY=и его ковариационная матрица равнаM(Y— )(Y— )' =, то
(24)
называется эллипсоидом рассеяния для Y (см. Крамер [2]). Плотность вероятности, определяемая равномерным распределением в внутренней части этого эллипсоида, имеет тот же вектор среднего значения и ту же ковариационную матрицу, что и Y (см. задачу 44 главы 2). Пусть — вектор, состоящий изq параметров распределения, и пусть t—вектор несмещенных оценок (т. е. Mt=), полученный поN наблюдениям над этим распределением с ковариационной матрицей . Тогда эллипсоид
(25)
целиком лежит внутри эллипсоида рассеяния t; обозначает вектор-столбец производных плотности вероятности (или вероятностной функции) по компонентам . В работе Крамера [2] рассуждение проводится для скаляра наблюдений, но ясно, что оно справедливо и для вектора наблюдений. Если (25) есть эллипсоид рассеяния дляt, то t называется эффективным. В общем случае отношение объема (25) к объему эллипсоида рассеяния определяется как эффективность t. В случае многомерного нормального распределения, если — вектору среднего значения, то эффективен. Если включает и, и, то эффективность и S будет .
ЛИТЕРАТУРА
§ 3.2. Вот о, Рэфферти и Димер [1]; Д в а и е р [1]; Д е ш Рай [1], [2]; К е н д а л л [3], стр. 329—334, 337—339; Крамер [2]; Муд [2], стр. 186—188; К. Пирсон [1]; Стьюдент [1]; Ф ишер[10]; Фретс [1]; Хотеллинг [7];Хьюз [11; Чоун и Морэн [11]; Эйткен [31; Юл [2], [3].