ТВиМС.Малярец.Егоршин 22.12.12
.pdfСовокупности предполагаются независимыми с примерно одинаковой изменчивостью, иными словами, считается, что совокупности могут различаться только центрами (математическими ожиданиями а1 , а2).
Последнее предположение о равенстве дисперсий совокупностей можно проверить по критерию Фишера, который будет рассмотрен позже.
Для малых выборок оценки дисперсий могут оказаться малонадежными, поэтому вычисляем объединенную дисперсию:
ˆ02 |
SS1 |
SS2 |
. |
|
|
||
|
n1 |
n2 2 |
Число степеней свободы для объединенной дисперсии равно (n1 + n2 – 2), так как на отклонения xi xk наложено 2 связи – сумма первых n1 отклонений равна нулю и сумма следующих n2 отклонений также равна нулю (центральное свойство средних).
Согласно центральной предельной теореме, выборочные средние распределены асимптотически нормально:
|
|
0 |
|
|
|
|
|
|
|||
xk |
~ N ak ; |
|
|
. |
|
|
|||||
|
|
|
|
|
|
|
|
||||
|
|
nk |
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
||
Разность выборочных средних |
x1 |
x2 |
также распределена нормально |
||||||||
c характеристиками M( ) = a1 – a2 , D |
2 |
|
1 |
|
|
1 |
, так как дисперсия суммы |
||||
0 |
|
n |
|
|
|
n |
|
||||
|
|
1 |
|
|
|
|
|
2 |
|
(и разности) независимых случайных величин равна сумме дисперсий. В таком случае статистика
t |
M |
|
x1 |
x2 |
|
a1 |
a2 |
|
||||
ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
SS1 |
SS2 |
|
1 |
|
1 |
|
|
||
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
n1 |
n2 2 |
|
n1 |
n2 |
|
имеет t -распределение Стьюдента с числом степеней свободы df = (n1 + n2 – 2). Нуль-гипотеза заключается в предположении а1 = а2 .
Если окажется, что |
|
t |
|
|
|
|
|
|
|
|
|
|
x1 |
x2 |
|
|
|
|
|
|
t0,05 n1 n2 2 , нуль- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
n s 2 |
n |
s 2 |
n |
n |
|
|
|||||||||
|
|
|
|
|
|
1 |
1 |
2 |
2 |
|
2 |
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
n1 |
|
|
n2 |
2 |
|
|
n1n2 |
гипотеза не может быть отвергнута и с уровнем доверия Р = 0,95 принимаем гипотезу о равенстве центров совокупностей. Нуль-гипотеза отвергается при
| t | t0,01 . Остальные значения t0,05 < t < t0,01 попадают в область неопределенности критерия.
Для примера сравним средние 4-х выборок, характеристики которых приведены в таблице на рис. 12.4.
121
Выборки |
Объемы, |
Средние, |
Несмещенные |
Суммы |
nk |
xk |
оценки, σˆ k2 |
квадратов |
|
1 |
103 |
32,368 |
31,004 |
3162,4 |
2 |
3 |
27,367 |
67,704 |
135,4 |
3 |
30 |
22,243 |
24,566 |
712,4 |
4 |
17 |
19,247 |
8,253 |
132,0 |
Рис. 12.4. Характеристики 4-х выборок |
|
|
Для анализа m групп понадобится сравнить Cm2 |
m m 1 |
пар; в данном |
|
||
2 |
|
|
случае получается 6 пар (рис. 12.5). |
|
Группы |
ni |
nj |
dfij |
|
σˆ 2 |
t |
t0,05 |
t0,01 |
i – j |
ij |
|||||||
|
|
|
|
|
|
|
|
|
1 – 2 |
103 |
3 |
104 |
5,001 |
9,537 |
1,62 |
1,98 |
2,62 |
1 – 3 |
103 |
30 |
131 |
10,125 |
1,197 |
9,26 |
1,98 |
2,61 |
1 – 4 |
103 |
17 |
118 |
13,121 |
1,905 |
9,51 |
1,98 |
2,62 |
2 – 3 |
3 |
30 |
31 |
5,123 |
10,193 |
1,60 |
2,04 |
2,74 |
2 – 4 |
3 |
17 |
18 |
8,120 |
10,902 |
2,46 |
2,10 |
2,88 |
3 – 4 |
30 |
17 |
45 |
2,996 |
2,562 |
1,87 |
2,01 |
2,69 |
Рис. 12.5. Сравнение 6-ти пар выборок
В таблице на рис. 12.5 вычислены ЧСС (dfij ), разности ij xi x j , не-
смещенные оценки дисперсий этих разностей ˆ 2 , статистики Стьюдента tи
табличные значения t0,05(df), t0,01(df). Значимые разности, для которых t > t0,05 , выделены в таблице, откуда видно, что 1-я группа значимо отличается от 3-й и 4-й, 2-я группа значимо отличается от 4-й. Этим выводам явно не хватает наглядности. Трудно представить себе общую картину, особенно при сравнении большого количества групп (например, для 10 групп будет уже 45 сравнений).
Более наглядным является графическое сравнение интервальных оценок центров подсовокупностей (выборок), для чего на рис. 12.6 для каждой группы
вычислены |
|
границы |
|
95-процентных |
|
доверительных |
интервалов |
||||||
x |
HCP |
a |
x |
HCP |
, |
где |
HCP t |
df |
|
ˆi |
|
– так называемая наимень- |
|
|
|
|
|||||||||||
i |
i |
i |
i |
i |
|
|
i |
0,05 i |
|
ni |
|
||
|
|
|
|
|
|
|
|
|
|
|
шая существенная разность; аi – центр подсовокупности.
122
Группы |
ni |
Средние |
HCPi |
Нижние |
Верхние |
1 |
103 |
32,368 |
1,012 |
31,356 |
33,380 |
2 |
3 |
27,367 |
5,928 |
21,4389 |
33,295 |
3 |
30 |
22,243 |
1,875 |
20,369 |
24,118 |
4 |
17 |
19,247 |
2,490 |
16,757 |
21,738 |
Рис. 12.6. Интервальные оценки центров каждой выборки
В таблице на рис. 12.6 определены |
|
нижние и верхние границы довери- |
|
тельных интервалов. На рис. 12.7 |
|
эти интервалы изображены графи- |
|
чески в одном масштабе. Картина |
|
во многом прояснилась. Группа 2 |
|
содержала всего 3 наблюдения, и |
|
доверительный интервал для оценки |
|
центра этой подсовокупности полу- |
|
чился очень широким – он пере- |
Рис. 12.7. Доверительные интервалы |
крывает доверительные интервалы |
для каждой группы |
для групп 1 и 3. Чем больше наблю- |
|
дений в группе, тем уже доверительный интервал, и тем более определенные заключения можно сделать. По данному обследованию можно заключить, что группа 1 значимо отличается от групп 3 и 4. Что касается групп 3 и 4, то для них нуль-гипотеза об отсутствии значимых различий не может быть отвергнута
– их доверительные интервалы перекрываются (однако здесь для сравнения 2-й и 4-й групп потребуется дополнительное исследование, так как для этих групп нарушается предпосылка о равенстве дисперсий).
В данном примере ясность графического анализа была обусловлена малым количеством сравниваемых групп и тем, что эти группы были расположе-
ны регулярно в порядке убывания результативного признака. |
|
|
|
||||
Академик Доспехов Б. А. предло- |
|
|
|
|
|
|
|
Группы |
ni |
Средние |
Однородные |
||||
жил еще более наглядное представление |
группы |
||||||
|
|
|
|||||
4 |
17 |
19,247 |
|
|
|
||
результатов анализа (рис. 12.8). Группы |
|
|
|
||||
|
|
|
|
|
|
||
3 |
30 |
22,243 |
|
|
|
||
должны быть отсортированы в порядке |
|
|
|
||||
|
|
|
|
|
|
||
2 |
3 |
27,367 |
|
|
|
||
возрастания (или убывания) результатив- |
|
|
|
||||
|
|
|
|
|
|
||
1 |
103 |
32,368 |
|
|
|
||
ного признака (средних по группам). Да- |
|
|
|
||||
|
|
|
|
|
|
||
Рис. 12.8. Символьная диаграмма |
|||||||
лее строится символьная диаграмма (это |
|||||||
|
|
|
|
|
|
проще, чем рисунок) из нескольких рядов звездочек. Если между некоторыми
123
группами нет значимых различий, они помечаются звездочками в одном вертикальном ряду (однородные группы).
Сравнение двух дисперсий
Английский статистик Р. Фишер изучил распределение отношения несмещенных оценок дисперсии для двух выборок, взятых из одной и той же
|
ˆ 2 |
|
SS |
|
df |
2 |
, где в числителе |
нормально распределенной совокупности: F |
1 |
|
1 |
|
|
||
ˆ 22 |
|
SS2 |
|
df1 |
|||
|
|
|
|
стоит большая из двух оценок дисперсий, а в знаменателе –меньшая оценка. Распределение Фишера зависит только от чисел степеней свободы числителя и знаменателя F(df1 , df2). Внешне график дифференциальной функции распределения Фишера похож на аналогичный график распределения Пирсона. Составлены таблицы с двумя входами (df1 , df2) для определения критических значений F0,05 и F0,01 (определяются границы только для правостороннего критерия).
Если вычисленное значение F не превосходит табличного значения ниж-
ней границы F F0,05 , нуль-гипотеза о равенстве дисперсий |
2 |
2 |
не может |
1 |
2 |
быть отвергнута. Нуль-гипотеза отвергается, если вычисленное значение F превосходит табличное значение для верхней границы F > F0,01 . Остальные значения F попадают в область неопределенности критерия.
Для предыдущего примера (4 группы) сравним все 6 пар дисперсий. В таблице на рис. 12.9 для каждой пары выборок выписаны их объемы (ni ) и несмещенные оценки дисперсий ( ˆi2 ). Вычислены отношения F большей оценки к меньшей и по таблицам для заданной пары чисел степеней свободы числителя
и знаменателя найдены критические значения F0,05 |
и F0,01 . |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
Группы |
ni |
nj |
ˆ 2 |
σˆ 2 |
|
F |
F0,05 |
F0,01 |
|
i – j |
σi |
j |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
1 – 2 |
103 |
3 |
31,004 |
67,704 |
|
2,184 |
3,09 |
4,82 |
|
1 – 3 |
103 |
30 |
31,004 |
24,566 |
|
1,262 |
1,71 |
2,15 |
|
1 – 4 |
103 |
17 |
31,004 |
8,253 |
|
3,757 |
2,07 |
2,86 |
|
2 – 3 |
3 |
30 |
67,704 |
24,566 |
|
2,756 |
3,33 |
5,42 |
|
2 – 4 |
3 |
17 |
67,704 |
8,253 |
|
8,204 |
3,63 |
6,23 |
|
3 – 4 |
30 |
17 |
24,566 |
8,253 |
|
2,977 |
2,20 |
3,10 |
Рис. 12.9. Сравнение дисперсий каждой пары выборок
124
Значимые дисперсионные отношения, для которых F > F0,01 , выделены в таблице, откуда видно, что изменчивость данных в 4-й группе значимо отличается от изменчивости в других группах.
При сравнении 3-й и 4-й групп дисперсионное отношение F = 2,977 попало в область неопределенности критерия Фишера.
Если при оценке значимости разности средних по критерию Стьюдента оказалось, что нельзя пользоваться объединенной оценкой дисперсии, диспер-
сию разности |
x1 x2 вычисляют по другой формуле: |
||||||
|
ˆ |
2 ˆ12 |
|
ˆ 22 |
. |
||
|
|
n |
|
n |
2 |
||
|
|
|
|
|
|||
|
|
1 |
|
|
|
Однако при этом возникают проблемы определения соответствующего числа степеней свободы df . Согласно методике Уэлча, ЧСС надо определять так:
|
|
|
|
ˆ12 |
|
|
|
ˆ 22 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
df |
|
|
|
n1 |
|
|
n2 |
|
|
|
|
. |
|
|
ˆ14 |
|
|
|
|
ˆ 24 |
|
||||||
|
|
|
|
|
|
|
|
|
|
||||
|
|
n2 |
n 1 |
|
|
|
n2 |
n |
2 |
1 |
|
|
|
1 |
1 |
2 |
|
|
|
|
Например, для спорного случая при сравнении 3-й и 4-й групп имеем:
x3 |
x4 |
22,243 |
19,247 2,996 ; |
||||||||||
ˆ 2 |
|
ˆ 2 |
|
ˆ 2 |
24,566 |
8,253 |
|
; |
|||||
|
1 |
|
|
2 |
|
|
|
|
|
|
1,304 |
||
|
n1 |
|
n2 |
|
30 |
|
17 |
||||||
|
|
|
|
|
|
|
|||||||
df |
|
|
|
|
|
1,3042 |
|
|
44,9 . |
|
|||
|
|
24,566 2 |
8,253 2 |
|
|
||||||||
|
|
|
|
|
|
|
|
||||||
|
|
|
|
30 2 |
29 |
17 2 16 |
|
|
|
|
Все равно получилось то же самое значение ЧСС: df = (n3 + n4 – 2) = 45;
t |
|
2,996 |
|
2,62 |
; |
|||
ˆ |
|
|
|
|
||||
1,304 |
||||||||
|
|
|
|
t0,05(44) = 2,01; t0,01(44) = 2,69.
Вычисленное t попало в область неопределенности критерия.
Ранее (при объединении дисперсий) был сделан вывод об отсутствии значимых различий между выборками 3 и 4.
125
Вывод дифференциальной функции распределения Стьюдента
Рассмотрим |
распределение |
статистики |
Стьюдента |
t |
|
z |
|
, |
|
|
|
|
|||||||
|
|
|
|||||||
V k |
|||||||||
|
|
|
|
|
|
|
|
где z и V – независимые случайные величины, z распределено по стандартному
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
z |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2) |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
нормальному закону |
f z |
|
z |
|
|
|
exp |
|
|
|
|
|
, а |
|
|
V – |
по закону Пирсона ( |
|||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
2 |
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
2 |
|
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
V |
|
k |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f |
V C |
0 |
exp |
|
V 2 |
с числом степеней свободы k. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||
V |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
Вследствие независимости z и V плотность вероятности их совместного |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
z 2 |
V |
|
k |
|
1 |
|
|
|
|
|
|
||||||
распределения равна произведению f |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
. |
|
|
|
|
|
||||||||||||||||||||||||||||||||
|
z |
|
z f |
|
V |
|
C exp |
|
|
|
|
|
|
|
|
V 2 |
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
|
1 |
|
|
|
|
|
2 |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
Интегральная функция распределения Стьюдента выражается через |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
двойной интеграл: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
z 2 |
|
V |
|
|
|
k |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
z |
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
F x |
|
|
P |
|
|
x |
|
|
|
|
|
|
|
|
|
|
C exp |
|
|
|
|
|
|
|
|
|
|
|
V 2 |
dzdV , |
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
2 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
z |
|
x |
|
|
V |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
где |
область интегрирования |
определена |
неравенствами |
|
|
|
|
|
|
|
|
z |
|
V |
и |
|||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
k |
|||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
0. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Преобразуем этот интеграл: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
k |
|
1 |
|
|
k |
|
|
|
|
z 2 |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
dz . |
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
F x |
|
|
C |
exp |
|
|
|
|
|
|
|
V 2 |
|
dV |
|
|
|
|
|
|
|
exp |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для определения плотности вероятности f(x) дифференцируем полученное выражение по x:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
V |
|
|
k |
|
1 |
|
|
|
|
|
d |
|
|
k |
|
z 2 |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
dz , |
|
|
|
|||||||
f x |
|
C |
exp |
|
V 2 |
|
dV |
|
|
|
|
|
|
|
|
exp |
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
1 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
dx |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
V |
|
k |
1 exp |
|
x 2V |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
1 |
x 2 |
V |
k 1 |
|
|||||
f x C exp |
V |
|
|
|
|
V |
|
dV |
|
|
|
|
C |
|
exp |
|
||||||||||||||||
2 |
|
|
|
|
|
|
2 |
2 |
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
1 |
2 |
|
|
|
|
|
2k |
|
|
|
|
k |
|
|
|
|
|
|
|
|
2 |
|
k |
|
|
|
||||||
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В последнем интеграле делаем замену переменной:
dV .
|
V |
|
1 |
|
|
x 2 |
|
|
u; V |
|
|
2u |
|
|
; dV |
|
2du |
|
; |
|
|
|
|
|||||||
2 |
|
|
|
k |
1 |
|
x |
2 |
|
1 |
x |
2 |
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
|
|
k |
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
x 2 |
|
|
|
k 1 |
1 |
|
|
|
|
|
|
|
k |
1 |
|
|
|
|
|
|
x 2 |
|
k 1 |
|
||
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
f x C 1 |
|
exp |
|
u |
|
|
u 2 |
|
du |
|
B |
|
1 |
. |
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
3 |
|
|
k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k |
|
|
|
k |
|
|
|
|||
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
126
Константа Bk определяется из условия равенства единице площади под дифференциальной кривой.
Вывод дифференциальной функции распределения Фишера
Рассмотрим распределение статистики Фишера:
|
U k |
Uk |
||
v |
1 |
|
2 |
, |
V k2 |
|
|||
|
|
Vk1 |
где U и V – независимые случайные величины, распределенные по закону Пирсона с числами степеней свободы k1 и k2 .
Вследствие независимости U и V плотность вероятности их совместного
|
|
U |
V |
|
k1 |
1 |
|
k2 |
1 |
|
|
|
|
|
|||||
распределения равна произведению f |
U f V C exp |
U 2 |
|
V 2 . |
|||||
|
|
|
|||||||
U |
V |
2 |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Интегральная функция распределения Фишера выражается через двойной интеграл, где область интегрирования определена неравенствами
0 U |
|
xk1 |
V , V |
0: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
k2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Uk |
2 |
|
|
|
|
|
|
|
|
|
U |
|
|
V |
|
|
|
k1 |
|
1 |
|
k2 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
F x P v |
x P |
|
|
x |
|
|
|
C exp |
|
|
|
|
|
|
|
U 2 |
|
V 2 |
dUdV . |
|||||||||
|
Vk |
1 |
xk1 |
|
|
2 |
2 |
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
U |
V |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
k2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
Преобразуем этот интеграл к виду: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xk1 |
V |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
|
k2 |
1 |
k2 |
|
U |
|
|
k1 |
|
1 |
|
|
|
|
||||
|
|
|
|
F x C e 2 V 2 |
dV |
|
|
e 2 U 2 |
|
|
dU . |
|
|||||||||||||||||
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Для определения плотности вероятности дифференцируем полученное выражение по x:
|
|
|
|
|
|
|
xk1 |
V |
|
|
|
|
|
|
V |
|
k2 |
1 |
d |
|
k2 |
|
U k1 |
1 |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f x C e 2 |
V 2 |
dV |
|
|
|
|
e 2 U 2 |
dU ; |
|||||
dx |
|
|
|
||||||||||
0 |
|
|
|
|
0 |
|
|
|
|
|
f x C e
0
V |
|
k2 |
|
|
xk1 |
k1 |
1 |
|
|
||||
|
|
|
1 |
|
|
V |
xk1 |
V |
2 |
k1 |
|
||
|
|
|
|
2k2 |
VdV ; |
||||||||
2 |
V 2 |
e |
|||||||||||
|
|
|
|
k2 |
|||||||||
|
|
|
|
|
|
|
k2 |
|
|
|
|
|
|
|
k1 |
1 |
V |
|
xk1 |
|
k |
k |
|
|
|
xk1 |
|
2 |
|
1 |
|
|
1 |
|
2 |
1 |
||
|
2 |
k2 |
|
|
|||||||||
|
|
|
2 |
|
|||||||||
f x C1 |
|
|
|
|
e |
|
|
|
V |
|
|
|
dV . |
k |
2 |
|
|
|
|
|
|
|
|||||
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
127
В последнем интеграле делаем замену переменной:
|
V 1 |
|
|
xk1 |
|
w; V |
|
|
|
w |
|
; dV |
|
|
|
dw |
|
|
; |
|||||||||||||||||||
|
|
|
k |
2 |
|
|
|
|
|
|
|
|
xk |
|
|
|
|
|
|
|
|
xk |
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
1 |
|
|
|
|
1 |
|
|
|
|
1 |
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k2 |
|
|
|
|
|
|
|
k2 |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
k1 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k1 |
2 |
|
|
|
|
||
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
C |
xk1 |
|
|
|
|
|
|
|
|
w |
|
|
k1 k2 2 |
|
|
C |
|
|
xk1 |
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
1 |
k |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
k |
2 |
|
|
|
|
|
|
|
|
|
. |
||
f x |
|
|
|
|
|
|
|
|
|
e 2 |
w 2 |
dw |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
k k |
2 |
|
|
|
|
|
|
|
k k |
|
||||||||||||||||||||
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
2 |
|
|
|
||||||||||
|
1 |
xk1 |
|
2 |
|
0 |
|
|
|
|
|
|
1 |
|
|
xk1 |
|
|
|
|
2 |
|
|
|
|
|
||||||||||||
|
k2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
k2 |
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Константа C2 определяется из условия равенства единице площади под дифференциальной кривой.
Вопросы для самопроверки
1.Чем отличается распределение Стьюдента от нормального распределения?
2.Как строится интервальная оценка математического ожидания?
3.Какова относительная погрешность интервальной оценки?
4. Как определяется объем выборки, необходимый для получения заключений с заданными надежностью и погрешностью?
5. Как сравниваются центры двух подсовокупностей?
6. Изложите графическую форму представления результатов анализа сравнения выборок.
7. Как сравниваются дисперсии?
8.Как находится дисперсия разности средних при одинаковых дисперсиях выборок?
9.Как находится дисперсия разности средних при разных дисперсиях вы-
борок?
128
13. Дисперсионный анализ
Сравнение групп
Дисперсионный анализ – математический аппарат для сравнения средних нескольких популяций (групп, слоев, классов), которые определяются уровнями некоторых величин (факторов), положенных в основу классификации. Международным обозначением дисперсионного анализа является аббревиатура
ANOVA (analysis of variance).
Вдисперсионном анализе предполагается, что группы (популяции) различаются только средним уровнем результативной переменной, данные в каждой группе распределены нормально с одинаковой дисперсией.
Впредыдущей лекции мы познакомились с методикой Стьюдента сравнения средних двух групп. Это частный случай «однофакторного» дисперсионного анализа, когда группы наблюдений определяются уровнями одного классификационного показателя (фактора).
Рассмотрим общий случай однофакторного дисперсионного анализа.
Пусть имеется р групп (i = 1, 2, … , p), соответствующие уровням xi классификационного фактора X. В каждой группе имеется ki наблюдений результативной
|
p |
переменной yij (j = 1, 2, … , ki), всего наблюдений n |
ki . |
i |
1 |
Модель однофакторного дисперсионного анализа yij = ui + ij представляет разложение полного сигнала yij на две компоненты – на полезный сигнал ui и помеху ij (на детерминированную часть ui , которая характеризует определенную группу, и случайный разброс ij в этой группе).
Методом наименьших квадратов из условия минимума суммы квадратов
p ki |
ij2 |
|
|
|
|
|
|
ошибок |
найдено, |
что наилучшими оценками для ui являются средние |
|||||
i 1 j |
1 |
|
|
|
|
|
|
значения ui |
|
1 |
ki |
|
по данным каждой группы (средние групповые). |
||
yxi |
|
yij |
|||||
|
k |
i |
|
||||
|
|
|
|
j |
1 |
|
|
|
|
|
|
|
|
Интересно, что точно такое же разложение имеет сумма квадратов отклонений SSy = SSu + SS и число степеней свободы dfy = dfu + df .
Покажем это. Прежде всего убедимся, что среднее из средних групповых
|
|
|
1 |
p ki |
|
равно общему среднему: u y |
yij . |
||||
n i |
|||||
|
|
|
1 j 1 |
129
Действительно,
|
|
p |
ki |
p |
|
p ki |
|
|
|
|
|
1 |
|
1 |
|
1 |
|
y . |
|
u |
ui |
kiui |
yij |
||||||
|
n i 1 |
n i 1 j 1 |
|||||||
|
|
n i 1 j 1 |
|
|
|
Преобразуем полную (общую) сумму квадратов отклонений:
|
p |
ki |
|
y 2 |
|
p ki |
|
|
|
|
|
|
y 2 |
|
|
SSy |
|
|
y |
|
|
y |
u |
i |
u |
i |
|
|
|||
|
|
|
ij |
|
|
|
ij |
|
|
|
|
|
|
||
i |
1 j 1 |
|
|
|
i 1 j |
1 |
|
|
|
|
|
|
|
|
|
p ki |
|
2 |
p |
ki |
|
y 2 |
p |
ki |
|
|
|
|
|
|
|
y u |
|
u |
i |
2 |
|
y u |
i |
u |
i |
y |
|||||
ij |
|
i |
|
|
|
|
|
ij |
|
|
|
|
|||
i 1 j 1 |
|
|
i 1 j 1 |
|
|
i 1 j 1 |
|
|
|
|
|
|
|||
|
|
|
|
p |
|
ki |
|
|
|
|
|
|
|
|
|
SS |
SSu |
2 |
ui |
y |
yij |
ui |
SS |
|
SSu . |
||||||
|
|
|
i |
1 |
|
j |
1 |
|
|
|
|
|
|
|
|
0
Последняя двойная сумма в этом выражении равна нулю из-за центрального свойства средних – алгебраическая сумма отклонений от своего среднего равна
ki |
ki |
|
|
|
|
|
нулю |
ij |
yij ui 0. |
|
|
|
|
j 1 |
j |
1 |
|
|
|
|
Итак, SSy = SSu + SS . |
|
|
|
|
||
Докажем |
аналогичное соотношение |
для |
чисел |
степеней свободы |
||
dfy = dfu + df : |
|
|
|
|
|
|
dfy = n – 1, так как на n отклонений |
yij |
y наложена одна связь – сумма |
||||
всех этих отклонений равна нулю; |
|
|
|
|
||
dfu = p – 1, так как на р отклонений |
ui |
y наложена одна связь – взвешен- |
||||
|
|
p |
ki |
|
p |
|
ная сумма этих отклонений равна нулю |
ui |
y |
ki ui |
y 0 ; |
||
|
|
i 1 j 1 |
|
i 1 |
|
df = n – p, так как в каждой группе сумма отклонений равна нулю
ki
ij 0 .
j 1
Итак, dfy = dfu + df .
Р. Фишер предложил все выкладки дисперсионного анализа оформлять в виде стандартной таблицы (рис. 13.1).
130