УМК по ТВ и МС
.pdf
|
|
|
|
|
|
|
|
|
|
Таблица 9.2 |
|||
№№ |
|
[x |
, x |
i+1 |
] |
ni |
pi |
npi |
(ni−npi)2 |
|
|
(ni − npi )2 |
|
|
|
|
npi |
||||||||||
|
|
i |
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
1,7 |
|
|
|
|
|
|||
1 |
|
94 – 100 |
3 |
0,017 |
|
|
|
|
|
||||
|
|
|
|
|
|
10 |
|
7,6 |
5,76 |
|
0,758 |
|
|
2 |
|
100 – 106 |
7 |
0,059 |
5,9 |
|
|
|
|
|
|||
3 |
|
106 – 112 |
11 |
0,141 |
14,1 |
9,61 |
|
0,682 |
|
||||
4 |
|
112 – 118 |
20 |
0,228 |
22,8 |
7,84 |
|
0,344 |
|
||||
5 |
|
118 – 124 |
28 |
0,247 |
24,7 |
10,89 |
|
0,441 |
|
||||
6 |
|
124 – 130 |
19 |
0,182 |
18,2 |
0,64 |
|
0,035 |
|
||||
7 |
|
130 – 136 |
10 |
0,087 |
8,7 |
|
|
|
|
|
|||
|
|
|
|
|
|
12 |
|
11,6 |
0,16 |
|
0,014 |
|
|
8 |
|
136 – 142 |
2 |
0,029 |
2,9 |
|
|
|
|
|
|||
|
Всего |
|
|
|
100 |
0,990 |
99,0 |
− |
|
ψcalc = 2,27 |
9.2.2. Критерий согласия Колмогорова−Смирнова
Критерий согласия Колмогорова−Смирнова проверяет гипотезу о согласии при небольшом объеме выборки, когда Fmod(x, Θ) известна полностью, т. е. известны и параметры модели. Рассмотрим последовательность критерия.
1-й шаг. Формулирование основной H0 и альтернативной H1 гипотез (9.2). 2-й шаг. Задание уровня значимости α.
3-й шаг. Формирование критической статистики.
В критерии Колмогорова−Смирнова для введения меры отклонения эмпирического и модельного распределений используются статистика вида
Dn = max Fn (x) − Fmod (x,Θ) . В качестве статистмки ψcr используем функцию |
|
x |
|
ψcr = n Dn = n max x Fn (x) − Fmod (x,Θ) . |
(9.4) |
Предложение 9.1. Какова бы ни была функция распределения Fmod(x, Θ) непрерывной случайной величины ξ, распределение ψcr имеет пределом функ-
∞ 2 2
цию Κ(ψcr ) = ∑(−1)i e−2i ψcr , не зависящую от вида функции Fmod (x,Θ) . #
i=−∞
Если Fmod(x, Θ) задана с точностью до неизвестных параметров Θ и они оцениваются по конечной выборке размера n, то предельное распределение ста-
тистики Dn n уже зависит от Fmod(x, Θ). При этом статистика ψcr будет зави-
сеть только от формы распределения Fmod(x, Θ). Если в модельном распределении есть только параметры сдвига и масштаба, то применимость критерия Кол- могорова–Смирнова корректна.
4-й шаг. Из определения функции распределения следует, что при достаточно большом n и любом ψcr > 0 вероятность того, что Dn n примет значение, меньшее ψcr, будет иметь вид
P{Dn n ≥ ψcr } =1 − Κ(ψcr ) =1 − ∑∞ (−1)i e−2i2ψcr2 = α.
i=−∞
111
Значение ψcr.u при заданном α можно найти в статистических таблицах. Нижняя критическая граница в данном критерии не используется.
5-й шаг. ψcalc определяется из (9.4) подстановкой значений n и Dn, для конкретных эмпирических данных. Если выполняется условие ψcalc ≤ ψcr.u, то гипотеза о согласии эмпирического распределения и модельного принимается.
Замечание 9.5. Для большого объема выборки, ее нужно сгруппировать и значения Fn(x) и Fmod(x, Θ) определять на границах интервалов группирования.
Применение критерия в принципе возможно лишь тогда, когда теоретическая функция распределения Fmod(x, Θ) задана полностью. Но такой случай на практике встречается весьма редко. Обычно из теоретических соображений известен лишь вид функции распределения, а ее параметры определяются по эмпирическим данным.
Пример 9.3. Даны результаты исследования отклонения фактического выпуска продукции (тыс. руб.) от планового (план – 1000 тыс. руб.) 400 предприятий в группированном виде (табл. 9.3). Проверить гипотезу о согласии эмпирического распределения с нормальной моделью по критерию Колмогорова– Смирнова при α = 0,05.
Таблица 9.3
Фактический |
950- |
960- |
970- |
980- |
990- |
1000- |
1010- |
1020- |
1030- |
1040- |
|
выпуск |
960 |
970 |
980 |
990 |
1000 |
1010 |
1020 |
1030 |
1040 |
1050 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Количество |
5 |
15 |
60 |
72 |
80 |
60 |
55 |
30 |
20 |
3 |
|
предприятий |
|||||||||||
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
Решение. Параметры нормального закона – математическое ожидание a и
дисперсия σ2 неизвестны, |
поэтому заменяем их на выборочную среднюю |
x |
и |
||||||||||||||
|
|
|
|
) |
2 |
, равные x =99,45 |
) |
2 |
=19,026 |
2 |
= 361,998. Следо- |
||||||
выборочную дисперсию σ |
|
|
и σ |
|
|
||||||||||||
вательно, распределение нормальной модели будет иметь вид |
|
|
|
||||||||||||||
|
Θ |
|
= |
1 |
|
|
|
− |
(x |
− 997,45)2 |
|
|
|
|
|
|
|
fmod (x, |
) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
19,026 2π |
exp |
|
|
723,996 |
, |
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
x − 997,45 |
|
||
Fmod (x,Θ) = ∫pξ ( y)dy = FN (x; 997,45;19,03) = 0,5 + Φ |
|
|
. |
|
19,03 |
|
|||
−∞ |
|
|
|
1-й шаг. Формулирование основной H0 и альтернативной H1 гипотез (9.2). 2-й шаг. α = 0,05.
3-й шаг. Вид ψcr и ее распределение находим из (9.4) и предложения 9.1. 4-й шаг. Из таблицы значений функции Колмогорова для уровня значимо-
сти α = 0,05 определяем ψcr.u = 1,36.
5-й шаг. Используя данные таблицы 9.4, находим
ψcalc = n max Fn (x) − FN (x; 997,45;19,03) = 400 0,0317 = 0,634 .
x
112
Т.к. ψcalc > ψcr.u, то гипотеза H0 отвергается с ошибкой первого рода α = 0,05. Результаты вычисления статистики ψcalc сведены в табл. 9.4.
|
|
|
Результаты вычисления ψcalc для примера 9.3 |
Таблица 9.4 |
||||||||||||||||||||
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
) |
|
|
|
|
|
|
[xi , xi 1 ] |
|
|
|
|
x |
|
|
− x |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
i |
|
|
Fmod (x; x; σ) = |
|
|
|
|
|
) |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
Fn(x) |
z = |
|
|
|
|
|
|
Φ(zi) |
|
F (x) − F (x; x; σ) |
||||||||||||||
|
|
|
σ |
|||||||||||||||||||||
|
|
+ |
|
i |
|
|
|
|
) |
|
|
|
|
|
|
|
|
|
n |
|
mod |
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
0 |
|
|
–∞ |
|
|
|
|
–0,5 |
|
|
0 |
|
|
|
|
|
0 |
|
|
||
–∞ ÷ 960 |
0,0125 |
|
–1,97 |
–0,4756 |
|
|
0,0244 |
|
|
0,0119 |
|
|
||||||||||||
960 |
÷ 970 |
0,05 |
|
–1,44 |
–0,4222 |
|
|
0,0778 |
|
|
0,0278 |
|
|
|||||||||||
970 |
÷ 980 |
0,2 |
|
–0,92 |
–0,3159 |
|
|
0,1841 |
|
|
0,0159 |
|
|
|||||||||||
980 |
÷ 990 |
0,38 |
|
–0,39 |
–0,1517 |
|
|
0.3483 |
|
|
0,0317 |
|
|
|||||||||||
990 ÷ 1000 |
0,58 |
|
0,13 |
|
|
|
0,0517 |
|
|
0,5517 |
|
|
0,0283 |
|
|
|||||||||
1000 |
÷ 1010 |
0,73 |
|
0,66 |
|
|
|
0,2454 |
|
|
0,7454 |
|
|
0,0154 |
|
|
||||||||
1010 |
÷ 1020 |
0,8675 |
|
1,18 |
|
|
|
0,3810 |
|
|
0,8810 |
|
|
0,0135 |
|
|
||||||||
1020 |
÷ 1030 |
0,9425 |
|
1,71 |
|
|
|
0,4564 |
|
|
0,9564 |
|
|
0,0139 |
|
|
||||||||
1030 |
÷ 1040 |
0,9925 |
|
2,23 |
|
|
|
0,4871 |
|
|
0,9871 |
|
|
0,0054 |
|
|
||||||||
1040 ÷ ∞ |
1,0 |
|
|
|
∞ |
|
|
|
|
0,5 |
|
|
1,0 |
|
|
|
|
0 |
|
|
||||
|
|
|
|
9.3. Критерии однородности |
|
|
|
|
|
|
||||||||||||||
Основные гипотезы однородности можно записать в виде: |
|
|
|
|||||||||||||||||||||
H F |
: F (x) = F (x) =... = F |
|
(x) ; |
H a: a = a |
2 |
=... = a ; H |
σ: σ2 |
= σ2 |
= ... = σ2 . |
|||||||||||||||
0 |
1 |
2 |
|
|
|
|
l |
|
|
|
0 1 |
|
|
|
l |
0 1 |
2 |
|
|
l |
Рассмотрим два наиболее распространенных статистических критерия проверки гипотез об однородности анализируемых генеральных совокупностей.
9.3.1. Критерий однородности Смирнова
Пусть имеются две выборки объемами n1 и n2. Элементы каждой выборки независимы, непрерывны и сгруппированы в L интервалов. Проверим, принадлежат ли выборки одной генеральной совокупности. Критерий Смирнова применим если: данные представлены в группированном виде; min(n1 , n2) > 50.
1-й шаг. Формирование основной и альтернативной гипотез
H0: Fξ (x) = Fη( y) , H1: Fξ(x) ≠ Fη(y) .
2-й шаг. Задание уровня значимости α.
3-й шаг. Формирование критической статистики
L |
(µ |
i |
/ n |
− ν |
i |
/ n |
2 |
)2 |
|
ψcr = n1n2 ∑ |
|
1 |
|
|
|
, |
|||
|
|
µi + νi |
|
|
|||||
i=1 |
|
|
|
|
|
где µi, νi − количество попаданий в i-й интервал группирования соответственно
L |
(µi −νi ) |
2 |
|
первой и второй выборок. Если n1 = n2 = n , то ψcr = ∑ |
|
. |
|
µi +νi |
|
||
i=1 |
|
|
113
Предложение 9.2. Предельное распределение критической статистики ψcr при неограниченном росте объемов выборок n1, n2 и в условиях справедливости проверяемой гипотезы H0 стремится к χ2−распределению с (L – 1) числом сте-
пеней свободы, т. е. lim F (ψcr) = χ2 (L −1) . #
n1,n2 →∞
4-й шаг. Определение критической точки статистического критерия ψcr.u = χα2 100% (L −1) . Критерий Смирнова является односторонним. Области не-
правдоподобно малых значений статистики ψcr нет. Чем меньше расчетное значение критической статистики, тем более благоприятные условия складываются для принятия гипотезы об однородности двух выборок.
5-й шаг. Определение расчетного значения критической статистики
L |
(µ |
i |
/ n |
− ν |
i |
/ n |
2 |
)2 |
|
ψcalc = n1n2 ∑ |
|
1 |
|
|
|
. |
|||
|
|
µi + νi |
|
|
|||||
i=1 |
|
|
|
|
|
Если ψcalc ≤ ψcr.u, то гипотеза H0 верна, в противном случае H0 отвергается.
Пример 9.4. В банке в течение двух дней проводилось исследование времени обслуживания клиентов. Данные представлены в табл. 9.5, где µi, νi − времена обслуживания клиентов в первый и второй дни. Проверить однородность двух группированных выборок – времени обслуживания в первый и второй дни по критерию Смирнова при уровне значимости α = 0,1.
Таблица 9.5 Статистические данные времени обслуживания клиентов в банке
Номер интервала |
Время обслужива- |
µi (1-й день) |
νi (2-й день) |
группирования i |
ния (мин) |
|
|
1 |
10 – 12 |
2 |
2 |
2 |
12 – 14 |
4 |
4 |
3 |
14 – 16 |
8 |
9 |
4 |
16 – 18 |
12 |
13 |
5 |
18 – 20 |
16 |
16 |
6 |
20 – 22 |
10 |
8 |
7 |
22 – 24 |
3 |
3 |
Решение. Верхняя критическая точка ψcr.u = χ102 % (6) =10,645 . Расчетное значение критической статистики равно
ψcalc = ∑L |
(µi −νi )2 |
= |
(2 −2)2 |
+ |
(4 −4)2 |
+...+ |
(3 −3)2 |
= 0,321. |
|
4 |
8 |
6 |
|||||
i=1 µi +νi |
|
|
|
|
Условие ψcalc ≤ ψcr.u выполняется, и H0 верна с ошибкой первого рода 10%.
9.3.2. Критерий Вилкоксона−Манна−Уитни
Критерий Вилкоксона−Манна−Уитни является ранговым и применяется для проверки однородности двух генеральных совокупностей понимаемой в смысле отсутствия различий в значениях параметров положения (средних зна-
114
чений, медиан) соответствующих распределений (но не тождественного совпадения распределений, как в предыдущем критерии). Т.е. проверяется гипотеза типа H0a. Распределения проверяемых генеральных совокупностей неизвестны. Статистические данные должны быть представлены в негруппированном виде. В критерии возможны два случая. Рассмотрим их последовательно.
|
Случай А. Пусть имеются две выборки независимых непрерывных случай- |
||||||||
ных величин (x1 |
,..., xn |
) , ( y1,..., yn |
2 |
) , где n1 ≤ 25, n2 ≤ 25 . |
|
|
|||
|
|
|
1 |
|
|
|
|
|
|
|
1-й |
шаг. |
Формирование |
основной и альтернативной гипотез |
|||||
H0: Fξ (x) = Fη( y) , H1: Fξ(x) ≠ Fη(y) . |
|
|
|
||||||
|
2-й шаг. Задание уровня значимости α. |
равной ψcr = ∑n1+n2 Ri(1) , |
|||||||
|
3-й шаг. Формирование критической статистики, |
||||||||
|
|
|
|
|
|
|
|
|
i=1 |
где |
R(1) |
− ранги элементов выборки меньшего объема |
(n ≤ n |
2 |
) . Суммирование |
||||
|
i |
|
|
|
|
|
1 |
|
рангов Ri(1) осуществляется по элементам меньшей выборки.
Предложение 9.3. В условиях справедливости гипотезы H0 статистика
ψcr = ∑n1+n2 |
Ri(1) |
при n1 → ∞ и |
lim |
n1 |
= c > 0 стремится к нормальному распре- |
|
|||||
i=1 |
|
|
n1→∞ n2 |
|
|
|
|
|
|
делению с математическим ожиданием a = M[ψcr] = n1 (n1 + n2 +1) / 2 и диспер-
сией σ2 = D[ψcr] = n1n2 (n1 + n2 ) /12 #
Для принятия решения об однородности двух выборок по критерию Вилкоксона−Манна−Уитни необходимо выполнить следующие действия:
1)Проанализировать объемы выборок n1 и n2, сравнить их между собой. Меньшую выборку будем считать первой. Пусть n1 − объем меньшей выборки;
2)Из двух выборок составляем общий вариационный ряд с обозначением рангов вариант. Если в обеих выборках есть одинаковые варианты, то в общем вариационном ряду первыми записываются варианты меньшей (первой) выборки.
4-й шаг. По статистическим таблицам критических точек распределения
Вилкоксона−Манна−Уитни для уровня значимости а находим нижнюю критическую точку ψcr.l = ωα/ 2 (n1,n2 ) , где ωα/ 2 (n1,n2 ) − квантиль распределения Вилкоксона−Манна−Уитни. Верхняя критическая точка равна
ψcr.u= (n1 + n2 +1)n1 − ψcr.l. |
(9.5) |
5-й шаг. Вычисление расчетного значения критической статистики ψcalc = |
|
∑n1+n2 Ri(1) осуществляется суммированием рангов Ri(1) |
вариант первой выборки |
i=1 |
|
в общем вариационном ряду. Если выполняется условие ψcr.l ≤ ψcalc ≤ ψcr.u, то гипотеза H0 верна, в противном случае H0 отвергается.
Случай Б. Объем хотя бы одной из выборок больше 25. Отличие данного случая от предыдущего состоит только в вычислении ψcr.l на четвертом шаге:
|
(n |
+ n |
|
+1)n |
−1 |
− u1−α/ 2 |
n n |
|
(n |
+ n |
|
+1) |
|
, |
(9.6) |
ψcr.l = |
1 |
|
2 |
1 |
|
1 |
2 |
1 |
|
2 |
|
|
|||
|
|
|
|
2 |
|
|
|
|
12 |
|
|
|
|
|
115
где u1–α/2 − квантиль нормального распределения уровня 1 − α/2.
Замечание 9.6. u1−α/ 2 |
можно также находить в виде u1−α/ 2 |
= arg Φ |
1 − α |
|
, |
|
2 |
||||||
|
|
|
|
|
где Φ( ) − функция Лапласа, табличные значения которой известны.
Пример 9.5. Объемы дневных продаж овощных магазинов в двух районах области представлены выборками (табл. 9.6, 9.7) xi, yi, (i =1,...,27) (в тыс. руб.). Проверить гипотезу об однородности двух выборок по критерию Вилкоксона– Манна–Уитни при уровне значимости α = 0,05.
Таблица 9.6
X: |
17 |
13 |
22 |
9 |
20 |
9 |
20 |
9 |
22 |
20 |
21 |
21 |
22 |
19 |
23 |
14 |
20 |
19 |
|
|
17 |
11 |
8 |
21 |
10 |
20 |
18 |
11 |
15 |
Таблица 9.7
Y: |
17 |
13 |
22 |
9 |
20 |
10 |
16 |
9 |
21 |
15 |
21 |
21 |
22 |
18 |
21 |
15 |
20 |
18 |
|
|
17 |
11 |
8 |
21 |
17 |
15 |
18 |
11 |
19 |
Решение. Поскольку n1 = n2 = 27 > 25 , то воспользуемся алгоритмом для
случая Б. Будем считать первой выборку X. Составим из двух выборок общий вариационный ряд (табл. 9.8), проставляя сразу ранги Rk, ( k =1,..., n1 + n2 ) эле-
ментам объединенного ряда. Принадлежность элемента той или иной выборке обозначим с помощью индекса ранга.
Таблица 9.8
Элемент ряда |
8X |
8Y |
9X |
9X |
9X |
9Y |
9Y |
10X |
10Y |
Rk |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
Элемент ряда |
11X |
11X |
11Y |
11X |
13X |
13Y |
14X |
15X |
15Y |
Rk |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
Элемент ряда |
15Y |
15Y |
16Y |
17X |
17X |
17Y |
17Y |
17Y |
18X |
Rk |
19 |
20 |
21 |
22 |
23 |
24 |
25 |
26 |
27 |
Элемент ряда |
18Y |
18Y |
18Y |
19X |
19X |
19Y |
20X |
20X |
20X |
Rk |
28 |
29 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
Элемент ряда |
20X |
20X |
20Y |
20Y |
21X |
21X |
21X |
21Y |
21Y |
Rk |
37 |
38 |
39 |
40 |
41 |
42 |
43 |
44 |
45 |
Элемент ряда |
21Y |
21Y |
21Y |
22X |
22X |
22X |
22Y |
22Y |
23X |
Rk |
46 |
47 |
48 |
49 |
50 |
51 |
52 |
53 |
54 |
По таблице значений функции Лапласа для α = 0,05 найдем квантиль u1−α/ 2 = argΦ(0,475) =1,96 . Из (9.5), (9.6), получим ψcr.l и ψcr.u:
116
ψcr.l = |
(27 + 27 +1) 27 −1 |
−1,96 |
27 27(27 + 27 +1) |
= 628,7 , |
|
2 |
|
12 |
|
ψcr.u = (27 + 27 +1) 27 − 628,7 = 856,3 .
Вычислим расчетное значение критической статистики:
n1+n2 |
R(1) |
54 |
=1 + 3 + 4 +K50 + 51 + 54 = 734 . |
ψcalc = ∑ |
= ∑ R(1) |
||
i=1 |
i |
i |
|
|
i=1 |
|
Условие ψcr.l ≤ ψcalc ≤ ψcr.u выполняется, следовательно, гипотеза H0 верна.
9.4.Гипотезы о числовых характеристиках случайных величин
Вобщем случае гипотезы о числовых характеристиках случайных величин
имеют вид: H0: Θ ∆0 , где Θ = (θ1,...,θK ) − некоторый вектор параметров (но
может быть и скаляром, т.е. Θ = θ1 ), а ∆0 − область конкретных значений этих
параметров, которая может состоять из точки. Рассмотрим некоторые из критериев проверки гипотез о числовых характеристиках случайных величин.
9.4.1. Проверка гипотез о равенстве дисперсий случайной величины при известных математических ожиданиях
Пусть имеются две выборки ( x1,..., xn1 ), ( y1,..., yn2 ) случайных величин ξ и
η из нормальных генеральных совокупностей и пусть математические ожидания aξ и aη этих случайных величин известны. Необходимо проверить гипотезу о равенстве дисперсий случайных величин.
1-й шаг. Формирование основной H0 и альтернативной H1 гипотез:
H0: σξ2 = ση2 , H1: σξ2 ≠ ση2 .
2-й шаг. Задание уровня значимости α.
3-й шаг. Формирование критической статистики. В качестве меры различия дисперсий σξ2 и ση2 выбираем величину ψcr = σξ2 / ση2 .
Предложение 9.4. Предельное распределение статистики ψcr как случайной величины в случае справедливости гипотезы H0 стремится к F−распределению Фишера F(n1, n2) с n1 и n2 числом степеней свободы
lim Fψкр (x) = F (n1 −1,n2 −1) . #
4-й шаг. Определение критических границ.
Верхняя критическая граница определяется как процентная точка распре-
деления Фишера уровня α/2: ψcr.u = Fα/ 2100% (n1,n2 ) . Для F−распределения нижняя критическая точка может быть найдена из выражения
ψcr.l = F(1−α/ 2) 100% (n1,n2 ) = 1/ψcr.u.
Значение процентной точки Fα/ 2100% (n1,n2 ) находится из таблиц. 5-й шаг. Расчетное значение критической статистики равно:
117
|
|
|
1 |
|
n1 |
|
|
|
|
|
)2 |
|
|
∑(xi − aξ )2 |
|
||||
|
|
|
n |
|
|||||
|
σξ |
|
|
|
i=1 |
|
|
|
|
ψcalc = |
)2 |
= |
1 |
|
|
|
. |
(9.7) |
|
1 |
|
n |
|
||||||
|
ση |
|
2 |
2 |
|
|
|||
|
|
|
|
|
|
∑( yi − aη) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n2 i=1 |
|
|
|
Если выполняется условие ψcr.l ≤ ψcalc ≤ ψcr.u, то H0 верна с ошибкой первого рода α, в противном случае H0 отвергается.
Пример 9.6. Для данных примера 9.4. проверить, можно ли на уровне значимости α = 0,01 считать одинаковыми отклонения от среднего времени обслуживания клиентов банка в первый и второй дни, если известно, что
M[ξ] = mξ =17,8 , M[η] = mη =17,6 , n1 = n2 = 55.
Решение. Предварительно найдем σ)ξ2 = 8,38, σ)η2 = 8,14 .
1-й шаг. H0: σξ2 = ση2 , H1: σξ2 ≠ ση2 .
2-й шаг. α = 0,01. 3-й шаг. ψcr = σξ2 / ση2 .
4-й шаг. Находим, используя таблицу процентных точек распределения Фишера, верхнюю и нижнюю критические границы:
ψcr.u = F0,5%(55; 55) = 2,024; ψcr.l = 1/2,024 = 0,494.
5-й шаг. Определяем по (9.8) расчетное значение критической статистики:
ψcalc = 8,38/8,14 = 1,03.
Поскольку условие ψcr.l ≤ ψcalc ≤ ψcr.u выполняется, то H0 принимается.
9.4.2. Проверка гипотез о равенстве дисперсий случайной величины при неизвестных математических ожиданиях
Пусть имеются две выборки ( x1,..., xn1 ), ( y1,..., yn2 ) случайных величин ξ и
η из нормальных генеральных совокупностей и пусть математические ожидания aξ и aη этих случайных величин неизвестны. Необходимо проверить гипотезу о равенстве дисперсий случайных величин.
1-й шаг. Формирование гипотез: H0: σξ2 = ση2 , H1: σξ2 ≠ ση2 . 2-й шаг. Задание уровня значимости α.
3-й шаг. Выбор критической статистики ψcr = σξ2 / ση2 .
Предельное распределение статистики ψcr при неизвестных aξ и aη стре-
мится к распределению Фишера: |
lim Fψcr (x) = F (n1 −1,n2 −1) . |
|
n1,n2 →∞ |
4-й шаг. Определение критических границ. Соответственно верхняя и |
|
нижняя критические точки равны: |
|
ψcr.u = Fα / 2 100% (n1 −1,n2 −1) , |
ψcr.l = F(1−α/ 2)100% (n1 −1,n2 −1) = 1/ψcr.u. |
5-й шаг. Расчетное значение критической статистики при неизвестных математических ожиданиях определяется из выражения
118
|
|
|
|
1 |
|
n1 |
|
|
|
|
|
|
|
s2 |
|
|
|
∑(x |
i |
− x)2 |
|
||||
|
|
|
|
|
|
|||||||
ψcalc = |
|
|
|
n −1 i=1 |
|
|
. |
(9.8) |
||||
x |
= |
|
1 |
|
|
|
|
|
||||
2 |
|
1 |
|
n |
|
|
|
|||||
|
sy |
|
|
2 |
|
|
2 |
|
|
|||
|
|
|
|
∑( yi − y) |
|
|
||||||
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
n2 −1 i=1 |
|
|
|
|
|
Если выполняется условие ψcr.l ≤ ψcalc ≤ ψcr.u, то H0 верна с ошибкой первого рода α, в противном случае H0 отвергается.
Пример 9.7. Для данных примера 9.4 проверить гипотезу о равенстве дисперсий при неизвестных математических ожиданиях aξ и aη для α = 0,1.
Решение. Поскольку aξ и aη неизвестны, то определим по исходным данным их оценки: a)ξ = x =17,84 , a)η = y = 17,65 . Далее, используя оценки матема-
тических ожиданий, вычислим несмещенные оценки: sx2 =8,55 , s2y =8,30.
Находим, используя таблицу процентных точек распределения Фишера, верхнюю и нижнюю критические границы:
ψcr.u = F5%(54; 54) = 1,571; ψcr.l = 1/1,571 = 0,637.
Определяем по (9.8) расчетное значение критической статистики:
ψcalc = 8,55/8,30 = 1,03.
Поскольку условие ψcr.l ≤ ψcalc ≤ ψcr.u выполняется, то H0 принимается.
9.4.3. Проверка гипотез о равенстве математических ожиданий случайных величин при известных дисперсиях
Такая задача ставится обычно тогда, когда выборочные средние оказываются различными. Возникает вопрос: значимо ли это различие?
Пусть даны две выборки ( x1,..., xn1 ), ( y1,..., yn2 ) из нормальных генераль-
ных совокупностей случайных величин ξ и η, и известны их дисперсии. Необходимо проверить гипотезу о равенстве математических ожиданий.
1-й шаг. Формирование гипотез H0: aξ = aη , H1: aξ ≠ aη .
2-й шаг. Задание уровня значимости α.
3-й шаг. Формирование критической статистики и определение ее закона
распределения при n1 → ∞, n2 → ∞ : ψcr = |
|
aξ |
− aη |
|
|
. |
|
|
|
||
|
|
|
|
|
|
|
|
||||
σ2 |
/ n |
|
|
|
|
|
|
||||
|
|
|
+ σ2 / n |
|
|
|
|||||
|
|
|
ξ |
1 |
η |
2 |
|
|
|
|
|
Предложение 9.5. Предельное распределение статистики ψcr при извест- |
|||||||||||
ных σ2 |
и σ2 |
стремится к нормальному распределению |
lim F |
(x) = N(0,1) |
. # |
||||||
ξ |
η |
|
|
|
|
|
n1,n2 →∞ |
ψcr |
|
||
|
|
|
|
|
|
|
|
|
|
||
4-й шаг. Верхняя и нижняя критические точки соответственно равны: |
|||||||||||
ψcr.u = u1−α/ 2 , |
ψcr.l = −ψcr.u, где u1−α/ 2 − квантиль стандартного нормального |
распределения уровня 1 − α/2.
5-й шаг. Определение расчетного значения критической статистики
119
ψcalc = |
|
a)ξ − a)η |
|
|
|
|
. |
(9.9) |
|
|
|
|
|
||||||
|
|
|
|
||||||
σ2 |
/ n + σ2 |
/ n |
2 |
||||||
|
ξ |
1 |
η |
|
|
|
и принятие решения. Если выполняется условие ψcr.l ≤ ψcalc ≤ ψcr.u, то гипотеза H0 принимается. В противном случае H0 отвергается с ошибкой первого рода α.
Замечание 9.7. Данный алгоритм проверки гипотез о равенстве aξ и aη можно применять и при отклонении распределения случайных величин ξ и η от нормального, но при условии, что n1 и n2 больше 30.
Пример 9.8. Для данных примера 9.4 проверить для уровня значимости α = 0,05 гипотезу о равенстве математических ожиданиях aξ и aη при условии, что дисперсии известны и равны σξ2 =8,65 и ση2 = 8,12 .
Решение. Оценки математических ожиданий определим по исходным выборкам: a)ξ = x =17,84 , a)η = y = 17,65 . Находим, используя таблицу функции
Лапласа, верхнюю и нижнюю критические границы:
ψcr.u = = arg Φ(0,475) = 1,96 , ψcr.l = −1,96.
Определяем по (9.9) расчетное значение критической статистики:
ψcalc = |
17,84 −17,65 |
= 0,34 . |
8,65 / 55 +8,12 / 55 |
Поскольку условие ψcr.l ≤ ψcalc ≤ ψcr.u выполняется, то H0 не отвергается.
9.4.4. Проверка гипотез о равенстве математических ожиданий случайных величин при неизвестных дисперсиях
Пусть имеются две выборки ( x1,..., xn1 ), ( y1,..., yn2 ) из нормальных гене-
ральных совокупностей случайных величин ξ и η. Требуется проверить гипотезу о равенстве aξ и aη.
1-й шаг. Формирование гипотез H0: aξ = aη , H1: aξ ≠ aη .
2-й шаг. Задание уровня значимости α.
3-й шаг. Формирование критической статистики
|
|
|
aξ − aη |
|
|
|
|
|
|
|
ψcr = |
|
|
|
|
|
n n |
2 . |
|||
|
|
|
|
|
|
1 |
||||
|
|
|
|
|
||||||
|
) |
|
|
) |
||||||
|
(n |
+ (n |
|
|
n1 + n2 |
|||||
|
−1)σ2 |
2 |
−1)σ2 |
|
||||||
1 |
|
ξ |
|
η |
|
|
|
|
n1 + n2 − 2
Предложение 9.6. Предельное распределение статистики ψcr стремится к t−распределению Стьюдента с (n1 + n2 − 2) числом степеней свободы:
lim Fψcr (x) = t(n1 + n2 − 2) . #
n1,n2 →∞
4-й шаг. Верхняя и нижняя критические точки определяются по формулам:
ψcr.u = tα/ 2 100% (n1 + n2 − 2) , ψcr.l = −ψcr.u,
120