4. Проверка гипотезы о виде распределения
4.1Критерий согласия Пирсона. Проверка гипотезы о виде распределения
Пусть имеется выборка x = (x1; x2; : : : ; xn) из некоторого распределения F . Будем проверять гипотезу о принадлежности наблюдаемой в опыте случайной величины некоторому семейству распределений. То есть будем проверять сложную гипотезу H0 = fF 2 fF gg против сложной альтернативы H1 = fF 62Ff gg.
Чтобы воспользоваться критерием Пирсона, выборочные данные предварительно группируют. Разделим область выборочных данных на интервалы 1; 2; : : : ; k. Обозначим за j (j = 1; 2; : : : ; k) число элементов выборки, попавших в интервал j ( 1 + + k = n). Эмпирические вероятности попадания элементов выборки в j обозначим qj:
qj = nj ; j = 1; : : : ; k:
За pj( ) обозначим теоретические вероятности попадания значения случайной величины в интервал группировки j в случае, если выполняется гипотеза H0.
Составим статистику, характеризующую отклонение выборочных данных (вероятностей qj) от соответствующих гипотетических значений (pj):
2 |
= 2 |
( ) = n |
n |
(qj pj( ))2 |
: |
n |
n |
|
|
pj( ) |
|
|
|
|
=1 |
||
|
|
|
Xj |
Непосредственно использовать эту статистику для построения критерия нельзя - для начала надо исключить неопределенной, связанную с неизвестным параметром . Для этого поступают следующим образом - заменяют некоторой оценкой en = en(x), найденной по выборке x.
23
2 |
= 2 |
( n) = n |
n |
(qj pj( n))2 |
: |
|
|
||||||
f |
f e |
Xj |
e e |
|
||
n |
n |
|
|
|
pj( n) |
|
|
|
|
=1 |
|
|
|
Такую статистику уже можно однозначно вычислить для каждой заданной реализации выборки x.
Теорема 4.1 Если верна гипотеза H0 и l - размерность векторного параметра , то при фиксированном k и при n ! 1
f2n ! ;
где имеет распределение 2 с k l 1 степенями свободы.
Приведем схему использования критерия согласия 2:
1.По заданной выборке x найти оценку векторного параметра .
2.Найти теоретические вероятности попадания значений случайной величины в интервалы группировки j.
3.Вычислить значение статистики f2n
4.По заданному уровню значимости " найти пороговое значение статистики C" из условия 2k l 1(C") = 1 " = q.
5.Если f2n < C" то гипотезу H0 принимаем, иначе - отклоняем.
Замечание: Малочисленные частоты ( j < 5), следует объединить, объединив соответствующие интервалы группировки. Теоретические частоты следует вычислять уже после объединения интервалов. При определении числа степеней свободы в этом случае вместо k следует взять число интервалов, получившихся после объединения.
4.2Проверка гипотезы о виде распределения в Mathcad
Одной из полезных возможностей Mathcad является наличие встроенной функции для вычисления квантиля распределения 2. Это функция qchisq(p; d), где d - число степеней свободы, p - значение вероятности.
Приведем пример использования критерия 2 для проверки параметрической гипотезы о виде распределения.
Пусть имеется выборка объема n = 500 из некоторого распределения F . Требуется проверить гипотезу H0 = fF = 1; g. На рис. 4.1 приведен текст программы для проверки этой гипотезы с помощью критерия2. Обратите внимание на то, что так как один из параметров гаммараспределения уже задан, то по выборке оценивается только .
24
Задается объем выборки. Вектор, задающий выборку, считывается из файла
Определяются границы области выборочных данных
Определяется число интервалов группировки Формируется таблица частот: для i-го столбца
В 1-й строке записано начало интервала группировки Во 2-й строке - конец этого интервала
В3-й строке - число попаданий значений
вi-й интервал
Формируется новая таблица частот, в которой объединены интервалы группировки, количество попаданий в которые незначительны.
Методом моментов находится оценка параметра .
Находятся эмпирические частоты.
Находятся теоретические частоты.
В данном случае h < h , поэтому гипотеза о том, что случайная величина имеет гамма-распределение с пара-
метрами = 1; = 3:173 принимается
Рис. 4.1. Проверка гипотезы о том, что случайная величина имеет гаммараспределение 1;.
25
4.3Задание к лабораторной работе
C помощью критерия Пирсона проверить гипотезу о распределении случайной величины по указанному в вашем варианте закону.
Варианты заданий:
1.В ходе испытания 300 ламп накаливания была получена выборка, элементы которой - длительности их горения. Данные приведены в таблице 4.1. Проверить гипотезу о распределении времени горения ламп по показательному закону с уровнем значимости 0:05.
2.В тепличном хозяйстве проводился контроль урожайности томатов некоторого сорта. Было измерено, сколько томатов было собрано за сезон с каждого из 150 выбранных кустов. Полученные данные приведены в таблице 4.2. Проверить гипотезу о нормальном распределении урожайности с уровнем значимости 0:02.
Таблица 4.1.
Ресурс |
|
Число ламп, |
лампы, |
w, |
ресурс кото- |
тыс.час. |
|
рых составил |
|
|
w |
|
|
|
w 2 [0; 0:5) |
|
185 |
w 2 [0:5; 1) |
|
57 |
w 2 [1; 1:5) |
|
32 |
w 2 [1:5; 2) |
|
14 |
w 2 [2; 2:5) |
|
6 |
w 2 [2:5; 3) |
|
3 |
w 2 [3; 3:5) |
|
2 |
w 2 [3:5; 4) |
|
1 |
Таблица 4.2.
Урожай, |
|
Число |
ку- |
собранный |
|
стов, с |
ко- |
с куста |
то- |
торых |
было |
матов, |
w, |
собрано |
w |
кг |
|
томатов |
|
w 2 [9; 10) |
|
18 |
|
w 2 [10; 11) |
23 |
|
|
w 2 [11; 12) |
13 |
|
|
w 2 [12; 13) |
27 |
|
|
w 2 [13; 14) |
27 |
|
|
w 2 [14; 15) |
30 |
|
|
w 2 [15; 16) |
12 |
|
3.Опыт, состоящий в одновременном подбрасывании пяти игральных костей, повторили 150 раз. Событие A в единичном испытании состоит
втом, что на кости выпало не более двух очков. Данные о том, сколько раз в каждом опыте повторилось событие А, приведены в таблице 4.3. Проверить гипотезу о распределении данной случайной величины по биномиальному закону с уровнем значимости 0:05.
4.В течение 4 месяцев (122 дня) в магазине вели статистику о количестве проданных за день буханок белого хлеба. Полученная выборка приведена в таблице 4.4. Проверить гипотезу о распределении количества проданных в день буханок по закону Пуассона с уровнем значимости 0:05.
26
Таблица 4.3.
Количество повторений события А в |
0 |
1 |
2 |
3 |
4 |
5 |
рамках одного опыта, k |
|
|
|
|
|
|
Количество опытов, в результате кото- |
25 |
46 |
46 |
20 |
12 |
1 |
рых событие А повторялось k раз |
|
|
|
|
|
|
5. По 110 магазинам города был проведен мониторинг цен на красную икру. В таблице 4.5 приведены цены за 100 граммов икры в каждом из магазинов (в рублях). Проверить гипотезу о нормальном распределении цен на икру с уровнем значимости 0:01.
Таблица 4.4.
Количество |
Число |
дней, |
проданных |
когда |
было |
булок хлеба, |
продано |
k |
k |
булок хлеба |
|
k 2 [7; 9) |
2 |
|
k 2 [9; 11) |
8 |
|
k 2 [11; 13) |
11 |
|
k 2 [13; 15) |
18 |
|
k 2 [15; 17) |
24 |
|
k 2 [17; 19) |
27 |
|
k 2 [19; 21) |
14 |
|
k 2 [21; 23) |
10 |
|
k 2 [23; 25) |
5 |
|
k 2 [25; 27) |
2 |
|
k 2 [27; 29) |
1 |
|
Таблица 4.5.
Стоимость 100 |
Число мага- |
г. икры, w, |
зинов, в кото- |
руб. |
рых икра сто- |
|
ит w |
w 2 [190; 192) |
1 |
w 2 [192; 194) |
4 |
w 2 [194; 196) |
4 |
w 2 [196; 198) |
12 |
w 2 [198; 200) |
16 |
w 2 [200; 202) |
23 |
w 2 [202; 204) |
26 |
w 2 [204; 206) |
19 |
w 2 [206; 208) |
3 |
w 2 [208; 210) |
2 |
6.В некоторой местности в течение 100 суток регистрировалась среднесуточная температура воздуха (в градусах Цельсия). В результате была получена выборка, приведенная в таблице 4.6. Проверить гипотезу о логнормальном распределении температуры воздуха с уровнем значимости 0:03.
7.В результате испытания 250 батареек на длительность их работы (в часах) в одинаковых плеерах была получена выборка, приведенная в таблице 4.7. Проверить гипотезу о распределении длительности работы батареек по показательному закону с уровнем значимости q = 0:03.
27
Таблица 4.6.
СреднесуточнаяЧисло |
дней |
|
температура |
со |
средне- |
воздуха, w |
суточной |
|
|
температурой |
|
|
w |
|
w 2 [12; 13) |
1 |
|
w 2 [13; 14) |
7 |
|
w 2 [14; 15) |
18 |
|
w 2 [15; 16) |
23 |
|
w 2 [16; 17) |
23 |
|
w 2 [17; 18) |
21 |
|
w 2 [18; 19) |
7 |
|
Таблица 4.7.
Длительность |
Количество |
||
работы |
бата- |
батареек, про- |
|
рейки, |
w, |
работавших w |
|
час. |
|
час. |
|
w 2 [5; |
6) |
14 |
|
w 2 [6; |
7) |
76 |
|
w 2 |
[7; |
8) |
88 |
w 2 |
[8; |
9) |
58 |
w 2 |
[9; |
10) |
12 |
w 2 |
[10; 11) |
2 |
8. Опыт состоял в том, что человек одновременно вытягивал из четырех карточных колод (по 36 карт) по 1 карте и складывал их обратно. Опыт было повторен 120 раз и каждый раз подсчитывалось, сколько вынималось карт пиковой масти. Данные приведены в таблице 4.8. Проверить гипотезу о распределении исследуемой случайной величины по биномиальному закону с уровнем значимости 0:04.
Таблица 4.8.
Количество карт масти "пики" , k |
0 |
1 |
2 |
3 |
4 |
Количество опытов, в результате кото- |
38 |
48 |
23 |
10 |
1 |
рых из четырех колод было вынуто k |
|
|
|
|
|
карт масти "пики" |
|
|
|
|
|
9.В ходе школьного медицинского осмотра был измерен рост 200 первоклассников. Полученные данные приведены в таблице 4.9. Проверить гипотезу о распределении роста учеников по нормальному закону
суровнем значимости 0:05.
10.В результате взвешивания 300 бильярдных шаров была получена выборка, представленная в таблице 4.10. Проверить гипотезу о логнормальном распределении веса шаров с уровнем значимости 0:02.
11.Для проверки качества работы заводского оборудования было подсчитано количество нестандартных деталей, изготовленных каждым из 200 станков за неделю. Выборка приведена в таблице 4.11. С помощью критерия Пирсона проверить гипотезу о распределении количества нестандартных изделий по закону Пуассона с уровнем значимости 0:05.
28
Таблица 4.9.
Рост первоклас- |
Число перво- |
сника, w, см. |
классников, |
|
имеющих рост w |
w 2 [118; 119) |
1 |
w 2 [119; 120) |
3 |
w 2 [120; 121) |
2 |
w 2 [121; 122) |
17 |
w 2 [122; 123) |
13 |
w 2 [123; 124) |
30 |
w 2 [124; 125) |
38 |
w 2 [125; 126) |
36 |
w 2 [126; 127) |
30 |
w 2 [127; 128) |
21 |
Таблица 4.10.
Вес |
бильярд- |
Количество |
|
ного |
шара w, |
шаров |
с |
г. |
|
весом w |
|
w 2 [280; 281) |
30 |
|
|
w 2 [281; 282) |
26 |
|
|
w 2 [282; 283) |
38 |
|
|
w 2 [283; 284) |
40 |
|
|
w 2 [284; 285) |
26 |
|
|
w 2 [285; 286) |
28 |
|
|
w 2 [286; 287) |
28 |
|
|
w 2 [287; 288) |
23 |
|
|
w 2 [288; 289) |
37 |
|
|
w 2 [289; 290) |
24 |
|
Таблица 4.11.
Число нестандартных деталей, k |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Количество станков, изготовив- |
6 |
33 |
50 |
41 |
38 |
15 |
11 |
4 |
2 |
ших k нестандартных деталей |
|
|
|
|
|
|
|
|
|
12. После поступления на склад 300 коробок стеклянных елочных игрушек кладовщик проверил, сколько игрушек в каждой коробке было повреждено в результате транспортировки. Результаты его проверки приведены в таблице 4.12. Проверить гипотезу распределении количества поврежденных игрушек в 1 коробке по закону Пуассона с уровнем значимости 0:05.
Таблица 4.12.
Число поврежденных игрушек, k |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Число коробок с k поврежденны- |
41 |
82 |
84 |
56 |
23 |
9 |
3 |
1 |
1 |
ми игрушками |
|
|
|
|
|
|
|
|
|
13. Производителем компьютерной техники проводился мониторинг длительности безотказной работы жестких дисков, выпущенных им 15 лет назад. Было исследовано 300 жестких дисков, результаты представлены в таблице 4.13. Проверить гипотезу о распределении длительности безотказной работы дисков по показательному закону с уровнем значимости 0:02.
29
14. Была собрана статистика о продолжительности жизни жителей одного из пригородов Красноярска. Данные о продолжительности жизни 2000 человек приведены в таблице 4.14. Проверить гипотезу о распределении продолжительности жизни красноярцев по логнормальному закону с уровнем значимости 0:02.
Таблица 4.13.
Длительность |
Число |
жест- |
безотказной |
ких дисков, |
|
работы w, |
прорабо- |
|
лет |
тавших |
w |
|
лет |
|
w 2 [6; 6:5) |
1 |
|
w 2 [6:5; 7) |
1 |
|
w 2 [7; 7:5) |
0 |
|
w 2 [7:5; 8) |
6 |
|
w 2 [8; 8:5) |
6 |
|
w 2 [8:5; 9) |
20 |
|
w 2 [9; 9:5) |
64 |
|
w 2 [9:5; 10) |
49 |
|
w 2 [10; 10:5) |
58 |
|
w 2 [10:5; 11) |
50 |
|
w 2 [11; 11:5) |
20 |
|
w 2 [11:5; 12) |
18 |
|
w 2 [12; 12:5) |
6 |
|
w 2 [12:5; 1) |
1 |
|
Таблица 4.14.
Продолжитель |
-Число людей, |
ность жизни, |
проживших |
w, лет |
w лет |
w 2 [14; 19) |
5 |
w 2 [19; 24) |
6 |
w 2 [24; 29) |
18 |
w 2 [29; 34) |
42 |
w 2 [34; 39) |
98 |
w 2 [39; 44) |
178 |
w 2 [44; 49) |
232 |
w 2 [49; 54) |
277 |
w 2 [54; 59) |
297 |
w 2 [59; 64) |
287 |
w 2 [64; 69) |
238 |
w 2 [69; 74) |
163 |
w 2 [74; 79) |
95 |
w 2 [79; 84) |
41 |
w 2 [84; 89) |
17 |
w 2 [89; 94) |
6 |
15. Среди студентов третьего курса (250 человек) был проведен тест по теории вероятностей, состоявший из 20 вопросов. Данные о количестве правильных ответов студентов приведены в таблице 4.15. Проверить гипотезу о распределении количества правильных ответов по биномиальному закону с уровнем значимости 0:02.
Таблица 4.15.
Число правильных отве- |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
26 |
16 |
17 |
18 |
19 |
тов, k |
|
|
|
|
|
|
|
|
|
|
|
|
Число студентов, дав- |
2 |
0 |
8 |
12 |
22 |
32 |
44 |
51 |
35 |
33 |
9 |
2 |
ших k правильных отве- |
|
|
|
|
|
|
|
|
|
|
|
|
тов |
|
|
|
|
|
|
|
|
|
|
|
|
30
16.В одном из родильных домов была собрана статистика о весе новорожденных мальчиков, родившихся в течение года. Данные о весе 400 детей приведены в файле таблице 4.16. Проверить гипотезу о нормальном распределении веса новорожденных мальчиков с уровнем значимости 0:01.
17.Оператор сотовой связи провел учет времени разговоров 500 своих абонентов по исходящей связи за одни сутки. Данные о длительности разговоров в таблице 4.17. Проверить гипотезу о длительности разговоров абонентов по исходящей связи по показательному закону с уровнем значимости 0:03.
Таблица 4.16.
Вес |
новорож- |
Число ново- |
|
денного, w, кг. |
рожденных, |
||
|
|
|
родившимся |
|
|
|
с весом w |
w 2 [2:5; 2:75) |
1 |
||
w 2 [2:75; |
3) |
1 |
|
w 2 [3; 3:25) |
15 |
||
w 2 [3:25; |
3:5) |
53 |
|
w 2 [3:5; 3:75) |
110 |
||
w 2 [3:75; |
4) |
112 |
|
w 2 [4; 4:25) |
66 |
||
w 2 |
[4:25; |
4:5) |
34 |
w 2 |
[4:5; 4:75) |
7 |
|
w 2 |
[4:75; |
5) |
1 |
Таблица 4.17.
Длительность |
Число абонен- |
вызова, w, |
тов, проговорив- |
мин. |
ших w мин. |
w 2 [0; 1) |
17 |
w 2 [1; 2) |
111 |
w 2 [2; 3) |
144 |
w 2 [3; 4) |
88 |
w 2 [4; 5) |
55 |
w 2 [5; 6) |
38 |
w 2 [6; 7) |
20 |
w 2 [7; 8) |
10 |
w 2 [8; 9) |
9 |
w 2 [9; 10) |
3 |
w 2 [10; 11) |
2 |
w 2 [11; 12) |
1 |
w 2 [12; 13) |
0 |
w 2 [13; 14) |
1 |
w 2 [14; 15) |
1 |
18.Опыт, состоящий в одновременном подбрасывании 5 монет повторили 150 раз. Данные о том, сколько "гербов" выпало при каждом из повторений опыта приведены в таблице 4.18. Проверить гипотезу о распределении числа одновременно выпадающих "гербов" по биномиальному закону с уровнем значимости 0:03.
19.В обувном магазине решили выявить наиболее ходовой размер женской обуви. Продавцы фиксировали размер каждой проданной пары обуви. Данные приведены в файле таблице 4.19. Проверить гипотезу о распределении предпочтений покупателей относительно размера обуви по закону Пуассона с уровнем значимости 0:04.
31
Таблица 4.18.
|
Число выпадений "герба" , k |
|
0 |
1 |
2 |
3 |
4 |
5 |
|
|||||
|
Количество испытаний, при кото- |
5 |
20 |
47 |
46 |
26 |
6 |
|
||||||
|
рых выпало k "гербов" |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица 4.19. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Размер обуви, k |
34 |
35 |
|
36 |
|
37 |
|
38 |
|
39 |
|
40 |
||
Число покупателей, приобретших |
2 |
8 |
|
14 |
|
21 |
|
37 |
|
25 |
|
8 |
||
k-й размер обуви |
|
|
|
|
|
|
|
|
|
|
|
|
|
20.Имеются данные о количестве электроэнергии, потребленной за 1 месяц жителями 500 квартир. Данные приведены в таблице 4.20. Проверить гипотезу о логнормальном распределении количества потребленной энергии с уровнем значимости 0:05.
21.Любительница бразильских сериалов стала записывать, сколько серий продолжался каждый из просмотренных ею фильмов. Данные о количестве серий в 120 сериалах приведены в таблице 4.21. Проверить гипотезу о распределении количества серий в сериалах по биномиальному закону с уровнем значимости q = 0:05.
Таблица 4.20. |
Таблица 4.21. |
Расход элек- |
Число потребите- |
троэнергии w, |
лей, израсход. w |
кВт/час |
кВт/час |
w 2 [250; 260) |
2 |
w 2 [260; 270) |
13 |
w 2 [270; 280) |
38 |
w 2 [280; 290) |
79 |
w 2 [290; 300) |
96 |
w 2 [300; 310) |
119 |
w 2 [310; 320) |
76 |
w 2 [320; 330) |
49 |
w 2 [330; 340) |
18 |
w 2 [340; 350) |
8 |
w 2 [350; 360) |
2 |
Количество се- |
Число |
се- |
рий, w |
риалов |
с |
|
количеством |
|
|
серий w |
|
w 2 [120; 125) |
45 |
|
w 2 [125; 130) |
29 |
|
w 2 [130; 135) |
17 |
|
w 2 [135; 140) |
12 |
|
w 2 [140; 145) |
9 |
|
w 2 [145; 150) |
4 |
|
w 2 [150; 155) |
3 |
|
w 2 [155; 160) |
0 |
|
w 2 [160; 165) |
1 |
|
22. Оператор сотовой связи ведет учет количества смс, отправленных за день ее абонентами. Данные о числе смс, отправленных 500 абонентами за 1 день приведены в таблице 4.22. Проверить гипотезу о распределении количества смс по закону Пуассона с уровнем значимости 0:01.
32
Таблица 4.22.
Количество смс, k |
0 |
1 |
2 |
3 |
4 |
5 |
Число абонентов, отправивших за |
142 |
200 |
103 |
39 |
13 |
3 |
день k-й смс |
|
|
|
|
|
|
23.На молочной ферме в течении месяца регистрировали удои коров.
Втаблице 4.23 приведены среднесуточные удои 120 коров. Проверить гипотезу о нормальном распределении удоев коров на молочной ферме с уровнем значимости 0:04.
24.На месторождении было взято 100 проб руды на содержание железа. Данные о процентном содержании железа в пробах приведены в таблице 4.24. Проверить гипотезу о распределении содержании железа в руде по логнормальному закону с уровнем значимости 0:05.
Таблица 4.23.
Среднесуточный |
Число коров |
||
удой, w, л |
|
с удоем w |
|
w 2 [10; 10:25) |
1 |
||
w 2 [10:25; |
10:5) |
5 |
|
w 2 [10:5; 10:75) |
8 |
||
w 2 [10:75; |
11) |
18 |
|
w 2 [11; 11:25) |
27 |
||
w 2 [11:25; |
11:5) |
22 |
|
w 2 |
[11:5; 11:75) |
16 |
|
w 2 |
[11:75; |
12) |
14 |
w 2 |
[12:25; |
12:5) |
1 |
w 2 |
[12:5; 12:75) |
2 |
Таблица 4.24.
Содержание |
|
Число проб с |
железа |
в |
содержанием |
руде w, % |
|
железа w |
w 2 [25; 30) |
|
1 |
w 2 [30; 35) |
|
4 |
w 2 [35; 40) |
|
13 |
w 2 [40; 45) |
|
25 |
w 2 [45; 50) |
|
28 |
w 2 [50; 55) |
|
13 |
w 2 [55; 60) |
|
10 |
w 2 [60; 65) |
|
5 |
w 2 [65; 70) |
|
1 |
25. В таблице 4.25 приведены результаты социологического опроса о том, сколько книг за год прочитал каждый из опрошенных (всего 1000 человек). Проверить гипотезу о распределении числа прочитанных по закону Пуассона с уровнем значимости 0:02.
Таблица 4.25.
Количество прочитан- |
0 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
ных книг, k |
|
|
|
|
|
|
|
|
|
|
|
Число опрошенных, про- |
58 |
138 |
209 |
241 |
172 |
99 |
53 |
17 |
10 |
2 |
1 |
читавших k книг |
|
|
|
|
|
|
|
|
|
|
|
33