Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МС лаб_работы.pdf
Скачиваний:
32
Добавлен:
17.03.2015
Размер:
3.45 Mб
Скачать

4. Проверка гипотезы о виде распределения

4.1Критерий согласия Пирсона. Проверка гипотезы о виде распределения

Пусть имеется выборка x = (x1; x2; : : : ; xn) из некоторого распределения F . Будем проверять гипотезу о принадлежности наблюдаемой в опыте случайной величины некоторому семейству распределений. То есть будем проверять сложную гипотезу H0 = fF 2 fF gg против сложной альтернативы H1 = fF 62Ff gg.

Чтобы воспользоваться критерием Пирсона, выборочные данные предварительно группируют. Разделим область выборочных данных на интервалы 1; 2; : : : ; k. Обозначим за j (j = 1; 2; : : : ; k) число элементов выборки, попавших в интервал j ( 1 + + k = n). Эмпирические вероятности попадания элементов выборки в j обозначим qj:

qj = nj ; j = 1; : : : ; k:

За pj( ) обозначим теоретические вероятности попадания значения случайной величины в интервал группировки j в случае, если выполняется гипотеза H0.

Составим статистику, характеризующую отклонение выборочных данных (вероятностей qj) от соответствующих гипотетических значений (pj):

2

= 2

( ) = n

n

(qj pj( ))2

:

n

n

 

 

pj( )

 

 

 

=1

 

 

 

Xj

Непосредственно использовать эту статистику для построения критерия нельзя - для начала надо исключить неопределенной, связанную с неизвестным параметром . Для этого поступают следующим образом - заменяют некоторой оценкой en = en(x), найденной по выборке x.

23

2

= 2

( n) = n

n

(qj pj( n))2

:

 

f

f e

Xj

e e

 

n

n

 

 

 

pj( n)

 

 

 

 

=1

 

 

 

Такую статистику уже можно однозначно вычислить для каждой заданной реализации выборки x.

Теорема 4.1 Если верна гипотеза H0 и l - размерность векторного параметра , то при фиксированном k и при n ! 1

f2n ! ;

где имеет распределение 2 с k l 1 степенями свободы.

Приведем схему использования критерия согласия 2:

1.По заданной выборке x найти оценку векторного параметра .

2.Найти теоретические вероятности попадания значений случайной величины в интервалы группировки j.

3.Вычислить значение статистики f2n

4.По заданному уровню значимости " найти пороговое значение статистики C" из условия 2k l 1(C") = 1 " = q.

5.Если f2n < C" то гипотезу H0 принимаем, иначе - отклоняем.

Замечание: Малочисленные частоты ( j < 5), следует объединить, объединив соответствующие интервалы группировки. Теоретические частоты следует вычислять уже после объединения интервалов. При определении числа степеней свободы в этом случае вместо k следует взять число интервалов, получившихся после объединения.

4.2Проверка гипотезы о виде распределения в Mathcad

Одной из полезных возможностей Mathcad является наличие встроенной функции для вычисления квантиля распределения 2. Это функция qchisq(p; d), где d - число степеней свободы, p - значение вероятности.

Приведем пример использования критерия 2 для проверки параметрической гипотезы о виде распределения.

Пусть имеется выборка объема n = 500 из некоторого распределения F . Требуется проверить гипотезу H0 = fF = 1; g. На рис. 4.1 приведен текст программы для проверки этой гипотезы с помощью критерия2. Обратите внимание на то, что так как один из параметров гаммараспределения уже задан, то по выборке оценивается только .

24

Задается объем выборки. Вектор, задающий выборку, считывается из файла

Определяются границы области выборочных данных

Определяется число интервалов группировки Формируется таблица частот: для i-го столбца

В 1-й строке записано начало интервала группировки Во 2-й строке - конец этого интервала

В3-й строке - число попаданий значений

вi-й интервал

Формируется новая таблица частот, в которой объединены интервалы группировки, количество попаданий в которые незначительны.

Методом моментов находится оценка параметра .

Находятся эмпирические частоты.

Находятся теоретические частоты.

В данном случае h < h , поэтому гипотеза о том, что случайная величина имеет гамма-распределение с пара-

метрами = 1; = 3:173 принимается

Рис. 4.1. Проверка гипотезы о том, что случайная величина имеет гаммараспределение 1;.

25

4.3Задание к лабораторной работе

C помощью критерия Пирсона проверить гипотезу о распределении случайной величины по указанному в вашем варианте закону.

Варианты заданий:

1.В ходе испытания 300 ламп накаливания была получена выборка, элементы которой - длительности их горения. Данные приведены в таблице 4.1. Проверить гипотезу о распределении времени горения ламп по показательному закону с уровнем значимости 0:05.

2.В тепличном хозяйстве проводился контроль урожайности томатов некоторого сорта. Было измерено, сколько томатов было собрано за сезон с каждого из 150 выбранных кустов. Полученные данные приведены в таблице 4.2. Проверить гипотезу о нормальном распределении урожайности с уровнем значимости 0:02.

Таблица 4.1.

Ресурс

 

Число ламп,

лампы,

w,

ресурс кото-

тыс.час.

 

рых составил

 

 

w

 

 

 

w 2 [0; 0:5)

 

185

w 2 [0:5; 1)

 

57

w 2 [1; 1:5)

 

32

w 2 [1:5; 2)

 

14

w 2 [2; 2:5)

 

6

w 2 [2:5; 3)

 

3

w 2 [3; 3:5)

 

2

w 2 [3:5; 4)

 

1

Таблица 4.2.

Урожай,

 

Число

ку-

собранный

 

стов, с

ко-

с куста

то-

торых

было

матов,

w,

собрано

w

кг

 

томатов

 

w 2 [9; 10)

 

18

 

w 2 [10; 11)

23

 

w 2 [11; 12)

13

 

w 2 [12; 13)

27

 

w 2 [13; 14)

27

 

w 2 [14; 15)

30

 

w 2 [15; 16)

12

 

3.Опыт, состоящий в одновременном подбрасывании пяти игральных костей, повторили 150 раз. Событие A в единичном испытании состоит

втом, что на кости выпало не более двух очков. Данные о том, сколько раз в каждом опыте повторилось событие А, приведены в таблице 4.3. Проверить гипотезу о распределении данной случайной величины по биномиальному закону с уровнем значимости 0:05.

4.В течение 4 месяцев (122 дня) в магазине вели статистику о количестве проданных за день буханок белого хлеба. Полученная выборка приведена в таблице 4.4. Проверить гипотезу о распределении количества проданных в день буханок по закону Пуассона с уровнем значимости 0:05.

26

Таблица 4.3.

Количество повторений события А в

0

1

2

3

4

5

рамках одного опыта, k

 

 

 

 

 

 

Количество опытов, в результате кото-

25

46

46

20

12

1

рых событие А повторялось k раз

 

 

 

 

 

 

5. По 110 магазинам города был проведен мониторинг цен на красную икру. В таблице 4.5 приведены цены за 100 граммов икры в каждом из магазинов (в рублях). Проверить гипотезу о нормальном распределении цен на икру с уровнем значимости 0:01.

Таблица 4.4.

Количество

Число

дней,

проданных

когда

было

булок хлеба,

продано

k

k

булок хлеба

k 2 [7; 9)

2

 

k 2 [9; 11)

8

 

k 2 [11; 13)

11

 

k 2 [13; 15)

18

 

k 2 [15; 17)

24

 

k 2 [17; 19)

27

 

k 2 [19; 21)

14

 

k 2 [21; 23)

10

 

k 2 [23; 25)

5

 

k 2 [25; 27)

2

 

k 2 [27; 29)

1

 

Таблица 4.5.

Стоимость 100

Число мага-

г. икры, w,

зинов, в кото-

руб.

рых икра сто-

 

ит w

w 2 [190; 192)

1

w 2 [192; 194)

4

w 2 [194; 196)

4

w 2 [196; 198)

12

w 2 [198; 200)

16

w 2 [200; 202)

23

w 2 [202; 204)

26

w 2 [204; 206)

19

w 2 [206; 208)

3

w 2 [208; 210)

2

6.В некоторой местности в течение 100 суток регистрировалась среднесуточная температура воздуха (в градусах Цельсия). В результате была получена выборка, приведенная в таблице 4.6. Проверить гипотезу о логнормальном распределении температуры воздуха с уровнем значимости 0:03.

7.В результате испытания 250 батареек на длительность их работы (в часах) в одинаковых плеерах была получена выборка, приведенная в таблице 4.7. Проверить гипотезу о распределении длительности работы батареек по показательному закону с уровнем значимости q = 0:03.

27

Таблица 4.6.

СреднесуточнаяЧисло

дней

температура

со

средне-

воздуха, w

суточной

 

температурой

 

w

 

w 2 [12; 13)

1

 

w 2 [13; 14)

7

 

w 2 [14; 15)

18

 

w 2 [15; 16)

23

 

w 2 [16; 17)

23

 

w 2 [17; 18)

21

 

w 2 [18; 19)

7

 

Таблица 4.7.

Длительность

Количество

работы

бата-

батареек, про-

рейки,

w,

работавших w

час.

 

час.

w 2 [5;

6)

14

w 2 [6;

7)

76

w 2

[7;

8)

88

w 2

[8;

9)

58

w 2

[9;

10)

12

w 2

[10; 11)

2

8. Опыт состоял в том, что человек одновременно вытягивал из четырех карточных колод (по 36 карт) по 1 карте и складывал их обратно. Опыт было повторен 120 раз и каждый раз подсчитывалось, сколько вынималось карт пиковой масти. Данные приведены в таблице 4.8. Проверить гипотезу о распределении исследуемой случайной величины по биномиальному закону с уровнем значимости 0:04.

Таблица 4.8.

Количество карт масти "пики" , k

0

1

2

3

4

Количество опытов, в результате кото-

38

48

23

10

1

рых из четырех колод было вынуто k

 

 

 

 

 

карт масти "пики"

 

 

 

 

 

9.В ходе школьного медицинского осмотра был измерен рост 200 первоклассников. Полученные данные приведены в таблице 4.9. Проверить гипотезу о распределении роста учеников по нормальному закону

суровнем значимости 0:05.

10.В результате взвешивания 300 бильярдных шаров была получена выборка, представленная в таблице 4.10. Проверить гипотезу о логнормальном распределении веса шаров с уровнем значимости 0:02.

11.Для проверки качества работы заводского оборудования было подсчитано количество нестандартных деталей, изготовленных каждым из 200 станков за неделю. Выборка приведена в таблице 4.11. С помощью критерия Пирсона проверить гипотезу о распределении количества нестандартных изделий по закону Пуассона с уровнем значимости 0:05.

28

Таблица 4.9.

Рост первоклас-

Число перво-

сника, w, см.

классников,

 

имеющих рост w

w 2 [118; 119)

1

w 2 [119; 120)

3

w 2 [120; 121)

2

w 2 [121; 122)

17

w 2 [122; 123)

13

w 2 [123; 124)

30

w 2 [124; 125)

38

w 2 [125; 126)

36

w 2 [126; 127)

30

w 2 [127; 128)

21

Таблица 4.10.

Вес

бильярд-

Количество

 

ного

шара w,

шаров

с

г.

 

весом w

 

w 2 [280; 281)

30

 

w 2 [281; 282)

26

 

w 2 [282; 283)

38

 

w 2 [283; 284)

40

 

w 2 [284; 285)

26

 

w 2 [285; 286)

28

 

w 2 [286; 287)

28

 

w 2 [287; 288)

23

 

w 2 [288; 289)

37

 

w 2 [289; 290)

24

 

Таблица 4.11.

Число нестандартных деталей, k

0

1

2

3

4

5

6

7

8

Количество станков, изготовив-

6

33

50

41

38

15

11

4

2

ших k нестандартных деталей

 

 

 

 

 

 

 

 

 

12. После поступления на склад 300 коробок стеклянных елочных игрушек кладовщик проверил, сколько игрушек в каждой коробке было повреждено в результате транспортировки. Результаты его проверки приведены в таблице 4.12. Проверить гипотезу распределении количества поврежденных игрушек в 1 коробке по закону Пуассона с уровнем значимости 0:05.

Таблица 4.12.

Число поврежденных игрушек, k

0

1

2

3

4

5

6

7

8

Число коробок с k поврежденны-

41

82

84

56

23

9

3

1

1

ми игрушками

 

 

 

 

 

 

 

 

 

13. Производителем компьютерной техники проводился мониторинг длительности безотказной работы жестких дисков, выпущенных им 15 лет назад. Было исследовано 300 жестких дисков, результаты представлены в таблице 4.13. Проверить гипотезу о распределении длительности безотказной работы дисков по показательному закону с уровнем значимости 0:02.

29

14. Была собрана статистика о продолжительности жизни жителей одного из пригородов Красноярска. Данные о продолжительности жизни 2000 человек приведены в таблице 4.14. Проверить гипотезу о распределении продолжительности жизни красноярцев по логнормальному закону с уровнем значимости 0:02.

Таблица 4.13.

Длительность

Число

жест-

безотказной

ких дисков,

работы w,

прорабо-

лет

тавших

w

 

лет

 

w 2 [6; 6:5)

1

 

w 2 [6:5; 7)

1

 

w 2 [7; 7:5)

0

 

w 2 [7:5; 8)

6

 

w 2 [8; 8:5)

6

 

w 2 [8:5; 9)

20

 

w 2 [9; 9:5)

64

 

w 2 [9:5; 10)

49

 

w 2 [10; 10:5)

58

 

w 2 [10:5; 11)

50

 

w 2 [11; 11:5)

20

 

w 2 [11:5; 12)

18

 

w 2 [12; 12:5)

6

 

w 2 [12:5; 1)

1

 

Таблица 4.14.

Продолжитель

-Число людей,

ность жизни,

проживших

w, лет

w лет

w 2 [14; 19)

5

w 2 [19; 24)

6

w 2 [24; 29)

18

w 2 [29; 34)

42

w 2 [34; 39)

98

w 2 [39; 44)

178

w 2 [44; 49)

232

w 2 [49; 54)

277

w 2 [54; 59)

297

w 2 [59; 64)

287

w 2 [64; 69)

238

w 2 [69; 74)

163

w 2 [74; 79)

95

w 2 [79; 84)

41

w 2 [84; 89)

17

w 2 [89; 94)

6

15. Среди студентов третьего курса (250 человек) был проведен тест по теории вероятностей, состоявший из 20 вопросов. Данные о количестве правильных ответов студентов приведены в таблице 4.15. Проверить гипотезу о распределении количества правильных ответов по биномиальному закону с уровнем значимости 0:02.

Таблица 4.15.

Число правильных отве-

8

9

10

11

12

13

14

26

16

17

18

19

тов, k

 

 

 

 

 

 

 

 

 

 

 

 

Число студентов, дав-

2

0

8

12

22

32

44

51

35

33

9

2

ших k правильных отве-

 

 

 

 

 

 

 

 

 

 

 

 

тов

 

 

 

 

 

 

 

 

 

 

 

 

30

16.В одном из родильных домов была собрана статистика о весе новорожденных мальчиков, родившихся в течение года. Данные о весе 400 детей приведены в файле таблице 4.16. Проверить гипотезу о нормальном распределении веса новорожденных мальчиков с уровнем значимости 0:01.

17.Оператор сотовой связи провел учет времени разговоров 500 своих абонентов по исходящей связи за одни сутки. Данные о длительности разговоров в таблице 4.17. Проверить гипотезу о длительности разговоров абонентов по исходящей связи по показательному закону с уровнем значимости 0:03.

Таблица 4.16.

Вес

новорож-

Число ново-

денного, w, кг.

рожденных,

 

 

 

родившимся

 

 

 

с весом w

w 2 [2:5; 2:75)

1

w 2 [2:75;

3)

1

w 2 [3; 3:25)

15

w 2 [3:25;

3:5)

53

w 2 [3:5; 3:75)

110

w 2 [3:75;

4)

112

w 2 [4; 4:25)

66

w 2

[4:25;

4:5)

34

w 2

[4:5; 4:75)

7

w 2

[4:75;

5)

1

Таблица 4.17.

Длительность

Число абонен-

вызова, w,

тов, проговорив-

мин.

ших w мин.

w 2 [0; 1)

17

w 2 [1; 2)

111

w 2 [2; 3)

144

w 2 [3; 4)

88

w 2 [4; 5)

55

w 2 [5; 6)

38

w 2 [6; 7)

20

w 2 [7; 8)

10

w 2 [8; 9)

9

w 2 [9; 10)

3

w 2 [10; 11)

2

w 2 [11; 12)

1

w 2 [12; 13)

0

w 2 [13; 14)

1

w 2 [14; 15)

1

18.Опыт, состоящий в одновременном подбрасывании 5 монет повторили 150 раз. Данные о том, сколько "гербов" выпало при каждом из повторений опыта приведены в таблице 4.18. Проверить гипотезу о распределении числа одновременно выпадающих "гербов" по биномиальному закону с уровнем значимости 0:03.

19.В обувном магазине решили выявить наиболее ходовой размер женской обуви. Продавцы фиксировали размер каждой проданной пары обуви. Данные приведены в файле таблице 4.19. Проверить гипотезу о распределении предпочтений покупателей относительно размера обуви по закону Пуассона с уровнем значимости 0:04.

31

Таблица 4.18.

 

Число выпадений "герба" , k

 

0

1

2

3

4

5

 

 

Количество испытаний, при кото-

5

20

47

46

26

6

 

 

рых выпало k "гербов"

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 4.19.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Размер обуви, k

34

35

 

36

 

37

 

38

 

39

 

40

Число покупателей, приобретших

2

8

 

14

 

21

 

37

 

25

 

8

k-й размер обуви

 

 

 

 

 

 

 

 

 

 

 

 

 

20.Имеются данные о количестве электроэнергии, потребленной за 1 месяц жителями 500 квартир. Данные приведены в таблице 4.20. Проверить гипотезу о логнормальном распределении количества потребленной энергии с уровнем значимости 0:05.

21.Любительница бразильских сериалов стала записывать, сколько серий продолжался каждый из просмотренных ею фильмов. Данные о количестве серий в 120 сериалах приведены в таблице 4.21. Проверить гипотезу о распределении количества серий в сериалах по биномиальному закону с уровнем значимости q = 0:05.

Таблица 4.20.

Таблица 4.21.

Расход элек-

Число потребите-

троэнергии w,

лей, израсход. w

кВт/час

кВт/час

w 2 [250; 260)

2

w 2 [260; 270)

13

w 2 [270; 280)

38

w 2 [280; 290)

79

w 2 [290; 300)

96

w 2 [300; 310)

119

w 2 [310; 320)

76

w 2 [320; 330)

49

w 2 [330; 340)

18

w 2 [340; 350)

8

w 2 [350; 360)

2

Количество се-

Число

се-

рий, w

риалов

с

 

количеством

 

серий w

 

w 2 [120; 125)

45

 

w 2 [125; 130)

29

 

w 2 [130; 135)

17

 

w 2 [135; 140)

12

 

w 2 [140; 145)

9

 

w 2 [145; 150)

4

 

w 2 [150; 155)

3

 

w 2 [155; 160)

0

 

w 2 [160; 165)

1

 

22. Оператор сотовой связи ведет учет количества смс, отправленных за день ее абонентами. Данные о числе смс, отправленных 500 абонентами за 1 день приведены в таблице 4.22. Проверить гипотезу о распределении количества смс по закону Пуассона с уровнем значимости 0:01.

32

Таблица 4.22.

Количество смс, k

0

1

2

3

4

5

Число абонентов, отправивших за

142

200

103

39

13

3

день k-й смс

 

 

 

 

 

 

23.На молочной ферме в течении месяца регистрировали удои коров.

Втаблице 4.23 приведены среднесуточные удои 120 коров. Проверить гипотезу о нормальном распределении удоев коров на молочной ферме с уровнем значимости 0:04.

24.На месторождении было взято 100 проб руды на содержание железа. Данные о процентном содержании железа в пробах приведены в таблице 4.24. Проверить гипотезу о распределении содержании железа в руде по логнормальному закону с уровнем значимости 0:05.

Таблица 4.23.

Среднесуточный

Число коров

удой, w, л

 

с удоем w

w 2 [10; 10:25)

1

w 2 [10:25;

10:5)

5

w 2 [10:5; 10:75)

8

w 2 [10:75;

11)

18

w 2 [11; 11:25)

27

w 2 [11:25;

11:5)

22

w 2

[11:5; 11:75)

16

w 2

[11:75;

12)

14

w 2

[12:25;

12:5)

1

w 2

[12:5; 12:75)

2

Таблица 4.24.

Содержание

 

Число проб с

железа

в

содержанием

руде w, %

 

железа w

w 2 [25; 30)

 

1

w 2 [30; 35)

 

4

w 2 [35; 40)

 

13

w 2 [40; 45)

 

25

w 2 [45; 50)

 

28

w 2 [50; 55)

 

13

w 2 [55; 60)

 

10

w 2 [60; 65)

 

5

w 2 [65; 70)

 

1

25. В таблице 4.25 приведены результаты социологического опроса о том, сколько книг за год прочитал каждый из опрошенных (всего 1000 человек). Проверить гипотезу о распределении числа прочитанных по закону Пуассона с уровнем значимости 0:02.

Таблица 4.25.

Количество прочитан-

0

1

2

3

4

5

6

7

8

9

10

ных книг, k

 

 

 

 

 

 

 

 

 

 

 

Число опрошенных, про-

58

138

209

241

172

99

53

17

10

2

1

читавших k книг

 

 

 

 

 

 

 

 

 

 

 

33