Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ТЕРВЕР.doc
Скачиваний:
25
Добавлен:
14.11.2019
Размер:
15.55 Mб
Скачать

§2. Решение типовых задач (проверка гипотезы о виде распределения генеральной совокупности. Критерий Пирсона )

Постановка задачи

Пусть x1,x2,…xn – выборка наблюдений случайной величины Х. Проверяется гипотеза : Х имеет распределение F(x).

Проверка гипотезы при помощи критерия осуществляется по следующей схеме:

  1. Если есть неизвестные параметры, то по выборке находят точечные оценки этих параметров (метод моментов, метод максимального правдоподобия или другие известные методы).

  2. Область возможных значений Х разбивают на “k” множеств (если Х – дискретная СВ – то это значения СВ, если Х – непрерывная СВ – то это интервалы).

  3. Пусть - число элементов выборки, принадлежащих множеству i ( ).

  4. Используя предполагаемый закон распределения Х находят вероятности . ={Xi} i=1,2,…,k. ( ). Все данные заносятся в таблицу. Выборочное значение статистики критерия вычисляется по формуле

  5. Задается уровень значимости  и вычисляется критическая точка – порог испытаний: - квантиль распределения порядка (1-), где r (число степеней свободы)=k-1-l (k – число интервалов, l – число неизвестных параметров).

  6. Строим критическую область

Правило принятия решения: Если , то гипотезу Но о виде распределения СВ Х принимаем на уровне значимости , а в противном случае – отвергаем.

Задача 1 (см. задача №1 «Точечные оценки»)

Х имеет распределение, заданное таблицей. Неизвестные параметры a и b. Точечные оценки: (n=50).

-1

0

2

4

2a

a

b

1-3a-b

0,32

0,16

0,43

0,09

15

10

20

5

: Х – имеет данное распределение. Проверить данную гипотезу на уровне значимости =0,1, используя критерий согласия Пирсона.

Заполним следующую таблицу:

n

1

-1

0,32

15

16

0,0625

2

0

0,16

10

8

0,5

3

2

0,43

20

21,5

0,07

4

4

0,09

5

4,5

0,05


  1. Найдем число степеней свободы: r =k-1-l (k(число интервалов)=4, l(число неизвестных параметров)=2) r=1.

  2. Н айдем порог испытания (квантиль распределения .

  3. Строим критическую область:

  1. Правило принятия решения: Т.к. (0,68<2,71), то гипотезу на уровне значимости =0,1 принимаем.

Задача 2 (Биномиальное распределение см. задачу №2 «Точечные оценки»)

А – шкатулка с деньгами была отгадана. Р(А)=р. Была получена оценка (n=20). Но: проверить гипотезу о биномиальном распределении на уровне значимости =0,1 (неизвестен один параметр, т.е. l=1).

Составим таблицу:

n

1

0

6

6,86

0,1

2

1

9

8,82

0,0037

3

2

4

3

4,32

,78

0,1

4

3

1

0,54


  1. Найдем число степеней свободы: r =k-1-l (k(число интервалов)=3, l(число неизвестных параметров)=1) r=1.

  2. Н айдем порог испытания (квантиль распределения .

  3. Строим критическую область:

  1. Правило принятия решения: Т.к. (0,2<2,71), то гипотезу о биномиальном распределении на уровне значимости =0,1 принимаем.

Задача 3 (Распределение Пуассона см. задачу №3 «Точечные оценки»)

Была получена точечная оценка параметра : ( - количество ошибок в одном пакете) при n=100 (неизвестен один параметр, т.е. l=1).

: на уровне значимости =0,1 проверить гипотезу о том, что Х – имеет распределение Пуассона.

Составим таблицу:

n

1

0

22

20

0,2

2

1

30

32

0,125

3

2

25

26

0,038

4

3

15

14

0,07

5

4

5

5 ,6

1,125

6

5

2

1,8

7

6

1

0,6


  1. Найдем число степеней свободы: r =k-1-l (k(число интервалов)=5, l(число неизвестных параметров)=1) r=3.

  2. Н айдем порог испытания (квантиль распределения .

  3. Строим критическую область:

  1. Правило принятия решения: Т.к. (1,558<6,25), то гипотезу Но о распределении Пуассона на уровне значимости =0,1 принимаем.

Задача 4 (дискретное равномерное распределение)

На экзамене студент отвечает только на один вопрос по одной из трех частей курса «Теории вероятности». Экзамен сдавали 60 студентов, при этом : 23 студента получили вопрос из I части, 15 студентов получили вопрос из II части, 22 студента получили вопрос из III части. Можно ли утверждать, что студент, идущий на экзамен, с равной вероятностью получит вопрос из любой части.

Проверяем гипотезу : равномерное распределение (дискретное). Пусть уровень значимости =0,1. Используем критерий .

Составим таблицу:

n

1

I часть

1/3

23

20

0,45

2

II часть

1/3

15

20

1,25

3

III часть

1/3

22

20

0,2


  1. Найдем число степеней свободы: r =k-1-l (k(число интервалов)=3, l(число неизвестных параметров)=0) r=2.

  2. Найдем порог испытания (квантиль распределения .

  3. С троим критическую область:

  1. Правило принятия решения: Т.к. (1,9<4,61), то гипотезу Но на уровне значимости =0,1 принимаем.

Задача 5 (равномерное распределение на отрезке)

Наблюдалось следующее распределение по минутам числа появлений на остановке автобуса, имеющего пятиминутный интервал движения.

Интервал в минутах

Число появлений автобуса

[0;1)

35

[1;2)

34

[2;3)

38

[3;4)

36

[4;5)

42

Проверить гипотезу о равномерном распределении (при =0,05)

:

Примечание:

По предположению: a=0 и b=5

Составим таблицу (n=185):

Границы интервалов

n

1

[0;1]

35

37

4/37

2

[1;2)

34

37

9/37

3

[2;3)

38

37

1/37

4

[3;4)

36

37

1/37

5

[4;5]

42

37

25/37


  1. Найдем число степеней свободы: r =k-1-l (k(число интервалов)=5, l(число неизвестных параметров)=0) r=4.

  2. Найдем порог испытания (квантиль распределения .

  3. Строим критическую область:

  1. Правило принятия решения: Т.к. (1,08<9,49), то нет оснований отклонить гипотезу о равномерном распределении Х на [0;5].

Задача 6 (показательное распределение)

Срок службы батареек для слуховых аппаратов - это случайная величина Х. : Х – имеет показательное распределение с параметром . Для нахождения точечной оценки параметра  была составлена группированная выборка ( - число работающих батареек в течении четырех месяцев). N=200.

Границы интервалов

- середины интервалов

1

[0;4)

2

115

2

[4;8)

6

50

3

[8;12)

10

20

4

[12;16)

14

10

5

[16;20]

18

5


Используем метод моментов для нахождения точечной оценки :

  • Составляем уравнение :

=0,05

H o:

Примечание:

Составим таблицу:

Границы интервалов

n

1

[0;4)

115

110

0,227

2

[4;8)

50

48

0,083

3

[8;12)

20

24

0,66

4

[12;16)

10

10

0

5

[16;∞]

5

8

1,125

  1. Найдем число степеней свободы: r =k-1-l (k(число интервалов)=5, l(число неизвестных параметров)=1) r=3.

  2. Найдем порог испытания (квантиль распределения .

  3. Строим критическую область:

  1. Правило принятия решения: Т.к. (2,1<7,81), то нет оснований отклонить гипотезу о показательном распределении.

Задача 7 (Нормальное распределение)

В нескольких школах сделали случайную выборку школьниц (n=100) и измерили их рост. Х – рост девушек в возрасте 16 лет (см).

Была составлена следующая группированная выборка:

Границы интервалов

- середины интервалов

1

[140;144)

142

2

2

[144;148)

146

4

3

[148;152)

150

10

4

[152;156)

154

14

5

[156;160]

158

25

6

[160;164)

162

35

7

[164;168)

166

8

8

[168;172]

170

2


Выдвигается гипотеза: : .

Т.к. параметры неизвестны, то найдем точечные оценки по методу моментов:

  • Составляем уравнение:

: =0,05

Составим таблицу

интервалы

n

1

[ -∞;144)

0,006

2

0 ,6

0,42

2

[144;148)

0,029

4

2,9

3

[148;152)

0,101

10

10,1

4

[152;156)

0,216

14

21,6

2,67

5

[156;160)

0,281

25

28,1

0,34

6

[160;164)

0,22

35

2

7,68

7

[164;168)

0 ,109

8

1 0,9

1,5

8

[168;+∞)

0,038

2

3,8

  1. Найдем число степеней свободы: r =k-1-l (k(число интервалов)=5, l(число неизвестных параметров)=2) r=2.

  2. Найдем порог испытания (квантиль распределения .

  3. Строим критическую область:

  1. Правило принятия решения: Т.к. (12,6>5,99), то гипотезу о нормальном распределении Х отвергаем на уровне =0,05.

Задача 8( распределение Парето)

Проводилось исследование величины доходов Х населения поселка N выше фиксированного уровня xo =3(минимальная заработная плата).

Была сделана выборка объема n=50 и составлена группированная выборка. Выдвигается гипотеза : Х – имеет распределение Парето.

Т.к. параметр  неизвестен, то найдем точечную оценку, используя метод моментов.

Границы интервалов

- середины интервалов

1

[3;3,4)

3,2

20

2

[3,4;3,8)

3,6

15

3

[3,8;4,2)

4,0

8

4

[4,2;4,6)

4,4

4

5

[4,6;5,0]

4,8

2

6

[5,0;5,4)

5,2

1


По методу моментов найдем точечную оценку параметра :

  • Составляем уравнение :

На уровне значимости 0,05 проверить гипотезу :

Примечание:

Вычисляем вероятности попадания в данные интервалы:

интервалы

n

1

[3;3,4)

0,504

20

25,2

1,07

2

[3,4;3,8)

0,23

15

11,5

1,06

3

[3,8;4,2)

0,116

8

5,8

0,83

4

[4,2;4,6)

0,06

4

3

0,03

5

[4,6;5,0)

0,033

2

1

7,5

,65

6

[5;+∞)

0,057

1

2,85

  1. Найдем число степеней свободы: r =k-1-l (k(число интервалов)=4, l(число неизвестных параметров)=2) r=2.

  2. Найдем порог испытания (квантиль распределения .

  3. Строим критическую область:

  1. Правило принятия решения: Т.к. (2,99<5,99), то нет оснований отвергнуть гипотезу о том, что величина доходов населения выше уровня 3 минимальных зарплат распределена по закону Парето.

Задача 8

Пусть СВ Х имеет следующее распределение:

Найти:

  1. Точечные оценки параметров a и k по случайной выборке по методу максимального правдоподобия

  2. Точечные оценки по данной группированной выборке

  3. Проверить гипотезу : Х имеет данное распределение (при  =0,05).

Решение

  1. Найдем формулу связи между параметрами, используя основное свойство функции плотности:

Используем метод максимального правдоподобия:

  • (Х1,Х2,…Хn) – случайная выборка. Составим функцию правдоподобия:

  • Необходимое условие экстремума:

  • Для дальнейших вычислений нам понадобится функция распределения F(x)=