Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Математическая_Статистика_КР8

.pdf
Скачиваний:
70
Добавлен:
12.06.2015
Размер:
1.96 Mб
Скачать

37

ni n .

i 1

С помощью критерия Пирсона можно проверить гипотезу о различных законах распределения генеральной совокупности (равномерном, нормальном, показательном и др.)

Схема применения критерия 2 для проверки гипотезы H 0 сводится к следующему.

1. Формулируют основную гипотезу H 0 , которая заключается в том, что

исследуемая случайная величина X подчиняется определенному закону распределения.

2.По результатам наблюдений находят оценки неизвестных параметров этой модели (допустим, что их число равно r).

3.Вместо неизвестных параметров подставляют в модель закона найденные

оценки.

4.В результате предполагаемая модель закона оказывается полностью оп-

ределенной и,

используя ее, рассчитывают вероятности p теор

P( X x ) , того,

 

 

 

 

 

i

i

что случайная величина X примет зафиксированные в наблюдениях значения

xi , i 1,2,...,

. Эти вероятности называют теоретическими.

 

5. Находят теоретические частоты

n

np теор .

 

 

 

 

 

i

i

 

6. В качестве критерия выбирается случайная величина

 

 

2

(ni ni )

2

,

 

(6.16)

 

 

 

 

 

 

ni

 

 

 

 

 

 

 

 

 

имеющая закон распределения

2 с числом степеней свободы k =

– 1 – r, где

– число частичных интервалов выборки или вариант, r – число параметров предполагаемого распределения.

7. Критическая область выбирается правосторонней, и граница ее при за-

данном уровне значимости α

кр2 ( , k) находится по таблице критических точек

распределения

2 (см. приложение 4).

Это значит,

что если 2

кр2 ( , k) , то гипотеза H 0 отвергается, в против-

ном случае принимается.

 

Замечание: Критерий согласия Пирсона можно использовать лишь в том

случае, когда ni

5. Если в какой-нибудь группе вариационного ряда это усло-

вие не выполняется, то имеет смысл объединить две соседние группы, так поступают до тех пор, пока для каждой новой группы не будет выполняться неравенство ni 5.

38

Приведем некоторые факты, необходимые для построения теоретического распределения по опытным данным.

Пусть по выборке объема n получен дискретный статистический ряд:

Варианты

x1

x2

...

x

Частоты

n1

n2

...

n

 

 

 

 

 

Проверки гипотезы о биномиальном законе распределения

◄ Для проверки гипотезы о биномиальном распределении генеральной совокуп-

 

 

 

 

 

 

 

 

 

x

ности в качестве оценки параметра p принимается p

 

 

, где m – число испыта-

 

m

ний

в

одном

 

опыте.

Тогда теоретические

частоты ni n pi , где

pi

i i

 

n

i

, i 1,2,...,

. Биномиальное распределение определяется одним

Сn p

(1 p)

 

 

параметром, поэтому число степеней свободы

k

 

2 . ►

Проверки гипотезы о законе распределения Пуассона

◄ Для проверки гипотезы о распределении генеральной совокупности по закону

Пуассона в качестве оценки параметра

принимается

x . Тогда теоретические

 

 

i

 

 

 

 

 

частоты ni

n pi , где pi

 

e , i

1,2,..., . Пуассоновское распределение оп-

i!

 

 

 

 

 

 

 

ределяется одним параметром, поэтому число степеней свободы

k

2 . ►

Пусть по выборке объема n получен интервальный статистический ряд:

Номер интервала

Границы

Абсолютные

 

интервала

частоты

1

[ x0 ; x1 )

n1

2

[ x1 ; x2 )

n2

i

[ xi 1 ; xi )

ni

 

[ x 1 ; x )

n

Проверки гипотезы о нормальном законе распределения

◄ Для проверки гипотезы о нормальном распределении генеральной совокупно-

сти в качестве оценок параметров a и

 

 

 

 

 

 

 

 

х

и

принимается соответственно a

 

2

s

2

. Для n

n p , где n – объем выборки, p

i

0

xi 1

x

0

xi

x

,

x

 

 

 

 

 

 

 

 

 

 

 

i

i

 

s

s

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и xi

1 – левая и правая границы i-го интервала ( i

 

1,2,..., ),

x - выборочное сред-

 

 

 

 

 

 

 

нее,

s

 

 

s 2

выборочное среднее квадратическое отклонение. Поскольку нор-

39

мальное распределение характеризуется двумя параметрами, число степеней свободы k 3 . ►

Проверки гипотезы о показательном законе распределения

◄ Для проверки гипотезы о показательном распределении генеральной совокуп-

ности в качестве оценки параметра λ принимается

 

1

. Тогда теоретические

 

 

 

х

 

 

 

 

 

 

 

 

 

 

 

 

частоты ni

n pi , где pi

вычисляется как разность значений функции распреде-

ления

на

концах

интервала:

p

F(x

1

)

F(x ) e

xi

 

e xi 1 , если x 0 и

 

 

 

 

 

i

i

 

i

 

 

i

xi 1

0 ( i

1,2,...,

). Если xi

0 ( i

0,1,2,...,

), то F(xi )

0.

 

Показательное распределение определяется одним параметром, поэтому

число степеней свободы

k

 

2 . ►

 

 

 

 

 

 

Проверки гипотезы о равномерном законе распределения

◄ Для проверки гипотезы о равномерном распределении генеральной совокупности концы интервала, в котором наблюдались возможные значения Х, оценива-

ются

по

 

формулам:

 

 

 

 

 

 

 

 

 

 

 

или

 

 

x 3

x

3

s

 

 

a

s; b

 

 

 

 

 

max{x1, x2

,..., xn}.

 

 

 

 

 

 

 

 

 

 

 

a min{x1, x2 ,..., xn };

b

 

 

 

 

 

 

 

 

 

 

 

 

Тогда

 

теоретические

 

частоты

 

ni

n

pi ,

где

 

 

 

 

(xi

1

xi )

 

 

 

 

 

 

 

 

 

 

 

 

 

pi

F (xi 1)

F (xi )

 

 

 

; i

2,3,...,

,

если и

xi 1 лежат внутри интервала

 

 

 

 

b

a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, то F(xi )

 

 

, то F(xi )

 

 

 

 

 

 

 

[a;b ]. Если

xi a

0, если xi b

1 ( i

0,1,2,..., ).

 

Число степеней свободы k 2 , так как равномерное распределение оценивается двумя параметрами. ►

Пример 6.5. Для выборки, интервальный статистический ряд которой имеет вид

Номер интервала

Границы интервала

Эмпирические частоты

 

 

 

 

1

2

– 5

1

 

 

 

 

2

5

– 8

8

 

 

 

3

8 – 11

20

 

 

 

 

4

11

– 14

22

 

 

 

 

5

14

– 17

14

 

 

 

 

6

17

– 20

5

 

 

 

 

Проверить при уровне значимости α = 0,05 гипотезу о: а) показательном; б) равномерном; в) нормальном

законе распределения генеральной совокупности с помощью критерия Пирсона.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Объем выборки n = 70. Будем считать вариантами середины частичных ин-

тервалов: x1 = 3,5, x2 = 6,5,…, x6

= 18,5.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдем x = 11,86; s 2

= 11,97; s = 3,46.

 

 

 

 

 

 

 

 

 

 

 

 

а) Вычислим теоретические частоты в предположении о показательном рас-

пределении генеральной совокупности при

 

 

1

 

 

0,084 :

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11,86

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

70 e 0,084 2

 

e 0,084 5

13,21;

 

 

 

 

аналогично

 

n

10,26;

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

n3

8;

 

n4

6,2;

n5

4,8;

n6

3,73. Поскольку n6

3,73

5 укрупняем интервалы

(число

 

интервалов

становится

равным

 

5) и получаем n1

13,21; n2

10,26;

n3

8;

 

n4

6,2;

n5

8,53;.

 

 

 

 

 

Наблюдаемое

 

 

 

значение

 

критерия

2

 

(6

13,21)2

 

 

 

...

(19

8,53)2

83,19.

Критическая точка

2 (0,05;3)=7,81;

набл

 

 

13,21

 

 

 

 

 

 

 

 

 

 

 

8,53

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

набл

 

 

кр , и гипотеза о показательном распределении отклоняется.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

11,43

 

 

3 4,05 4,45;

 

 

 

б) Для равномерного распределения a

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Теоретические частоты:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

11,43

3 4,05

 

 

18,41.

 

 

 

 

 

n1

70 (F(5)

F(2))

70 (

 

 

5

4,45

 

0)

70 0,0394

2,76 ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18,41

 

4,45

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ni '

70

pi

70

 

 

 

 

 

 

 

 

3

 

 

 

 

 

15,04;

 

i

2,3,...,5,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18,41

4,45

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

70 (F(20)

 

F(17))

70 (1

17

4,45

)

70 0,1

7 .

 

 

 

 

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

18,41

4,45

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку n1

2,76

 

 

 

5 укрупняем первый интервал и получаем

n1

17,8 ,

ni '

15,04;

i

2,3,4,

 

 

 

 

n5

 

7 .

 

 

 

 

 

Наблюдаемое

 

 

значение

критерия

2

 

(9

15,04)2

 

 

 

...

(5

 

7)2

 

8,24.

 

Критическая

точка

2 (0,05;2)

5,99;

набл

 

 

15,04

 

 

 

 

 

 

 

 

 

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

набл

 

 

кр , и гипотеза о равномерном распределении отклоняется.

 

 

 

в) Теоретические частоты для нормального распределения:

 

 

 

 

n1

70

 

5

11,86

 

 

 

 

2

11,86

 

1,5 .

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3,46

 

 

 

 

 

 

3,46

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так

же

 

вычисляются

 

 

Укрупняем интервалы и получаем n1

9,1,

n2

18,9;

n3

23; n4

 

 

18.

 

 

 

 

 

 

Наблюдаемое

 

 

 

значение

 

критерия

41

2

(9

9,1)2

...

(19

18)

2

0,165 Критическая точка

2 (0,05; 1) 3,84.

набл

 

9,1

 

 

 

18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Поскольку

2

 

2

 

гипотеза о нормальном распределении

генеральной сово-

набл

кр ,

купности принимается. ►

Приведем примеры проверки гипотезы о законе распределения случайной величины с помощью критерия Пирсона, выполненной средствами Microsoft Excel.

Пример 6.6. По успеваемости 100 студентов-заочников, которые сдавали 4 экза-

мена получена выборка. Необходимо проверить гипотезу о биномиальном законе распределения случайной величины.

Решим поставленную задачу с помощью Microsoft Excel.

1. В новой рабочей книге сгенерируем выборку с помощью Пакета анализа (Сер-

вис/Анализ данных/Генерация случайных чисел). Понятно, что необходимо гене-

рировать значения случайной величины, имеющей биномиальное распределение.

Зададим вероятность успеха в одном испытании равной 0,8 (см. рис.6.1).

Рисунок 6.1.

Далее считаем, что полученная последовательность – выборка объемом n=100, характеризующая успеваемости 100 студентов-заочников, каждый из кото-

рых сдавал 4 экзамена. X — случайная величина равная числу сданных экзаменов одним студентом.

42

2. Выдвигаем основную гипотезу H 0 : исследуемая случайная величина X имеет биномиальный закон распределения.

3. Далее выполняем шаги согласно схеме предложенной выше. Получаем лист

Excel, представленный на рис.6.2. На рис.6.3 представлен лист Excel с формулами.

Обратите внимание, что диапазон F20:F24 содержит формулу массива. Описа-

тельную статистику выполняем с помощью Пакета анализа (Сервис/Анализ дан-

ных/Описательная статистика).

При вычислении критерия число групп уменьшилось (почему?), число сте-

пеней свободы критерия вычислили с.о.: число групп минус один параметр минус единица, получили что число степеней свободы равно1. Задали уровень значимо-

сти равный 0,05.

 

Поскольку 2

кр2 ( , k) , основную гипотезу H 0 о виде распределения

принимаем.

Пример 6.7. По данным выборочного обследования получена выборка среднеду-

шевого дохода населения в тыс. рублей. Необходимо проверить гипотезу о нор-

мальном законе распределения случайной величины.

Решим поставленную задачу с помощью Microsoft Excel.

1. В новой рабочей книге сгенерируем выборку с помощью Пакета анализа (см.

рис.6.4). Будем считать, что СВ X — среднедушевой доход населения подчиняет-

ся нормальному закону распределения.

Далее считаем, что полученная выборка объемом n=100 характеризует среднедушевой доход населения.

2. Выдвигаем основную гипотезу H 0 : исследуемая случайная величина X имеет нормальный закон распределения.

43

1. Выполняем описательную статистику

2. Находим оценку параметра распределения

3.Определяем варианты

4.Находим

абсолютные

частоты

Рисунок 6.2.

5. Находим теоретическую вероятность

6. Находим теоретическую частоту

7. Находим значения критерия

8. Иллюстрируем полученный результат

=ХИ2ОБР(D21;1)

Рисунок 6.3.

44

Рисунок 6.4.

3. Далее выполняем шаги согласно схеме предложенной выше. Получаем лист

Excel, представленный на рис.6.5 и на рис.6.6 представлен лист Excel с формула-

ми.

Оценки параметров нормального распределения находятся в таблице Описатель-

ная статистика (Сервис/Анализ данных/Описательная статистика).

Заметим, что при получении теоретической вероятности для интервального стати-

стического ряда вычисляется вероятность попадания в интервал по формуле

P( a X b ) F( b ) F( a ) .

Обратите внимание, что диапазон G7:G15 содержит формулу массива.

При вычислении критерия диапазоны число групп уменьшилось (почему?), число степеней свободы критерия вычислили с.о.: число групп-два параметра-1, полу-

чили что число степеней свободы равно 3. Задали уровень равный 0,05.

Поскольку 2

2

(

,k ), основную гипотезу H

0

о виде распределения принима-

 

кр

 

 

 

ем.

3. Записываем границы интервалов

45

1. Вы-

полняем описательную статистику

Рисунок 6.5.

2. Находим интервальный статистический ряд

5.Находим

теоретическую вероятность.

6.Находим

теоретическую

частоту.

4. Находим интегральную функцию распределения на концах интервалов

7. Рассчитываем критерий

46

Рисунок 6.6.