Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

2003_-_Gmurman__TV_i_MS

.pdf
Скачиваний:
19
Добавлен:
27.03.2015
Размер:
16.8 Mб
Скачать

Если Uнаб.1l >-И"р-нет оснований отвергнуть нуле­

вую гипотезу.

Если U наб.1l < -икр-нулевую гипотезу отвергают.

Пример. Из первой партии изделий извлечеиа выборка объема nl = 1000 изделий, причем ml = 20 изделий оказаJIИСЬ бракованиыми; из второй партии извлечена выборка объема n = 900, причем та = 30

изделий оказались бракованными. При уровне значимости а.=О,О5

проверить нулевую гипотезу

Но: Pl =

Р2 = Р О

равеистве вероятиостей

появления

брака

в

обеих

партиях при

конкурирующей

гипотезе

H t : Р! ':ftР2·

 

 

 

 

 

 

 

 

 

 

 

 

Реш е н и е. По

условию,

конкурирующая

гипотеза

имеет вид

Рl ::j:: Р2,

поэтому

критическая область - двусторонняя.

 

 

Найдем

наблюдаемое значение критерия:

 

 

 

 

 

 

и

 

... ;- т!+ т2

тl/nl- т2

/n2

 

1 + 1 )

 

 

 

 

наБJl=

(1 _

т!+

т2) (

 

 

 

 

 

У

nl +n2

 

nl +n2

nl

 

 

Подставив данные задачи

и

выполнив

вычисления,

получим

и 11з1\.11 =

-1,81.

 

 

 

 

 

 

 

 

 

 

 

Найдем критическую точку:

 

 

 

 

 

 

 

 

 

Ф (икр)= (1 -а.)/2 = (1-0,05)/2=0,475.

 

 

 

По таблице функции Лапласа (см. приложение 2)

находим икр = 1,96.

Так

как I инаБJl I < икр - нет оснований

отвергнуть

нулевую ги­

потезу.

Другими

словамн,

вероятности

получения

брака

в обеих

партиях различаются незначимо.

3 а м е ч а н и е. для увеличения точности расчета вводят так

называемую поправку на непрерывность, а именно вычисляют наблю­

даемое значение критерия по формуле

инаб.1l =

[тl/nl-I/2nl]-[т2/n2+1/2n2]

... ;- ml + т2

(1 _тl+ т2) (_1+_1)

 

У

nl +n2

nl +n2

nl

n2

В рассмотренном

примере по этой формуле

получим

1. инаб.1ll = 1,96.

посколы<y и икр = 1,96,

необходимо пров€сти дополнительные испыта­

ния, причем целесообразио увеличить объем выборок.

П о я с н е н и е. Случайные величины М1 и М2 рас­

пределены по биномиальному закону; при достаточно

большом объеме выборок их можно считать приближенно

нормальными (практически должно выполняться неравен­

ство npq> 9), следовательно, и

разность

и' =

M1/n1 -

- М2/n2

распределена

приближенно нормально.

 

Для

нормирования

случайной

величины

и'

надо вы­

честь из нее математическое ожидание М (И') и разделить

результат на среднее квадратическое отклонение (] (и').

Покажем, что М (И') = О. Действительно, М (М1) =

= n1Pl (см. гл. УII, § 5, замечание); при справедливости

21

273()

321

нулевой гипотезы (Рl = Р2 = Р) м (М1) = n1р и аналогично

М (М2) = n2р. Следовательно,

М (И') = М [~] -М [М2] =...!... М (M

1 ) __1М (М

) =

nl

n 2 nl

n2

2

 

1

= - n n 1

 

I

 

р=О.

 

р--n

1

n2

2

 

Покажем, что среднее квадратичесн:ое отклонение

 

о' (И') =

V Р Р-Р) [(I/fll) + (1/n 2 )].

 

Действительно,

дисперсия

D (M1) =

n1 P1

(1- Рl) (см.

гл. VII 1,

§ 6,

замечание);

при

справедливости

нулевой

гипотезы

(Рl =

Р2 =- р)

D 1) =

n1р (l-р) и

аналогично

D 2) =

n2р (l-p). Следовательно,

 

 

 

 

D (И') = D 1

-

М21 =-;'D

) +~D (М

) =

 

 

nl

 

n2

nl

1

 

n2

2

 

= ~ n

1р (l-р) +~n2P (l-p) =р (l-р) (_1 + _1).

nl

 

 

n2

 

 

 

 

nl

n2

Отсюда среднее квадратическое

отклонение

 

 

 

о' (И') =

Vр (l-р) [1/n 1 ) +(1/n 2 )].

 

 

Итак.

случайная величина U = (и' -М (и'»/О' (и') (см.

формулу (*» нормирована и поэтому М (И) = о и о' (И) = 1.

§ 20. Сравнение нескольких дисперсий

нормальных генеральных совокупностей

по выборкам различного объема.

Критерий Бартлетта

Пусть генеральные совокупности Х1, Х2••• , Х,

распределены нормально Из этих совокупностей извле­ чены нез~висимые выборки, вообще говоря, различных

объемов n1 , n2 • ••• n, (некоторые объемы могут быть

одинаковыми; если все выборки имеют одинаковый объем,

то предпочтительнее пользоваться критерием Кочрена,

который описан в следующем параграфе). По выборкам

найдены исправленные выборочные дисперсии S~. S~, .•• , S~.

Требуется по исправленным выборочным дисперсиям

при заданном уровне значимости а. проверить нулевую

гипотезу, состоящую в том, что генеральные дисперсии

рассматриваемых совокупностей равны между собой:

Но: D 1) = D (Хи) = ... = D 1)'

322

Другими словами, требуется установить, значимо

или незначимо различаются исправленные выБОРОЧdые

дисперсии.

Рассматриваемую здесь гипотезу о равенстве несколь­ ких дисперсий называют гипотезой об однородности

дисперсий.

Заметим, что числом степеней свободы дисперсии 5t2 на­

зывают число k j =n[-I. т. е. число, на единицу MeHЬ~

шее объема выборки, по которой вычислена дисперсия.

Обозначим через 52 среднюю арифметическую исправ­

ленных дисперсий, взвешенную по числам степеней

свободы:

1

где k= ~ k j

(= 1

В качестве критерия проверки нулевой гипотезы

однородности дисперсий примем критерий Бартлетта

случайную величину

05

-

где

-= ± k[ 19 sr] ,

v= 2,303 rk 1952

l

1.1

С=1 + 3(1~1)

[t+1 -i +].

1=

 

Бартлетт установил, что

случайная величина В при

 

v

условии справедливости нулевои гипотезы распределена

приближенно

как '1.:1. с l - 1 степенями свободы, если все

kl

>2. Учитывая, что kj=nj-l,

заключаем, что n/-

-

1 > 2, или

n/ > 3, т. е. объем

каждой из выборок

должен быть

не меньше 4.

 

 

Критическую область строят правостороннюю, исходя

из

требования, чтобы вероятность попадания критерия

в

эту область

в предположении справедливости нулевой

гипотезы была равна принятому уровню значимости:

Р[В >X~p(a; 1-1)]=a.

Критическую точку Х:р (а; 1-1) находят по таблице

приложения 5, по уровню значимости а и числу степеней

21*

323

свободы k = 1- 1, и тогда правосторонняя критическая

область определяется неравенством 8 > X~p, а область принятия гипотезы-неравенством 8 < X~p.

Обозначим значение критерия Бартлетта, вычис-ленное

по данным наблюдений, через 8НаБJl И сформулируем пра­

вило проверки нулевой гипотезы.

Правило. Для того чтобы при заданном уровне зна­ чимости а проверить нулевую гипотезу об однородности

w

u

дисперсии нормальных

совокупностеи, надо вычислить

наблюдаемое значение крит~рия Бартлетта 8 = V/C и по

таблице критических точек распределения х2 найти кри­

тическую точку X~p (а; [-1).

Если 8На6J1 < X~p-HeT оснований отвергнуть нулевую

гипотезу.

Если 8ИаБJl > х~р-нулевую гипотезу отвергают.

3 а м е ч 8 н И е 1.

Не следует ТОР9ПНТЬСЯ вычислять постояи­

ную С. Сначала надо

найти V и сравнить с Х:р; если окажется, что

V < X~p, то подавно (так как С > 1) в = (V/C) < X~p н, следовательно,

С вычислять не нужно.

 

Если же V > X~p,

то надо вычислить С и затем сравнить В с ~p.

3 а м е ч а н и е

2.

Критерий

Бартлетта

весьма чувствителен

к отклонениям распределеиий от нормальиого,

поэтому к

выводам,

получеииым по этому

критерию,

надо

относиться с

осторожностью.

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 25

1

 

2

 

3

 

4

5

 

6

 

 

7

8

 

 

 

 

Число

Дне.

 

 

 

 

 

 

 

Номер

Объем

степе-

 

 

 

 

 

 

 

пер·

 

 

 

 

 

 

 

вы-

вы-

 

иеil

 

kiS~

Igs~

k

 

19 s~

I/k j

 

 

ени

i

бог

ки

борки

 

ево-

 

 

nl

 

боды

 

52

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k i

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

10

 

9

 

0,25

2,25

1,3979

6,5811

 

 

 

\

 

 

 

 

 

 

 

 

 

 

 

2

13

1

12

 

0,40

4,80

1,6021

5,2252\

 

 

 

 

 

I0,36

 

 

 

 

 

 

 

3

15

 

14

5,04

1,5563

7,7822

 

4

16

 

15

 

0,46

6,90

1,6628

I 6,9420

 

}:

 

k=50/

 

18,99

I

122'5305

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

324

Пример. По четырем независимым выборкам, объемы которых

соответственно равиы nl=IO, n 2 =12, n,=15, n4=16, извлечениым

нз иормальных геиеральных совокупиостей, найдены исправленные

выборочные дисперсии, соответственно равные 0,25; 0,40; 0,36; 0,46. При уровне зиачимости 0,05 проверить гипотезу об однородиости

дисперсий (критн ческая область - правосторонняя).

Реш е н и е. Составим расчетную табл. 25 (столбец 8 пока запол­

нять

ие будем, поскольку еще неизвестно, понадобится ли вычис­

лять

С).

Пользуясь расчетной таблиuей, найдем:

$"2 = (~kiS~)/k= 18,99/50=0,3798;

Ig 0,3798= r.5795;

 

v =2,303 [k Ig S2_~ kj Ig sn

= 2,303 [50.1,5795-22,5305] = 1,02.

По таблице

приложения 5,

по уровию

значимости 0,05

и числу

степеней

свободы

1-1 = 4-1 =3

находим

критическую

точку

X~P (0,05;

3) = 7,8.

 

 

 

 

 

 

 

 

Так

как V < Х:р, то

подавно (поскольку С> 1) Виа6.. =(V/С) <

< Х:Р и,

следовательно,

отвергнуть

иулевую гипотезу об однородно­

сти дисперсий

нет

оснований. Другими словами, исправленные вы­

борочные дисперсии различаются иезначимо.

 

 

3 а м е ч а и и е 3.

Если требуется оценить

генеральиую диспер­

сию, то при условии

ОДНОРОДНо~~и дисперсий целесообразио

прииять

в качестве ее оценки среднюю арифметическую исправлеиных диспер­

сий, взвешениую по числам степеией свободы, т. е.

:;2 = (~kjs~)/k.

Например, в рассмотреиной задаче в качестве оцеики генеральной

дисперсии uелесообразно принять 0,3798.

§ 21. Сравнение нескольких дисперсий нормальных

генеральных совокупностей по выборкам одинаковоrо объема. Критерий Кочрена

Пусть генеральные совокупности Хl' Х2••• ,

Х1 распределены нормально. Из этих СОВОКУПНОС1ей из­

влечено

1 независимых

выборок о д и н а к о в о г о о б ъ е­

м а n и

по

ним найдены исправленные выборочные дис-

лерсии

2

2

2

u

Sl' 52' •.•• ,

51.

все с одинаковым числом степенеи

свободы k =

n-l.

 

 

Требуется по исправленным дисперсиям при заданном

уровне значимости а проверить нулевую гипотезу, со­

стоящую в том, что генеральные дисперсии рассматрива­

емых совокупностей равны между собой:

Но: D (X~) = D 2) ==" ••• = D ,).

Другими словами, требуется проверить, значимо или незначимо различаются исправленные выборочные дис­

персии.

325

нятия нулевой гипотезы-неравенством

В рассматриваемом случае выборок одинакового объ­

ема можно по критерию Фишера-Снедекора (см. § 8).

сравнить наибольшую и наименьшую дисперсии; если

окажется, что различие между ними незначимо, то по­

давно незначимо и различие между остальными диспер­

сиями. Недостаток этого метода состоит в том, что ин­

формация, которую содержат остальные дисперсии, кроме

наименьшей и наибольшей, не учитывается.

Можно также применить критернй Бартлетта. Однако,

как указано в § 20, известно лишь при б л и ж е н н о е

распределение этого критерия, поэтому предпочтительнее

использовать криrерий Кочрена, распределение которого

u

наидено т о ч н о.

Итак, в качестве критерия проверки нулевой гипо­

тезы примем критерий Кочрена -отношение максималь­

ной исправлеННQЙ дисперсии к сумме всех исправленных

дисперсий:

а = S~ax/($: +S~+ ... +S1).

Распределение этой случайной величины зависит только

от числа степеней свободы k = n -1 и количества выбо­

рок [.

Критическую область строят правостороннюю, исходя

из требования, чтобы вероятность попадания критерия

в эту область в предположении справедливости нулевой

гипотезы была равна принятому уровню значимости:

р га> акр (а; k, 1)] = а.

Критическую точку акр (а; k, 1) находят по таблице

приложения 8, и тогда правосторонняя Крlfтическая об­ ласть определяется неравенством а > акр, а область при­

0< GKp

Обозначим значение критерия, вычисленное по дан­

ным наблюдений, через GН.аБJl и сформулируем правило

проверки нулевой гипотезы.

Правило. Для того чтобы при заданном уровне зна­

чимости а проверить гипотезу об однородности диспер­

сий нормально распределенных совокупностей, надо вы­ числить наблюдаемое значение критерия и по таблице

u

наити критическую точку.

Если GНаБJl < акр-нет оснований отвергнуть нулевую

гипотезу.

Если G наБJl >- Gир-нулевую гипотезу отвергают.

326

3 а м е ч а н и е. Если требуется оценить генеральную дисперсию,

то при условии однородности дисперснй целесообразно принять в ка­

честве ее оценки среднюю арифметическую исправленных выбороч­ ных дисперсий.

Пример. По четырем независимым выборкам одинакового объема n = 17, извлеченным нз нормальных генеральных совокупностей, иай­

дены исправленные дисперсии: 0,26; 0,36; 0,40; 0,42. Требуется: а) при уровне значимости 0,05 проверить нулевую гипотезу об одно­

родности генеральных дисперсий (критическая областьправосторон­ няя); б) оценить генеральную дисперсию.

Реш е н и е. а) Найдем наблюдаемое значение критерия Кочре­

на - отношение максимальной нсправленной дисперсни к сумме всех дисперсий:

GнаБJl =0,42/(0,26+0.,36 +0,40 +0,42) = 0,2917.

Найдем

по таблице приложения 8,

по уровню значимости 0,05,

числу

степеней

свободы k = 17 - ] = 16 и

числу

выборок l =

4 критическую

точку акр (0,05; 16; 4) =0,4366.

 

 

 

 

Так

как GнаБJl < акр- нет оснований

отвергнуть

нулевую

гипо­

тезу об однородиости дисперсий. другими словами, исправленные

выборочные дисперсии различаются незначимо.

б) Поскольку иулевая гипотеза справедлива, в качестве оцеикн

генеральной дисперсии примем среднюю арифметическую исправлен­

ных дисперсий:

02 = (0,26 + 0,36 +0,40 +0,42)/4 = 0,36.

§ 22. Проверка гипотезы о значимости

выборочного ко~ициента корреляции

Пусть двумерная генеральная совокупность (Х, У) распределена нормально. Из этой совокупности из­

влечена выборка объема n и по ней найден выборочный коэффициент корреляцин гВ' который оказался отлнчным

от нуля. Так как выборка отобрана случайно, то еще

нельзя заключить, что коэффициент корреляции генераль­

ной совокупности гг также отличен от нуля. В конечном счете нас интересует именно .этот коэффициент, поэтому

возникает необходимость при заданном уровне значи­

мости а. проверить нулевую гипотезу Но: гг = О о равен­

стве нулю генерального коэффициента корреляции при конкурирующей гипотезе Н1 г =О.

Если нулевая гипотеза отвергается, то это означает,

что выборочный ко~ициент корреляции значимо отли­

чается от нуля (кратко говоря, значим), а х и У корре­ лированы, т. е. связаны линейной зависимостью.

Если нулевая гипотеза будет принята, то выбо­

рочный коэффициент корреляции незначим, а Х и У не­ коррелированы, т. е. не связаны линейной зависимостью.

327

В качестве критерия проверки иулевой гипотезы при-

ь

мем случаиную величину

Т=ГоVn-2/Vl-Г:.

Величина Т при справедливости нулевой гипотезы имеет распредеJIение Стьюдента с k = n-2 степенями свободы.

Поскольку конкурирующая гипотеза имеет вид r г:;06: О.

критическая область-двусторонняя; она строится так же. как в § 12 (первый случай).

Обозначим значение критерия. вычисленное по дан­

ным наблюдений, через ТНабll И сформулируем правило

проверки нулевой гипотезы.

Правило. Для того чтобы при заданном уровне зна­

чимости а проверить нулевую гипотезу Но: r г = О о ра­

венстве нулю генерального коэффициента корреляции нормальной двумерной случайной'*' величины при конку­

рирующей гипотезе Н1: r г О, надо вычислить наблюда­

емое значение критерия:

тнабll= roVn-2/V1= г:

ипо таблице критических точек распределения Стьюдеита.

по заданному уровню значимости н числу степеней сво­

боды k = n-2 найти критическую точку tll.P (а.; k) для

двусторонней критической области.

<tll.p-нет оснований отвергнуть нуле­НаБJl

вую гипотезу.

Если! ТнаБJlI > tир-нулевую гипотезу отвергают.

Пример. По выборке объема n = 122, извлеченной нз нормальной

дпумерной совокупностн, иайден выборочный коэффициент корреля­

ции

= 0,4. При

уровне значимости 0,05 проверить нулевую гипо­

тезу

о равенстве

нулю геиерального коэффициента корреляции при

конкурирующей гипотезе Н1: гг :1= О.

Реш е и и е. Найдем иаблюдаемое значение критерия:

Тиа6J1=ГВVn-2/VI_г:=О,4VI22-2/VI-О,42=4,78.

По условию, конкурирующая гипотеза имеет вид гг :1= О, поэтому

критическая область - двусторонняя.

 

 

По уровню

значимости 0,05

и

числу степеней

CBO~ДЫ k =

= 122-2 =

120 находим по таблице

приложеии!, 6 для двусторонией

критической

области критическую 1'ОЧКУ tир (0,05; 120) =

1,98.

Поскольку

ТнаБJJ > 'ир-нулевую

гипотезу отвергаем. другими

словами, выборочный КОэффициеит корреляции значимо отличается от нуля, т. е. Х и У коррелированы.

328

§ 23. Проверка гипотезы о нормальном

распределении генеральной совокупности.

Критерий согласия Пиреона

В предыдущих параграфах закон распределения

генеральной совокупности предполагается известным.

Если закон расп ределения неизвестен, но есть осно­

вания предположить, что он имеет определенный вид

(назовем его А), то проверяют нулевую гипотезу: гене­

ральная совокупность распределена по закону А.

Проверка гипотезы о предполагаемом законе неизве­

стного распределения производится так же, как и про­

верка гипотезы о параметрах распределения, т. е. при

помощи специально подобранной случайной величины­

критерия согласия.

Критерие'м согласия называют критерий проверки ги­

потезы о предполагаемом законе неизвестного распреде­

ления.

Имеется несколько критериев согласия: х2 (<<хи квад­

рат:.) К. Пиреона, Колмогорова, Смирнова и др. Огра­ ничимся описанием применения критерия Пиреона к про­

верке гипотезы о нормальном распределении генеральной

совокупности (критерий аналогично применяется и для других распределений, в этом состоит его )!остоинство).

С этой целью будем сравнивать эмпирические (наблюда­ емые) и теоретические (вычисленные в предположении

нормального распределения) частоты.

Обычно эмпирические и теоретические частоты раз­

личаются. Например (см. гл. XVH, § 7):

эмп. частоты ..... 6 13 38 74 106 85 30 10 4 теорет. частоты... 3 14 42 82 99 76 37 11 2

Случайно ли расхождение частот? Возможно, что рас­

хождение случайно (незначимо) и объясняется либо ма­ лым числом наблюдений, либо способом их группировки,

либо другими причинами. Возможно, что расхождение

частот неслучайно (значимо) и объясняется тем, что тео­

ретические частоты вычислены исходя из неверной гипо­

тезы о нормальном распределении генеральной совокуп­

ности.

Критерий Пиреона отвечает на поставленный выше

вопрос. Правда, как и любой критерий, он не доказы­

вает сп раведливость гипотезы, а лишь устанавливает на

329

принятом уровне значимости ее согласие или несогласие

с данными наблюдений.

Итак, пусть по выборке объема n получено эмпири­

ческое распределение:

варианты ...... Xj

эмп. частоты ... n i n 1 n2 ... ns

Допустим, что в преДПQложении нормального распре­ деления генеральной совокупности вычислены теорети­

ческие частоты nс (например, так, как в следующем па­ раграфе). При уровне значимости а. требуется проверить

нулевую гипотезу: генеральная совокупность распреде­

лена нормально.

В качестве критерия проверки нулевой гипотезы при­ мем случайную величину

х2 = ~ (nj-ni)2/n'.

(*)

Эта величина случайная, так как в

различных опытах

она принимает различные, заранее не известные значе­

ния. Ясно, что чем меньше различаются эмпирические

и теоретические частоты, тем меньше величина критерия (*),

u

и, следовательно, он в известнои степени характеризует

близость эмпирического и теоретического распределений.

Заметим, что возведением в квадрат разностей частот

устраняют возможность взаимного погашения положи­

тельных и отрицательных разностей. Делением на n~ до­

стигают уменьшения каждого из слагаемых; в против­

ном случае сумма была бы настолько велика, что при­

водила бы к отклонению нулевой гипотезы даже и тогда,

когда она справедлива. Разумеется, приведенные сооб­

ражения не являются обоснованием выбранного крите­

рия, а лишь пояснением.

Доказано, что при n ~ 00 закон распределения слу­

чайной величины (*) независимо от того, какому закону

распределения подчинена генеральная совокупность, стре­

мится к закону распределения х..2 с k степенями свободы.

Поэтому случайная величина (*) обозначена через х2 , а

сам критерий называют критерием согласия «хи квадрат».

Число степеней свободы находят по равенству k =

= 5-1-г, где s-число групп (частичных интервалов)

выборки; г-число параметров предполагаемого распре­ деления, которые оценены по данным выборки.

В частности, если предполагаемое распределение-нор­

мальное, то оценивают два параметра (математическое

330