Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Lektsii (1) / Lecture 22

.pdf
Скачиваний:
12
Добавлен:
02.06.2015
Размер:
205.75 Кб
Скачать

ICEF, 2012/2013 STATISTICS 1 year LECTURES

Лекция 22

26.02.13

HYPOTHESIS TESTING (continued)

OPERATING CHARACTERISTICS CURVE (OCC)

Вернемся к проблеме мощности теста (или вероятности ошибки второго рода). Подчеркнем, что все рассмотренные нами стандартные тесты имели заданный уровень значимости независимо от числа наблюдений. Вопрос нахождения вероятностей ошибок второго рода для этих тестов является непростой задачей, поэтому мы рассмотрим только один пример.

Example. Population N (µ,1) ,

hypothesis: H0: µ = 0 ,

Ha: µ >0 , α =0.05 . Then the standard

test is the following:

z = estimate null

 

x 0

 

1)

calculate test-statistics

=

= x n ;

 

 

 

 

 

s.e.

1/

n

2)

if

 

n <1.65 then H0 is not rejected, if

 

 

n >1.65 then H0 is rejected in favor Ha.

x

x

This test has significance level α =0.05 .

 

 

 

 

According to definition

 

 

 

 

 

 

 

 

β = Pr(not reject H0 | Ha is true) = Pr(x

n <1.65 | µ > 0) .

It can be easily seen that β is not a number but is a function of µ : β = g(µ) . Definition. The graph of function g(µ) is called an operating characteristics curve.

Now z = x

n N (µ

n,1) and

 

 

 

g(µ) = Pr(x

n µ

n <1.65 µ

n) = Pr(Z <1.65 µ

n), µ > 0

Below is the graph of g(µ)

 

 

 

 

 

 

 

OCC

 

 

 

1

 

 

 

 

 

 

0.8

 

 

 

 

 

beta

0.6

 

 

 

 

OCC

0.4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0.2

 

 

 

 

 

 

0

 

 

 

 

 

 

0

0.2

0.4

0.6

0.8

1

 

 

 

mean

 

 

 

 

CHI-SQUARE TEST GOODNESS OF FIT (WW, Ch.17)

 

 

 

(Критерий согласия хиквадрат)

В этом разделе мы изучим статистические тесты, которые позволят проверять гипотезы о том, что изучаемая генеральная совокупность, т.е. случайная величина, имеет заданное распределение. Проще всего понять суть хи-квадрат теста, рассмотрев примеры.

Примеры

1. Мы хотим проверить гипотезу о том, что игральный кубик является правильным. Предположим, что кубик подбрасывается 600 раз. В таблице приведены результаты этих шестисот подбрасываний. Предположим, что кубик правильный, тогда ожидаемое число

появлений каждого исхода j, j = 1,…, 6 есть E j = 16 600 =100 . В тесте хи-квадрат мерой отклонения наблюдаемых значений от ожидаемых служит величина

χ2 = 6

(Oj E j )2

 

 

 

 

 

j=1

E j

 

 

 

 

 

(О = observed), E expected)

 

 

 

 

 

 

 

 

 

 

 

 

O

 

 

E

 

(O E)2

 

 

 

 

 

E

 

 

 

 

 

 

 

 

1

 

 

110

 

100

 

1

2

 

 

89

 

100

 

1.21

3

 

 

115

 

100

 

2.25

4

 

 

110

 

100

 

1

5

 

 

90

 

100

 

1

6

 

 

86

 

100

 

1.96

Total

 

 

600

 

600

 

8.42

 

 

 

 

 

Pvalue

 

0.134

Существует общая теорема, которую мы принимаем без доказательства, что если кубик правильный, то статистика χ2 имеет так называемое хи-квадрат распределение с пятью

(6 1 = 5) степенями свободы.

Это новое для нас распределение. Мы помним, что распределение это всегда распределение некоторой случайной величины. Дадим строгое определение. Пусть Z1,..., Zk независимые стандартные нормальные (т.е. N (0,1) ) случайные

величины.

Определение. Распределение случайной величины

χ2 (k) = Z12 +Z22 +... +Zk2 = k

Z 2j

j=1

 

называется хи-квадрат распределением с k степенями свободы.

Ясно, что случайная величина χ2 (k) при любом k принимает только неотрицательные значения. Поэтому ее pdf равна нулю на отрицательной полупрямой. Нетрудно проверить (сделайте это!), что E (χ2 (k))= k . Сложнее установить, что V (χ2 (k))= 2k .

Вернемся к примеру. Распределение хи-квадрат затабулировано и есть в компьютерах и калькуляторах. Pvalue, приведенное в таблице, вычислено с помощью Exclel. В данном случае гипотеза о правильности кубика не отвергается, например, на стандартном 5%-ном уровне значимости.

2. Теория Менделя утверждает, что некоторый вид горошка дает потомство, в котором белые, розовые и красные цветы распределены в пропорции 25%, 50% и 25%. Наблюдается 1000 потомков, белые 21%, розовые 52%, красные 27%.

 

O

 

E

 

(O E)2

 

 

 

 

 

 

E

white

 

210

250

 

6.4

pink

 

520

500

 

0.8

red

 

270

250

 

1.6

Total

 

1000

1000

 

8.8

 

 

 

P-value

 

0.0122

В данном случае гипотеза о предписанном распределении по цветам отвергается на 5%- ном уровне значимости.

Рассмотрим общий случай.

Пусть генеральная совокупность (популяция) есть случайная величина X, принимающая значения a1 ,...,ak ( a j не обязательно числа) с некоторыми вероятностями:

X

a1

 

 

 

ak

 

P(X)

π1

 

 

πk

 

Нулевая гипотеза Н0: πj

=π0j ,

j =1,..., k , где π0j , j =1,..., k заданные вероятности

(естественно, k

π0j =1 ).

 

 

 

 

 

 

j=1

 

 

 

 

 

 

Альтернативная гипотеза На: отрицание Н0.

Имеется выборка x1 ,..., xn из этой генеральной совокупности. «Наблюдаемое» число исхода j: m j =#{i : xi = a j }, j =1,...,k (Observed). «Ожидаемое» число исхода j (при Н0): nπ0j (Expected).

 

2

 

(O E)2

k

(mj nπ0j

)2

 

Тест-статистика: χ

 

=

 

=

 

 

.

 

E

0

 

 

 

 

j=1

nπ j

 

 

Теорема. Если верна гипотеза Н0, то χ2 при больших п имеет распределение χ2 (k 1) .

Подчеркнем, что утверждение Теоремы имеет асимптотический характер, т.е. при n →∞. При использовании ее на практике следует заботиться об условиях применимости нормального приближения.

Соседние файлы в папке Lektsii (1)