Lektsii (1) / Lecture 21
.pdfICEF, 2012/2013 STATISTICS 1 year LECTURES
Лекция 21 |
19.02.13 |
HYPOTHESIS TESTING (continued)
Определение. Величина Pr(Tn−1 >t) называется Р-значением (P-value) этого теста.
Иными словами, P-value − это вес «хвоста» t(n −1) −распределения вправо от значения t. Очевидно (нарисуйте соответствующий график) что
t >tα (n −1) P-value <α .
Отсюда следует, что при наличии P-value исходный тест модифицируется так:
1)вычислить тест-статистику t = xs /−µn0 и найти P-value;
2)если P-value >α , то H0; если P-value <α , то Hа.
Отметим, что P-value не связано с уровнем значимости α .
Пример. Пусть проверяется гипотеза H0: µ =100 против альтернативы Hа: µ <100 . По выборке объема n = 25 значение тестовой статистики получилось равным t = −1.65 . Используя Excel, получаем, что Pr(T24 < −1.65) = 0.056 . Таким образом, P−value = 0.056, и
на 5% уровне значимости нулевая гипотеза не отвергается.
Подчеркнем, что понятие P-value относится к стандартному тесту, в данном случае, к t−тесту для среднего значения нормальной генеральной совокупности при правосторонней альтернативе. Если альтернатива левосторонняя, то P-value − это вес «хвоста» слева от t. При двусторонней альтернативе P-value − это вес двух симметричных «хвостов» (сообразите сами, каких).
СТАНДАРТНЫЕ ТЕСТЫ
Перечислим кратко стандартные тесты, которые необходимо знать.
1. t-тест для (одиночного) среднего. X N (µ,σ) , H0: µ = µ0 , выборка x1,..., xn .
Тест-статистика t = xs /−µn0 . При нулевой гипотезе t имеет распределение t(n −1) .
P-value =
•Hа: µ > µ0 : вес «хвоста» справа от t для распределения t(n −1) ;
•Hа: µ < µ0 : вес «хвоста» слева от t для распределения t(n −1) ;
•Hа: µ ≠ µ0 : вес двух симметричных «хвостов» от t и от −t для распределения t(n −1) .
2.1. t-тест для двух средних, независимые выборки. X N (µ1,σ), Y N (µ2 ,σ) ,
H0: µ1 = µ2 , независимые выборки x1,..., xm , y1,..., yn .
Тест-статистика t = |
|
x − y |
|
. При нулевой гипотезе t имеет распределение t(m +n −2) . |
|||
sp |
1 |
+ |
1 |
||||
|
|
||||||
|
m |
n |
|||||
|
|
|
|
P-value =
•Hа: µ1 > µ2 : вес «хвоста» справа от t для распределения t(m +n −2) ;
•Hа: µ1 < µ2 : вес «хвоста» слева от t для распределения t(m +n −2) ;
•Hа: µ1 ≠ µ2 : вес двух симметричных «хвостов» от t и от −t для распределения t(m +n −2) .
2.2. t-тест для двух средних, парные (matched) выборки. Парная выборка
(x1, y1 ),..., (xn , yn ) . Все как в п.1, но для разностей d1 = x1 − y1 ,..., dn = xn − yn .
3. z-тест для одной пропорции. Популяционная пропорция π , H0: π =π0 , выборка объема n, p − выборочная пропорция.
Тест-статистика z = |
p −π0 |
. При нулевой гипотезе z имеет приближенно |
π0 (1−π0 ) |
||
|
n |
|
стандартное нормальное распределение.
P-value =
•Hа: π >π0 : вес «хвоста» справа от z для стандартного нормального распределения;
•Hа: π <π0 : вес «хвоста» слева от z для стандартного нормального распределения;
•Hа: π ≠π0 : вес двух симметричных «хвостов» от z и от −z для стандартного нормального распределения.
4. z-тест для разности двух пропорций. Две независимых популяции, две популяционные пропорции π1 , π2 , H0: π1 =π2 . Две (независимых) выборки объёмов n1, n2 ,
соответственно, и две выборочных пропорции p1, p2 .
Тест-статистика z = |
p1 − p2 |
|
|
, где |
p = |
n1 p1 +n2 p2 |
− пропорция по объединенной |
||
|
|
|
|
||||||
|
|
1 |
|
|
n1 +n2 |
||||
|
p(1− p) |
1 |
+ |
|
|
|
|
||
|
|
|
|
|
|
||||
|
n1 |
n2 |
|
|
|
выборке. При нулевой гипотезе z имеет приближенно стандартное нормальное распределение.
P-value =
•Hа: π1 >π2 : вес «хвоста» справа от z для стандартного нормального распределения;
•Hа: π1 <π2 : вес «хвоста» слева от z для стандартного нормального распределения;
•Hа: π1 ≠π2 : вес двух симметричных «хвостов» от z и от −z для стандартного нормального распределения.
В ситуациях 3, 4 необходимо проверять выполнение условий нормального приближения для выборочных пропорций.