- •Тема 5. Проверка статистических гипотез
- •5.1 Основные понятия, используемые при проверке гипотез
- •5.1.1 Статистические гипотезы
- •5.1.2 Уровень значимости и мощность критерия. Ошибки при проверке гипотез
- •5.1.3 Статистические критерии
- •5.1.3 Общая схема проверки гипотез
- •5.1.4 Односторонние и двусторонние критерии
- •5.2 Проверка однородности выборок в прикладных задачах
- •5.2.1 Однородность выборок
- •5.2.2 Независимость выборок
- •5.2.3 Параметрические и непараметрические гипотезы
- •5.3 Параметрические методы проверки однородности выборок
- •5.3.1 Традиционный метод проверки однородности двух независимых выборок (критерий Стьюдента)
- •5.3.2 Классические условия применимости критерия Стьюдента
- •5.3.3 Использование критерия Крамера-Уэлча при проверке равенства математических ожиданий двух независимых выборок
- •5.3.4 Сравнение среднего с нормативом (t-тест одной выборки)
- •5.3.5 Сравнение двух зависимых выборок при помощи t-критерия Стьюдента
- •5.4 Непараметрические методы проверки однородности выборок
- •5.5 Сравнение двух независимых выборок
- •5.5.2 Сравнение двух независимых выборок. Критерий серий Вальда—Вольфовица
- •X1, x2, x3, x4, x5 и y1, y2, y3, y4, y5, y6.
- •X1, x2, x3, x4, x5, y1, y2, y3, y4, y5, y6
- •X1, x2, y1, y3, x4, y2, y3, y4, y5, x5, y6.
- •5.5.3 Сравнение двух независимых выборок. Тест Колмогорова-Смирнова
- •5.6 Сравнение двух зависимых выборок
- •5.6.1 Сравнение двух зависимых выборок с использованием теста знаков
- •5.6.2 Сравнение двух зависимых выборок с использованием теста Уилкоксона (Вилкоксона)
- •5.7 Сравнение нескольких выборок
- •5.7.1 Сравнение нескольких независимых выборок. Критерий Крускала-Уоллиса
- •5.7.2 Сравнение нескольких зависимых выборок. Критерий Фридмана
- •5.8 Использование критерия согласия Пирсона
- •5.9 Проверка статистических гипотез применительно к таблицам сопряженности
- •Для уровней статистической значимости
- •Критические значения статистики Колмогорова-Смирнова
5.6.1 Сравнение двух зависимых выборок с использованием теста знаков
Одним из наиболее простых критериев различия является критерий знаков G. Он дает возможность установить, насколько однонаправленно изменяются значения признака при повторном измерении связанной однородной выборки. Критерий знаков применяется к данным, полученным в ранговой, интервальной шкале и шкале отношений. В случаях, когда сдвиги могут быть определены количественно, но варьируются в достаточно широком диапазоне, лучше применять критерий Вилкоксона.
Нулевая гипотеза: H0={преобладание типичного направления сдвига является случайным}.
Альтернативная гипотеза – H1={преобладание типичного направления сдвига не является случайным}.
Алгоритм проверки:
Определяется сдвиг для каждого элемента совокупности. Для каждого сдвига фиксируется его знак.
Определяется типичный (преобладающий) знак сдвига ("+" или "-").
Определяется количество типичных и нетипичных сдвигов.
Эмпирическое значение критерия определяется как число нетипичных сдвигов.
Критическое значение критерия , где – общее число сдвигов, т.е. объем выборки, определяют по специальной таблице.
Нулевая гипотеза не отвергается, если . В этом случае типичный сдвиг считается случайным на выбранном уровне значимости.
Количество измерений должно быть не меньше 5 и не больше 300. При равенстве типичных и нетипичных сдвигов критерий знаков неприменим.
Схематично алгоритм применения критерия знаков можно представить следующим образом:
Пример сравнения двух зависимых выборок с использованием теста знаков
Результаты измерения уровня тревожности до и после проведения тренинга в группе испытуемых отображены в таблице.
№ испытуемого |
Уровень тревожности «до» тренинга |
Уровень тревожности «после» тренинга |
Сдвиг |
1 |
30 |
34 |
+4 |
2 |
39 |
39 |
0 |
3 |
35 |
26 |
-9 |
4 |
34 |
33 |
-1 |
5 |
40 |
34 |
-6 |
6 |
35 |
40 |
+5 |
7 |
22 |
25 |
+3 |
8 |
22 |
23 |
+1 |
9 |
32 |
33 |
+1 |
10 |
23 |
24 |
+1 |
11 |
16 |
15 |
-1 |
12 |
34 |
27 |
-7 |
13 |
33 |
35 |
+2 |
14 |
34 |
37 |
+3 |
Определить, является ли изменение уровня тревожности статистически значимым.
Число положительных сдвигов превосходит количество сдвигов в отрицательном направлении, следовательно, типичным является положительный сдвиг.
Эмпирическое значение критерия определяется, как число нетипичных сдвигов и равно 5. Критическое значение критерия (приложение 5). Так как, то нулевая гипотеза не отвергается. Типичный сдвиг считается случайным на выбранном уровне значимости.
5.6.2 Сравнение двух зависимых выборок с использованием теста Уилкоксона (Вилкоксона)
Тест известен также как знаковый ранговый критерий Уилкоксона, критерий знаковых рангов Уилкоксона, одновыборочный критерий Вилкоксона.
Критерий применяется для сопоставления двух зависимых выборках. С его помощью можно определить, является ли сдвиг показателя в каком-то одном направлении более существенным, чем в другом.
Нулевая гипотеза H0={существенность сдвигов в типичном направлении не превосходит существенности сдвигов в нетипичном направлении}. На объём выборки накладывается условие: 5≤n≤50.
Алгоритм проверки:
Вычисляются разности между индивидуальными значениями показателя после проведения эксперимента и до него.
Модули разностей ранжируются в порядке возрастания.
Отмечаются ранги, соответствующие сдвигам в нетипичном направлении. Например, если в большинстве случаев после проведения эксперимента наблюдалось увеличение измеряемого параметра, то его уменьшение следует считать нетипичным сдвигом.
Эмпирическое значение критерия определяется как сумма рангов, соответствующих нетипичным сдвигам.
Если критическое значение не превосходит эмпирического, то на данном уровне значимости отсутствуют основания для отклонения нулевой гипотезы о несущественности различий. В противном случае нулевая гипотеза отвергается.
Таким образом, схема применения критерия Вилкоксона будет иметь следующий вид:
Критерий Вилкоксона позволяет установить не только направленность изменений, но и их выраженность. Следующий рассматриваемый нами критерий служит только для определения направления изменения в двух связанных выборках.
Этот тест предъявляет к исследуемой выборке следующие требования:
шкала измерений должна быть порядковой, интервальной или относительной (т.е. тест нельзя применять к номинальным переменным).
исследуемое распределение должно быть непрерывно и симметрично относительно своей медианы
число различных значений в массиве X должно быть не менее 5
Предположение о симметричности распределения является критичным для работы теста. В случае, если оно не выполняется, тест неприменим и возвращаемые им уровни достоверности некорректны. В этом случае можно использовать менее мощный, но более общий критерий знаков.
Пример сравнения двух зависимых выборок с использованием теста Уилкоксона (Вилкоксона)
Для демонстрации применения критерия определим значимость различий изменений вербальной памяти до и после иппотерапии (в баллах), используя следующие данные:
Измерение до эксперимента |
6 |
5 |
4 |
3 |
7 |
6 |
4 |
4 |
5 |
6 |
Измерение после эксперимента |
8 |
5 |
6 |
4 |
7 |
7 |
5 |
3 |
8 |
7 |
Разность показателей |
2 |
0 |
2 |
1 |
0 |
1 |
1 |
-1 |
3 |
1 |
Модуль разности |
2 |
0 |
2 |
1 |
0 |
1 |
1 |
1 |
3 |
1 |
Ранг модуля разности |
8.5 |
1.5 |
8.5 |
5 |
1.5 |
5 |
5 |
5 |
10 |
5 |
В рассмотренном примере имеется только один такой сдвиг (см. таблицу), которому соответствует ранг, равный 5. Поэтому эмпирическое значение критерия будет численно равно этому рангу: . Критическое значение на уровне значимости 5%(приложение 6).
Так как , то нулевую гипотезу следует отвергнуть и считать различия существенными.