- •Тема 5. Проверка статистических гипотез
- •5.1 Основные понятия, используемые при проверке гипотез
- •5.1.1 Статистические гипотезы
- •5.1.2 Уровень значимости и мощность критерия. Ошибки при проверке гипотез
- •5.1.3 Статистические критерии
- •5.1.3 Общая схема проверки гипотез
- •5.1.4 Односторонние и двусторонние критерии
- •5.2 Проверка однородности выборок в прикладных задачах
- •5.2.1 Однородность выборок
- •5.2.2 Независимость выборок
- •5.2.3 Параметрические и непараметрические гипотезы
- •5.3 Параметрические методы проверки однородности выборок
- •5.3.1 Традиционный метод проверки однородности двух независимых выборок (критерий Стьюдента)
- •5.3.2 Классические условия применимости критерия Стьюдента
- •5.3.3 Использование критерия Крамера-Уэлча при проверке равенства математических ожиданий двух независимых выборок
- •5.3.4 Сравнение среднего с нормативом (t-тест одной выборки)
- •5.3.5 Сравнение двух зависимых выборок при помощи t-критерия Стьюдента
- •5.4 Непараметрические методы проверки однородности выборок
- •5.5 Сравнение двух независимых выборок
- •5.5.2 Сравнение двух независимых выборок. Критерий серий Вальда—Вольфовица
- •X1, x2, x3, x4, x5 и y1, y2, y3, y4, y5, y6.
- •X1, x2, x3, x4, x5, y1, y2, y3, y4, y5, y6
- •X1, x2, y1, y3, x4, y2, y3, y4, y5, x5, y6.
- •5.5.3 Сравнение двух независимых выборок. Тест Колмогорова-Смирнова
- •5.6 Сравнение двух зависимых выборок
- •5.6.1 Сравнение двух зависимых выборок с использованием теста знаков
- •5.6.2 Сравнение двух зависимых выборок с использованием теста Уилкоксона (Вилкоксона)
- •5.7 Сравнение нескольких выборок
- •5.7.1 Сравнение нескольких независимых выборок. Критерий Крускала-Уоллиса
- •5.7.2 Сравнение нескольких зависимых выборок. Критерий Фридмана
- •5.8 Использование критерия согласия Пирсона
- •5.9 Проверка статистических гипотез применительно к таблицам сопряженности
- •Для уровней статистической значимости
- •Критические значения статистики Колмогорова-Смирнова
5.5.2 Сравнение двух независимых выборок. Критерий серий Вальда—Вольфовица
Критерий серий Вальда—Вольфовица представляет собой непараметрическую альтернативу -критерию для независимых выборок. Данные имеют тот же вид, что и в-критерии для независимых выборок. Файл должен содержать группирующую (независимую) переменную, принимающую, по крайней мере, два различных значения (кода), чтобы однозначно определить, к какой группе относится каждое наблюдение.
Критерий серий Вальда—Вольфовица устроен следующим образом. Представьте, что вы хотите сравнить мужчин и женщин по некоторому признаку. Вы можете упорядочить данные, например, по возрастанию, и найти те случаи, когда субъекты одного и того же пола примыкают друг к другу в построенном вариационном ряде (иными словами, образуют серию).
Если нет различия между мужчинами и женщинами, то число и длина «серий», относящиеся к одному и тому же полу, будут более или менее случайными. В противном случае две группы (мужчины и женщины) отличаются друг от друга, то есть не являются однородными.
Критерий предполагает, что рассматриваемые переменные являются непрерывными и измерены, по крайней мере, в порядковой шкале.
Критерий серий Вальда—Вольфовица проверяет гипотезу о том, что две независимые выборки извлечены из двух популяций, которые в чем-то существенно различаются между собой, иными словами, различаются не только средними, но также формой распределения.
Серийный критерий позволяет обнаружить различие между двумя выборками не только по центральной тенденции, но и по другим характеристикам.
Нулевая гипотеза заключается в предположении, что ряды Х и Y являются двумя выборками из одной генеральной совокупности, то есть данные однородны.
Если это так, то отдельные ранги (или значения) из обоих рядов должны чередоваться, когда эти два ряда объединены в один общий ряд.
Пусть, например, ранги (или значения) рядов X и Y будут:
X1, x2, x3, x4, x5 и y1, y2, y3, y4, y5, y6.
Тогда расположение
X1, x2, x3, x4, x5, y1, y2, y3, y4, y5, y6
будет противоречить нулевой гипотезе.
Гораздо больше соответствует гипотезе Н0 расположение вида:
X1, x2, y1, y3, x4, y2, y3, y4, y5, x5, y6.
Количественным показателем, по которому можно отличить оба эти распределения друг от друга, может служить число серий S, каждая из которых есть непрерывная последовательность наблюдений, принадлежащих к одному из двух рядов. Так, первое расположение состоит из двух серий, а второе расположение - из шести серий.
Серийный критерий различия между двумя совокупностями основан на том, что нулевая гипотеза отвергается, если число серий слишком мало (в данном случае применяется односторонний критерий). Методы теории вероятности позволяют вычислить вероятность того или иного числа серий при заданном числе наблюдений в каждом из рядов (нулевая гипотеза справедлива). И наоборот, можно указать число серий, отвечающих тому или иному уровню значимости (например, 0,05 или 0,01). В таблице приводятся граничные значения числа серий при α=0,05. Приближенно можно считать, что
Нулевая гипотеза отвергается при и не отвергается при
При малых объемах выборок серийный критерий оказывается недостаточно чувствительным. В таких случаях, а также, если , следует проверить результат при помощи наиболее строгого критерия однородности Колмогорова-Смирнова.
Пример проверки гипотезы при помощи U-критерия серий Вальда—Вольфовица.
Для проверки эффективности новой добавки к кормам цыплят оценивали дневной привес у контрольной и экспериментальнойгрупп.
11,5 |
26,0 |
29,1 |
19,7 |
2,3 |
22,6 |
30,9 |
10,8 |
23,2 |
38,8 |
21, |
5 | |
18,4 |
15,5 |
25,2 |
16,9 |
24,0 |
13,3 |
17,9 |
13,2 |
- |
- |
- |
|
Расположим все значения в один возрастающий ряд, помещая для ясности наблюдения по ив разных строках:
2,3 |
10,8 |
11,5 |
- |
- |
- |
- |
- |
- |
19,7 |
21,5 |
22,6 |
23,2 |
- |
- |
26,0 |
29,1 |
30,9 |
38,8 | |
- |
- |
- |
13,2 |
13,3 |
15,5 |
16,9 |
17,9 |
18,4 |
- |
- |
- |
- |
24,0 |
25,2 |
- |
- |
- |
- |
Имеется пять серий (). Из таблицы критических значений (приложение 3) находим , а значение. Так как, то вопрос о справедливости нулевой гипотезы остается открытым.