- •«Непараметрические критерии однородности статистических данных»
- •Список обозначений
- •Введение
- •1. Непараметрические (свободные от распределения) критерии однородности статистических данных
- •1.1. Непараметрические критерии сдвига
- •1.1.1. Сравнение параметров сдвига двух совокупностей
- •1.1.1.1 Быстрый (грубый) критерий Кенуя
- •1.1.1.2. Быстрый (грубый) ранговый критерий
- •1.1.1.3. Критерий Манна-Уитни-Вилкоксона
- •1.1.1.4. Критерий Фишера-Йэйтса-Терри-Гёфдинга
- •1.1.1.5. Критерий Ван дер Вардена
- •1.1.1.6. Медианный критерий
- •1.1.2.2. Критерий Неменьи
- •1.1.2.3. Критерий Вилкоксона—Вилкокс
- •1.2 Непараметрические критерии масштаба
- •1.2.1 Сравнение параметров масштаба двух совокупностей
- •1.2.1.1. Критерий Ансари—Бредли
- •1.2.1.2. Критерий Муда
- •1.2.1.3. Критерий Сижела-Тьюки
- •1.2.1.4. Критерий Кейпена
- •1.2.1.5. Квартальный критерий
- •2. Реализация непараметрических критериев в статистическом пакете r
- •2.1. Реализация критерия Манна-Уитни-Вилкоксона
- •2.2. Реализация критерия Крускала-Уоллиса
- •2.3. Реализация критерия Ансари-Бредли
- •2.4. Реализация критерия Муда
- •3. Исследования
- •3.1. Исследование распределения статистик рассматриваемых гипотез при "малых" и "больших" выборках
- •3.2. Исследование распределения статистик по критериям согласия Колмогорова и Смирнова
- •3. 3. Исследование асимптотических свойств рассматриваемых критериев
- •3.4. Эмпирическая мощность критериев
- •3.5. Реальные данные
- •Заключение
1.1.1.2. Быстрый (грубый) ранговый критерий
Рассматриваются две выборки объемов и при ( ). Их элементы ранжируются по возрастанию совместно. Одинаковым наблюдениям присваивается одинаковый усредненный ранг. Для каждой группы находятся суммы рангов и и средние ранги и .
Вычисляем . Статистика -критерия может быть аппроксимирована нормальным распределением со средним и дисперсией
.
Поэтому при гипотеза сдвига отклоняется с доверительной вероятностью α.
Эффективность критерия для нормально распределенных выборок 0,95 (для любого другого исходного распределения — не хуже 0,86).
1.1.1.3. Критерий Манна-Уитни-Вилкоксона
Пусть и - упорядоченные по возрастанию выборки. Для проверки гипотезы сдвига Манн и Уитни предложили ранговый критерий, основанный на статистике [1]
, где = (1.1)
Здесь - точное число пар значений и , для которых .
Если
(1.2)
гипотеза сдвига отклоняется ( - критические значения критерия Манна-Уитни) [1].
С -статистикой Манна-Уитни связана статистика Вилкоксона, определяемая суммой рангов элементов одной выборки (предположим, объема ) в общей упорядоченной последовательности элементов совместной выборки объема ( ) [1]:
(1.3)
При применима аппроксимация [1]
(1.4)
Статистика W аппроксимируется нормальным распределением, и гипотеза сдвига отклоняется с достоверностью , если
(1.5)
Если в двух сравниваемых выборках есть совпадающие значения, то им рекомендуется приписывать средние ранги (среднеарифметическое для каждой серии последовательных рангов). При этом в знаменателе статистики следует использовать величину [1]
(1.6)
где — общее число групп совпадающих величин; - число совпавших величин в i-й группе (следует помнить, что совпадения учитываются только тогда, когда совпавшие величины принадлежат различным выборкам, т. е. совпадения, целиком состоящие из элементов одной и той же выборки, на величину W не влияют).
Более точная аппроксимация предложена Иманом [1]. В соответствии с ней гипотеза сдвига отклоняется с достоверностью , если
(1.7)
где
(1.8)
- - квантиль нормального распределения; - - квантиль распределения Стьюдента с степенями свободы; .
Асимптотическая эффективность критерия Манна—Уитни равна
Одним из вариантов применения рассмотренного критерия является так называемый ранговый критерий Вилкоксона. Его статистика строится следующим образом. Для двух выборок и одинакового объема строится ряд разностей [1]
(1.9)
который затем ранжируется по возрастанию.
В упорядоченном ряду значений находится сумма рангов Т величин [1]
. (1.10)
Гипотеза сдвига отклоняется, если [1]
, (1.11)
где и - критические значения статистики Т знакового рангового критерия Вилкоксона.
При применимо приближение [1]
(1.12)
При [1]
(1.13)
гипотеза сдвига отклоняется (здесь – -квантиль стандартного нормального распределения).
Гипотеза сдвига отклоняется на уровне достоверности если [1]
(1.14),
где
(1.15)
– - квантиль стандартного нормального распределения; - - квантиль распределения Стьюдента с степенями свободы.