- •«Непараметрические критерии однородности статистических данных»
- •Список обозначений
- •Введение
- •1. Непараметрические (свободные от распределения) критерии однородности статистических данных
- •1.1. Непараметрические критерии сдвига
- •1.1.1. Сравнение параметров сдвига двух совокупностей
- •1.1.1.1 Быстрый (грубый) критерий Кенуя
- •1.1.1.2. Быстрый (грубый) ранговый критерий
- •1.1.1.3. Критерий Манна-Уитни-Вилкоксона
- •1.1.1.4. Критерий Фишера-Йэйтса-Терри-Гёфдинга
- •1.1.1.5. Критерий Ван дер Вардена
- •1.1.1.6. Медианный критерий
- •1.1.2.2. Критерий Неменьи
- •1.1.2.3. Критерий Вилкоксона—Вилкокс
- •1.2 Непараметрические критерии масштаба
- •1.2.1 Сравнение параметров масштаба двух совокупностей
- •1.2.1.1. Критерий Ансари—Бредли
- •1.2.1.2. Критерий Муда
- •1.2.1.3. Критерий Сижела-Тьюки
- •1.2.1.4. Критерий Кейпена
- •1.2.1.5. Квартальный критерий
- •2. Реализация непараметрических критериев в статистическом пакете r
- •2.1. Реализация критерия Манна-Уитни-Вилкоксона
- •2.2. Реализация критерия Крускала-Уоллиса
- •2.3. Реализация критерия Ансари-Бредли
- •2.4. Реализация критерия Муда
- •3. Исследования
- •3.1. Исследование распределения статистик рассматриваемых гипотез при "малых" и "больших" выборках
- •3.2. Исследование распределения статистик по критериям согласия Колмогорова и Смирнова
- •3. 3. Исследование асимптотических свойств рассматриваемых критериев
- •3.4. Эмпирическая мощность критериев
- •3.5. Реальные данные
- •Заключение
2.2. Реализация критерия Крускала-Уоллиса
Этот критерий определяет наличие сдвига в параметрах положения нескольких совокупностей, поэтому для его реализации сформируем пять выборок по нормальному закону распределения с параметрами и . Объемы выборок равны 8, 10, 12, 14, 16 соответственно. Упорядочим по возрастанию объединенную выборку. Воспользуемся формулами (1.16) и (1.17) и найдем статистику Крускала-Уоллиса H для проверки гипотезы о наличии сдвига в параметрах положения рассматриваемых совокупностей.
Поскольку совокупностей пять, используем аппроксимацию Крускала-Уоллиса. Вычислим статистику , воспользовавшись формулами (1.18), (1.19) и (1.20). Гипотеза сдвига принимается, если выполняется условие (1.21).
Более точная аппроксимация Имана-Давенпорта представлена в формулах (1.22) и (1.23). В соответствии с ней, гипотеза сдвига отклоняется с заданной достоверностью α, если выполняется условие (1.22). Статистика рассчитывается по формуле (1.23).
Используя данные выборки в критерии Крускала-Уоллиса получаем, что по аппроксимации Крускала-Уоллиса и по аппроксимации Имана-Давенпорта гипотеза сдвига отклоняется.
Когда совпадают значения величин из разных выборок и им присваиваются одинаковые средние ранги, необходимо использовать модифицированную статистику , которая вычисляется по формуле (1.24) с использованием (1.25).
2.3. Реализация критерия Ансари-Бредли
Сформируем две выборки по нормальному закону распределения в статистическом пакете R с параметрами и . Объемы выборок равны 8 и 10 соответственно. Упорядочим по возрастанию объединенную выборку. По формуле (1.26) посчитаем статистику критерия Ансари-Бредли для проверки гипотезы о наличии сдвига в параметрах масштаба. По таблице критических значений статистики Ансари-Бредли находим и при заданных объемах выборок и уровне достоверности . При выполнении условия (1.27) гипотеза равенства параметров масштаба принимается. Используя полученные выборки, по критерию Ансари-Бредли получаем, что гипотеза равенства параметров масштаба принимается.
Увеличим объем выборок и . При воспользуемся аппроксимацией и вычислим значение статистики , используя формулы (1.28), (1.29) и (1.30). Если условие (1.31) выполняется, то нулевая гипотеза равенства параметров масштаба в двух выборках принимается с заданной достоверностью α. В этом случае, гипотеза равенства параметров масштаба принимается.
2.4. Реализация критерия Муда
В статистическом пакете R сформируем две выборки по стандартному нормальному закону распределения с объемами выборок и . Упорядочим по возрастанию объединенную выборку. По формуле (1.32) вычислим статистику критерия. Найдем по таблице критических значений статистики Муда при заданных объемах выборок и уровне достоверности и Нулевая гипотеза равенства параметров масштаба в выборках принимается, если выполняется условие (1.33).
Увеличим объем выборок. При воспользуемся нормальной аппроксимацией, статистика которой вычисляется по формуле (1.34) с использованием формул (1.35) и (1.36). При выполнении условия (1.37), принимается нулевая гипотеза, которая утверждает, что параметры масштаба двух совокупностей равны.
Для данных выборок по критерию Муда принимается гипотеза