- •Алгоритм проверки статистических гипотез
- •3.6.2 Проверка статистических гипотез о числовом значении генерального среднего
- •3.6.3 Сравнение генеральных средних двух нормально распределенных совокупностей
- •3.6.4 Гипотезы о числовом значении дисперсии
- •3.6.5 Гипотезы о законе распределения
- •3.6.6 Гипотеза об однородности выборок
- •Список литературы
- •Приложение 1
- •Приложение 2
3.6.5 Гипотезы о законе распределения
Критерий согласия Пирсона (-критерий).Ранее предполагалось, что закон распределения либо является нормальным, либо близок к нему. Неизвестными же являлись отдельные параметры распределения: генеральное среднее (математическое ожидание) и дисперсия. В тех случаях, когда закон распределения не известен, подсказать его вид может гистограмма. Например, если ее вид напоминает кривую Гаусса, то можно высказать гипотезу о нормальном законе распределения исследуемой случайной величины.
Проверка гипотезы H0 о том, что эмпирическая частота мало отличается от соответствующей теоретической частоты, осуществляется с помощью величины – меры расхождения между ними. Пустьpi – вероятность принятия значения xi, а ni – эмпирическая частота для соответствующих значений xi. Тогда
, (3.44)
где n – объем выборки, а m – число различных вариант выборки. Числа ni и npi – называют соответственно эмпирическими и теоретическими частотами.
В том случае, когда распределение непрерывно или число различных вариант достаточно большое, то выборку группируют с учетом, что ni>5. Такая статистика имеет распределение (m-r-1), где m – число различных интервалов группировки выборки, а r – число параметров теоретического распределения, вычисленных по данным выборки.
Причины расхождения результатов эксперимента и теоретических характеристик могут быть вызваны малым объемом выборки, неудачным способом группировки наблюдений, неверными вычислениями теоретических частот, ошибками в выборе гипотезы о виде распределения генеральной совокупности и др.
Рассмотрим простые гипотезы о степени близости эмпирического закона распределения теоретическому, т.е. соответствия опытных данных и теоретической модели. Критериями согласия называют критерии, в которых гипотеза определяет закон распределения полностью, либо с точностью до небольшого числа параметров.
Рассмотрим универсальный критерий согласия – критерий Пирсона 2 (для простой гипотезы), т.к. он используется и при независимых повторных испытаниях для дискретной выборки и в более сложных случаях: произвольных выборках.
Для произвольных выборок все пространство наблюдаемых вариант делят на конечное число непересекающхся областей, в каждой из которых подсчитывают наблюдаемую частоту и теоретическую (гипотетическую) вероятность.
Для применения критерия согласия Пирсона необходимо:
вычислить значение статистики по формуле ;
по таблице значений распределения найти критические значения, у которогоk= m -r-1 – число степеней свободы и – выбранный уровень значимости. Это значит, что строится правосторонний интервал.
Если гипотеза0 отвергается, для гипотеза0 принимается, т.е. чем больше значение отклонения, тем меньше согласованы теоретическое и эмпирическое распределение. Поэтому принято использовать только правостороннюю критическую область.
Задача 19. В известном опыте Бюффона (Задача 9, п.2.9.4) определить, согласуются ли экспериментальные данные с теоретической вероятностью выпадения герба.
Решение: Данные эксперимента это число опытов n=4040, число выпадения герба m=2048. Тогда эмпирическая частота pi=0.507.
Составим ряд распределений, приняв случайную величину – выпадение решки за x1=0, а случайную величину – выпадение герба за x2=1. Соответствующие вероятности занесем в таблицу:
-
xi
ni
npi
ni- npi
(ni- npi)2
(ni- npi)2/ npi
0
1992
2020
-28
784
0.388
1
2048
2020
28
784
0.388
Тогда статистика =0.388+0.388=0.776 , а число степеней свободы найдем по формулеk=m-r-1. Т.к. случайная величина X принимает всего два значения (m=2), а неизвестных параметров нет, то r=0. Поэтому число степеней свободы равно k=2-0-1=1. По таблице распределений находим значение=3.84 при уровне значимости=0.05. Это значит, что найденное значение =0.776 меньше критерияи поэтому можно сделать вывод о том, что гипотеза о равновероятном выпадении герба и решки в опытах Бюффона хорошо согласуется с теоретической вероятностью.
Задача 20.
По таблице эмпирического распределения изменения (в %) темпа роста акций проверим гипотезу о нормальном распределении выборки:
Интервалы |
(-3;-1) |
(-1;0) |
(0;1) |
(1;3) |
Итого |
7 |
14 |
18 |
11 |
50 | |
0.14 |
0.28 |
0.36 |
0.22 |
1.0 |
Решение:
Гипотезу о нормальном распределении проверим по критерию , используя расчетную таблицу эмпирического распределения для формулы:
Интервалы |
ni |
ni-npi | ||||
(-3;-1) |
7 |
0.157 |
7.85 |
-0.85 |
0.7225 |
0.092 |
(-1;0) |
14 |
0.341 |
17.05 |
-3.05 |
9.3025 |
0.546 |
(0;1) |
18 |
0.341 |
17.05 |
-0.95 |
0.9025 |
0.053 |
(1;3) |
11 |
0.157 |
7.85 |
-3.15 |
9.9225 |
1.264 |
Итого: 1.955.
=1.955.
Находим по числу степеней свободы. Т.к.m=4 - число интервалов, r=2 - число параметров теоретического распределения, то , для=0.05 имеем . Т.к. 1.955<3.841, то, т.е. гипотеза о нормальном распределении подтверждается.
Критерий Колмогорова. Для проверки гипотезы о виде распределения вероятностей кроме критерия используетсякритерий Колмогорова, где в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривается максимальное значение абсолютной величины разности между эмпирической функцией распределения Fn(x) и соответствующей теоретической функцией распределения F(x):
D=max|Fn(x)-F(x)|.
Здесь случайная величина D – наибольшее уклонение эмпирической функции распределения от теоретической. При неограниченном увеличении числа наблюдений (при n)
,
где K(t) –распределение Колмогорова. Например, при t=1.36 и при достаточно большом объеме выборки n, из таблиц функции Колмогорова (Таблица 10, приложение 1) имеем неравенство < (или , которое выполняется с вероятностью 0.95. Величина, называемаястатистикой критерия Колмогорова, т.е. мера расхождения между теоретическими и эмпирическим распределением, при больших n имеет распределение Колмогорова.
Критерий Колмогорова, несмотря на свою простоту, имеет ограниченное применение, т.к. для его использования необходимо полное задание теоретической функции распределения, которым чаще всего не располагают.