- •ЛЕКЦИЯ 14
- •Проверка статистических гипотез
- •Примеры гипотез
- •Примеры гипотез
- •Критерии согласия
- •Проверка гипотезы
- ••Статистика T(X), определенная выше, называется статистикой критерия, V –
- •Критическая область V
- •Если значение статистики попадает критическую область, то H0
- •• При n→∞, если H0 – верная гипотеза, распределение статистики √n Dn сходится
- •• Таким образом, при заданном уровне значимости α правило проверки гипотезы H0 при
- ••Обозначим npi как niТ ( теоретические частоты)
- ••Для нахождения теоретических вероятностей pi надо знать параметры. Если параметры неизвестны (как обычно
- •ν– параметр распределения χ2, называемый числом степеней свободы.
- •Пример. Проверить гипотезу о нормальности распределения
- •Решение
- •Числовые характеристики
- ••5,70 – эмпирическое значение
- •Критическая область V
• При n→∞, если H0 – верная гипотеза, распределение статистики √n Dn сходится к функции Колмогорова К(t). Функция Колмогорова задается таблично. При практических расчетах значения К(t) можно применять уже при n>20.
t* находится из таблиц К(t) по заданному α. Например, при α=0,05 находим, что t* = 1,358.
• Таким образом, при заданном уровне значимости α правило проверки гипотезы H0 при n>20 сводится к следующему:
• если значение статистики √n Dn ≥ t*, то H0 отвергают, в противном случае делают вывод , что статистические данные не противоречат гипотезе.
H0: F=F0. Пример
• Пусть α=0,05, а максимальное расхождение между F0 и эмпирической функцией распределения Fn, построенной по выборке объема n=100, равно 0,094.
√100∙ 0,094= 0,94< t* = 1,358. Следовательно, H0 не отвергается, т.е. распределение F0 можно использовать для моделирования генеральной совокупности.
H0: F=F0. Критерий согласия Пирсона χ2
•Критерий применяется к группированной выборке.
•Пусть n – объем выборки (n ≥50),
•k – число интервалов группировки,
•ni – число значений, попавших в i –й интервал, i=1,…,k, (ni ≥5),
pi – теоретическая вероятность попадания одного элемента выборки в i –й интервал.
•Обозначим npi как niТ ( теоретические частоты)
•Статистика критерия:
k |
(n np )2 |
k |
(n n |
Т )2 |
||
T |
i i |
|
i |
i |
. |
|
npi |
|
Т |
||||
i 1 |
i 1 |
|
ni |
|
|
•Для нахождения теоретических вероятностей pi надо знать параметры. Если параметры неизвестны (как обычно и бывает), то вместо них используются их оценки.
•Если используются оценки максимального правдоподобия, то :
k |
(n np )2 |
|||
T |
i |
np |
i |
2 ( ), |
i 1 |
|
i |
|
|
ν– параметр распределения χ2, называемый числом степеней свободы.
ν=k –r –1, где r – число параметров, оцененных по выборке.
Критическая область имеет вид (t*,+∞), где t*
– квантиль распределения χ2 порядка 1 –α.
• Если значение статистики T ≥ t*, то H0 отвергают, в противном случае делают вывод, что статистические данные не противоречат гипотезе.
Пример. Проверить гипотезу о нормальности распределения
Решение
•n = 100 – объем выборки;
•xmax = 1.91 – максимальный элемент выборки;
•xmin = –2.46 – минимальный элемент выборки;
•R = 4.37 – размах выборки;
•Примем k = 10 – число интервалов.
•Вычислим С = R/k =0.44 – длина интервала.
Числовые характеристики
Оценка математического ожидания (среднее выборочное)
• x = –0,266
•Оценка среднего квадратического отклонения:
•S = 0,95;
Вероятность Pi=P находится с помощью функции распределения:
P P( yл X yп ) |
|
|
|
|
|
||||||||||||||
FX ( yп ) FX ( yл ) |
|
|
|
|
|
|
|||||||||||||
a, ( yп ) a, ( yл ) |
|
||||||||||||||||||
|
|
|
, S ( yп ) |
|
, S ( yл ) |
|
|||||||||||||
X |
X |
|
|||||||||||||||||
|
y |
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
|
|||
п |
X |
|
л |
X |
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
S |
|
|
|
|
|
|
|
S |
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
(tп ) (tл ). |
|
|
|
|
|
|
|
|
|
|