- •28 Марта 1987 г.
- •Часть 3
- •Проверка непараметрических статистических гипотез.
- •Критерий согласия (Пирсона).
- •Задания для расчетно-графической работы
- •8. При изучении влияния механизации уборочных работ на себестоимость центнера кукурузы в районе в отчетном году были получены следующие данные (процент механизации и себестоимости 1 ц в рублях):
- •7. Методом наименьших квадратов найти оценки параметров модели по опытным данным:
- •7. Используя метод наименьших квадратов, найти оценки параметров модели: по выборке:
Проверка непараметрических статистических гипотез.
При обработке результатов эксперимента над случайной величиной экспериментатор по выборке подбирает теоретико-вероятностную модель (нормальную, показательную, биномиальную и т.д.). Предположим, что по виду гистограммы или полигона частот или из каких-либо других соображений выдвинута гипотеза относительно общего вида функции распределения наблюдаемой случайной величины, т.е. гипотезы вида или , где - класс функций распределения определенного вида (нормальных, показательных, биномиальных и т.д.). Такую гипотезу называют нулевой непараметрической гипотезой. Гипотетическая функция распределения может быть определена полностью, либо с точностью до параметров. В последнем случае по данным выборки может быть произведена точечная оценка неизвестных параметров. Но как бы хорошо ни была подобрана теоретическая кривая распределения, между нею и статистическим распределением неизбежны некоторые расхождения. Естественно возникает вопрос: объясняются ли эти расхождения только случайными причинами или они являются существенными и связаны с тем, что плохо подобрана вероятностная модель. Для ответа на этот вопрос производится проверка нулевой гипотезы с помощью так называемых критериев согласия. Принципы построения таких критериев и методика проверки остаются практически такими же, как и в случае параметрических гипотез. Для того чтобы принять или опровергнуть гипотезу , рассматривают некоторую выборочную статистику (критерий), характеризующую степень расхождения теоретического и статистического распределений. По распределению этой статистики, полученному в предложении истинности нулевой гипотезы, и заданному уровню значимости находятся критические значения и сравниваются с наблюдаемым значением критерия. Наиболее распространенными из непараметрических критериев значимости являются критерий согласия Пирсона и -критерий Колмогорова. Мы рассмотрим здесь критерий согласия Пирсона. Относительно критерия А.Н.Колмогорова отметим только, что он выгодно отличается своей простой от критерия , но применяется только в случае, когда гипотетическое распределение полностью известно заранее из каких-либо теоретических соображений, т.е. когда известны не только вид функции распределения, но и все определяющие ее параметры. Такой случай сравнительно редко встречается на практике.
Критерий согласия (Пирсона).
Пусть произведено n независимых опытов, в каждом из которых случайная величина X приняла определенное значение. Результаты опытов сгруппированы в K разрядов и оформлены в виде статистического ряда:
разряды |
. . . |
|||
Относительные частоты |
. . . |
Зная теоретический (гипотетический) закон распределения, можно найти теоретические вероятности попадания случайной величины в каждый из разрядов: , , . . . , .
Проверяя согласованность теоретического и статистического распределений, будем исходить и расхождений между теоретическими вероятностями и наблюденными частотами. Естественно выбрать в качестве меры расхождения между ними сумму квадратов отклонений (-), взятых с некоторыми «весами» :
.
Коэффициенты («веса» разрядов) вводятся потому, что отклонения нельзя считать равноценными по значимости для всех разрядов: одно и то же по абсолютной величине отклонения может быть малозначительным, если сама вероятность велика, и очень заметным, если она мала. Поэтому естественно «веса» взять обратно пропорциональными вероятностям разрядов.
К.Пирсон показал, что если положить , то при больших n закон распределения величины К практически не зависит от функции распределения наблюдаемой случайной величины и от числа опытов и при увеличении их числа приближается к распределению с степенями свободы (К-число разрядов, r-число параметров гипотетической функции F(x), оцениваемых по выборке). Таким образом, .
В дальнейшем мы эту статистику будем обозначать и для удобства вычислений записывать в виде: , где -частота i-го разряда.
Критерий использует тот факт, что случайная величина имеет распределение, близкое к нормальному N(0;1). Чтобы это утверждение было достаточно точным, необходимо, чтобы для всех интервалов выполнялось условие . Если в некоторых интервалах это условие не выполняется, то их следует объединить с соседними.
Такими образом, процедура применения критерия согласия (Пирсона) состоит из следующих этапов.
-
По выборке найти точечные оценки неизвестных параметров предполагаемого закона распределения F(x).
-
Составить группированный статистический ряд с достаточной для выполнения условия частотой разрядов.
-
Вычислить теоретические вероятности попадания случайной величины в каждый из разрядов.
-
Вычислить выборочное значение статистики критерия.
-
По таблицам распределения с степенями свободы и при уровне значимости найти квантиль .
-
Принять статистическое решение: если , то данные наблюдений не противоречат гипотезе на уровне значимости. Если же окажется , то гипотезу следует отклонить.
Критерий сконструирован таким образом, что чем ближе к нулю наблюдаемое значение критерия, тем вероятнее, что нулевая гипотеза справедлива. Поэтому критическая область критерия правосторонняя.
Пример. В течение 100 дней фиксировалось число аварий водопроводно-канализационной сети в некотором районе города. Получены следующие данные:
Число аварий, |
0 |
1 |
2 |
3 |
4 |
5 |
Частота, |
8 |
28 |
31 |
18 |
9 |
6 |
Проверить гипотезу о том, что число аварий имеет распределение Пуассона. Уровень значимости принять равным 0,05.
Решение. Согласно условию
Теоретические вероятности появления равно аварий в течение 100 дней вычислим по формуле Пуассона:
Результаты дальнейших вычислений сведем в таблицу:
0 |
1 |
2 |
3 |
4 |
5 |
||
8 |
28 |
31 |
18 |
9 |
6 |
100 |
|
0,122 |
0,257 |
0,270 |
0,189 |
0,099 |
0,063 |
1,000 |
|
12,2 |
25,7 |
27,0 |
18,9 |
9,9 |
6,3 |
100 |
|
17,64 |
5,29 |
16,00 |
0,81 |
0,81 |
0,09 |
|
|
1,45 |
0,21 |
0,59 |
0,04 |
0,08 |
0,01 |
2,38 |
Таким образом, . По таблице -распределенная по уровню значимости 0,05 и числу степеней свободы найдем критическое значение . Так как , то для отклонения нулевой гипотезы нет оснований. Значит, с вероятностью ошибки 0,05 принимаем, что число аварий водопроводно-канализационной сети распределено по закону Пуассона с параметром .
ЛИТЕРАТУРА
-
Герасимович А.И., Математическая статистика. – Минск: Высшая школа, 1983.
-
Сборник задач по математике для вузов; специальные курсы, т.3 (под.ред. Ефимова А.В.).-М.:Наука, 1984.
-
Вентцель Е.С., Теория вероятностей.-М.:Физматгиз, 1962.
-
Ивченко Г.И., Медведев Ю.И., Математическая статистика.- М.:Высшая школа, 1984.
-
Королюк В.С. и др., Справочник по теории вероятностей и математической статистике. – М.: Наука, 1985.
ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ И ЗАЩИТЫ РАСЧЕТНО-ГРАФИЧЕСКОЙ РАБОТЫ
-
Сформулируйте задачу статистической проверки гипотез.
-
Как проводится статистическая проверка гипотез?
-
какие гипотезы называют параметрическими, непараметрическими?
-
Какие ошибки возможны при статистической проверке гипотез? В чем их сущность? Что такое мощность критерия?
-
Какие статистики используются при проверке параметрических гипотез? Каковы распределения этих статистик?
-
Что такое критерии согласия? В чем заключается идея применения критериев согласия?
-
В чем состоит критерий согласия Пирсона?
-
Приведите оценки средних, дисперсий, ковариации и коэффициента коореляции двумерного случайного вектора.
-
Что такое регрессия одной случайной величины на другую, кривая регрессии и линейная регрессия?
-
В чем заключается метод наименьших квадратов при обработке результатов наблюдения?