Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Математическая статистика.doc
Скачиваний:
80
Добавлен:
29.03.2015
Размер:
4.02 Mб
Скачать

Проверка непараметрических статистических гипотез.

При обработке результатов эксперимента над случайной величиной экспериментатор по выборке подбирает теоретико-вероятностную модель (нормальную, показательную, биномиальную и т.д.). Предположим, что по виду гистограммы или полигона частот или из каких-либо других соображений выдвинута гипотеза относительно общего вида функции распределения наблюдаемой случайной величины, т.е. гипотезы вида или , где - класс функций распределения определенного вида (нормальных, показательных, биномиальных и т.д.). Такую гипотезу называют нулевой непараметрической гипотезой. Гипотетическая функция распределения может быть определена полностью, либо с точностью до параметров. В последнем случае по данным выборки может быть произведена точечная оценка неизвестных параметров. Но как бы хорошо ни была подобрана теоретическая кривая распределения, между нею и статистическим распределением неизбежны некоторые расхождения. Естественно возникает вопрос: объясняются ли эти расхождения только случайными причинами или они являются существенными и связаны с тем, что плохо подобрана вероятностная модель. Для ответа на этот вопрос производится проверка нулевой гипотезы с помощью так называемых критериев согласия. Принципы построения таких критериев и методика проверки остаются практически такими же, как и в случае параметрических гипотез. Для того чтобы принять или опровергнуть гипотезу , рассматривают некоторую выборочную статистику (критерий), характеризующую степень расхождения теоретического и статистического распределений. По распределению этой статистики, полученному в предложении истинности нулевой гипотезы, и заданному уровню значимости находятся критические значения и сравниваются с наблюдаемым значением критерия. Наиболее распространенными из непараметрических критериев значимости являются критерий согласия Пирсона и -критерий Колмогорова. Мы рассмотрим здесь критерий согласия Пирсона. Относительно критерия А.Н.Колмогорова отметим только, что он выгодно отличается своей простой от критерия , но применяется только в случае, когда гипотетическое распределение полностью известно заранее из каких-либо теоретических соображений, т.е. когда известны не только вид функции распределения, но и все определяющие ее параметры. Такой случай сравнительно редко встречается на практике.

Критерий согласия (Пирсона).

Пусть произведено n независимых опытов, в каждом из которых случайная величина X приняла определенное значение. Результаты опытов сгруппированы в K разрядов и оформлены в виде статистического ряда:

разряды

. . .

Относительные частоты

. . .

Зная теоретический (гипотетический) закон распределения, можно найти теоретические вероятности попадания случайной величины в каждый из разрядов: , , . . . , .

Проверяя согласованность теоретического и статистического распределений, будем исходить и расхождений между теоретическими вероятностями и наблюденными частотами. Естественно выбрать в качестве меры расхождения между ними сумму квадратов отклонений (-), взятых с некоторыми «весами» :

.

Коэффициенты («веса» разрядов) вводятся потому, что отклонения нельзя считать равноценными по значимости для всех разрядов: одно и то же по абсолютной величине отклонения может быть малозначительным, если сама вероятность велика, и очень заметным, если она мала. Поэтому естественно «веса» взять обратно пропорциональными вероятностям разрядов.

К.Пирсон показал, что если положить , то при больших n закон распределения величины К практически не зависит от функции распределения наблюдаемой случайной величины и от числа опытов и при увеличении их числа приближается к распределению с степенями свободы (К-число разрядов, r-число параметров гипотетической функции F(x), оцениваемых по выборке). Таким образом, .

В дальнейшем мы эту статистику будем обозначать и для удобства вычислений записывать в виде: , где -частота i-го разряда.

Критерий использует тот факт, что случайная величина имеет распределение, близкое к нормальному N(0;1). Чтобы это утверждение было достаточно точным, необходимо, чтобы для всех интервалов выполнялось условие . Если в некоторых интервалах это условие не выполняется, то их следует объединить с соседними.

Такими образом, процедура применения критерия согласия (Пирсона) состоит из следующих этапов.

  1. По выборке найти точечные оценки неизвестных параметров предполагаемого закона распределения F(x).

  2. Составить группированный статистический ряд с достаточной для выполнения условия частотой разрядов.

  3. Вычислить теоретические вероятности попадания случайной величины в каждый из разрядов.

  4. Вычислить выборочное значение статистики критерия.

  5. По таблицам распределения с степенями свободы и при уровне значимости найти квантиль .

  6. Принять статистическое решение: если , то данные наблюдений не противоречат гипотезе на уровне значимости. Если же окажется , то гипотезу следует отклонить.

Критерий сконструирован таким образом, что чем ближе к нулю наблюдаемое значение критерия, тем вероятнее, что нулевая гипотеза справедлива. Поэтому критическая область критерия правосторонняя.

Пример. В течение 100 дней фиксировалось число аварий водопроводно-канализационной сети в некотором районе города. Получены следующие данные:

Число аварий,

0

1

2

3

4

5

Частота,

8

28

31

18

9

6

Проверить гипотезу о том, что число аварий имеет распределение Пуассона. Уровень значимости принять равным 0,05.

Решение. Согласно условию

Теоретические вероятности появления равно аварий в течение 100 дней вычислим по формуле Пуассона:

Результаты дальнейших вычислений сведем в таблицу:

0

1

2

3

4

5

8

28

31

18

9

6

100

0,122

0,257

0,270

0,189

0,099

0,063

1,000

12,2

25,7

27,0

18,9

9,9

6,3

100

17,64

5,29

16,00

0,81

0,81

0,09

1,45

0,21

0,59

0,04

0,08

0,01

2,38

Таким образом, . По таблице -распределенная по уровню значимости 0,05 и числу степеней свободы найдем критическое значение . Так как , то для отклонения нулевой гипотезы нет оснований. Значит, с вероятностью ошибки 0,05 принимаем, что число аварий водопроводно-канализационной сети распределено по закону Пуассона с параметром .

ЛИТЕРАТУРА

  1. Герасимович А.И., Математическая статистика. – Минск: Высшая школа, 1983.

  2. Сборник задач по математике для вузов; специальные курсы, т.3 (под.ред. Ефимова А.В.).-М.:Наука, 1984.

  3. Вентцель Е.С., Теория вероятностей.-М.:Физматгиз, 1962.

  4. Ивченко Г.И., Медведев Ю.И., Математическая статистика.- М.:Высшая школа, 1984.

  5. Королюк В.С. и др., Справочник по теории вероятностей и математической статистике. – М.: Наука, 1985.

ВОПРОСЫ ДЛЯ САМОПРОВЕРКИ И ЗАЩИТЫ РАСЧЕТНО-ГРАФИЧЕСКОЙ РАБОТЫ

  1. Сформулируйте задачу статистической проверки гипотез.

  2. Как проводится статистическая проверка гипотез?

  3. какие гипотезы называют параметрическими, непараметрическими?

  4. Какие ошибки возможны при статистической проверке гипотез? В чем их сущность? Что такое мощность критерия?

  5. Какие статистики используются при проверке параметрических гипотез? Каковы распределения этих статистик?

  6. Что такое критерии согласия? В чем заключается идея применения критериев согласия?

  7. В чем состоит критерий согласия Пирсона?

  8. Приведите оценки средних, дисперсий, ковариации и коэффициента коореляции двумерного случайного вектора.

  9. Что такое регрессия одной случайной величины на другую, кривая регрессии и линейная регрессия?

  10. В чем заключается метод наименьших квадратов при обработке результатов наблюдения?