Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2815.doc
Скачиваний:
98
Добавлен:
13.11.2022
Размер:
7.39 Mб
Скачать

4. Общие критерии согласия

Критерии проверки гипотезы о предполагаемом законе распределения случайной величины называются критериями согласия. И в этом случае гипотезы могут быть простыми и сложными: либо проверяется соответствие некоторому закону с данными параметрами (например, нормальному с определенными средним и дисперсией), либо некоторому закону с произвольными параметрами (например, нормальному с какими-либо средним и дисперсией). Во втором случае параметры вначале оцениваются по выборке.

Следует понимать: на практике мы проверяем не тот факт, что случайная величина действительно имеет определенный закон распределения (например, нормальный). Это может быть, строго говоря, вообще неверно (например, никакая положительная и дискретная величина не может иметь нормальное распределение, поскольку оно рассредоточено по всей действительной прямой и непрерывно). Проверяется лишь, достаточно ли хорошо данные согласуются с некоторым законом, чтобы его можно было использовать далее для их описания.

Критерии согласия можно условно разделить на общие и частные. Общие критерии устанавливают соответствие выбранному закону распределения, а частные заранее заданному.

Рассмотрим наиболее популярные критерии согласия, такие как критерий хи-квадрат, критерий Колмогорова-Смирнова, критерий Смирнова-Крамера-фон-Мезиса, критерий Дарбина и критерий Андерсона-Дарлинга. Естественно, многообразие критериев этим не ограничивается. В литературе так же можно встретить критерий числа пустых интервалов [24], квартильный критерий Барнетта-Эйсена [25], критерий Реньи [26], критерий Ватсона [27], критерий Купера [28].

4.1.Критерии хи-квадрат Пирсона

Критерий согласия Пирсона (хи-квадрат) идеально подходит для проверки гипотез в полиномиальной схеме.

А именно: пусть проводится независимых испытаний, каждое из которых может иметь различных исходов . Требуется проверить гипотезу о том, что вероятности этих исходов равны , если в последовательности испытаний эти исходы встретились раз.

Пусть независимые наблюдения некоторой слу­чайной величины с неизвестной функцией распределения . Тре­буется по выборке проверить нулевую гипотезу о том, что генеральная совокупность имеет функцию распределения , если известны значения параметров закона распределения, а - непре­рывная или дискретная функция, т. е. имеет место простая гипотеза.

Для проверки этой гипотезы область значений наблюдаемой величины , произвольным образом разбивают на не­пересекающихся областей , . Обычно это последова­тельность непересекающихся интервалов и полуинтервалов вида .

Если справедлива основная гипотеза, т.е. случайные величины своей функцией распределения имеют , то можно найти теоретические вероятности попадания случайной величины в частичные интервалы из условия

где , .

Со случайными величинами естественно связана по­линомиальная схема с испытаниями, в которой результатом -го испытания является попадание значения в какой-либо интервал. Обозначим через число значений среди , попавших в промежуток . Пусть зафиксировано и веро­ятности У - успеха и Н - неуспеха равны соответственно

Тогда - это число успехов в испытаниях Бернулли; - от­носительная частота события ,которая является асимптотичес­ки нормальной, несмещенной и состоятельной оценкой вероятности события, и так как , можно считать справедливым приближенное равенство , т.е. вектор частот есть оценка гипотетической вероятности.

В качестве меры расхождения (меру расхождения можно изме­рять различными способами) гипотетической и теоретической веро­ятностей рассматривается сумма квадратов отклонений

(106)

где - веса. (В методе наименьших квадратов принято , но, согласно теории ошибок Гаусса, каждое слагаемое должно входить в сумму со своей точностью.) Пирсон показал [29], что если полагать ,т.е.

то величина как линейная комбинация асимптоти­чески нормальных величин также асимптотически нормальна и , следовательно, - распределена по с степенями свободы.

Следовательно, если - выборка из генеральной сово­купности с функцией распределения , то статистика

(107)

имеет при (т.е. при достаточно больших ) распределение с степенями свободы, если основная гипотеза верна. В противном случае статистика стремится к бесконечности. Поэ­тому в качестве критической области выбирается область больших значений.

Поскольку односторонний критерий более «жестко» отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требования, что вероятность попа­дания критерия в эту область в предположении об истинности нуле­вой гипотезы должна быть равна принятому уровню значимости : .

Алгоритм проверки гипотезы

  1. Выдвигается нулевая гипотеза и выбирается уровень значимости.

  2. Из генеральной совокупности производится выборка объемом .

  3. Весь диапазон полученных значений разбивается на частичных интервалов равной длины, и пусть в -м интервале будет значений, так что ( , иначе интервалы объединяются).

  4. Составляется сгруппированный статистический ряд.

  5. На основании гипотетической функции распределения вы­числяются вероятности попадания случайной величины в час­тичные интервалы , .

  6. Умножая полученные вероятности на объем выборки, получа­ем теоретические частоты , т. е. частоты, которых следует ожи­дать, если нулевая гипотеза справедлива.

  7. Используем статистику хи-квадрат: и находим наблюдаемое значение критерия .

  8. Из таблиц квантилей -распределения по заданному уровню значимости и числу степеней свободы находим критиче­ские точки .

  9. Сравнивая наблюдаемые значения критерия с критиче­ским значением принимаем одно из двух решений: а) если , то нулевая гипотеза отвергается в пользу альтернатив­ной, т. е. считается, что гипотетическая функция распределения не согласуется с опытными данными; б) если отклонения нулевой гипотезы нет основания, т.е. гипотетичес­кая функция согласуется с опытными данными.

Пример 17

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]