Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Учебное пособие (4 с.).doc
Скачиваний:
68
Добавлен:
17.11.2019
Размер:
8.29 Mб
Скачать

4.3. Проверка статистических гипотез

Во многих случаях результаты наблюдений используются для проверки предположений (гипотез) относительно тех или иных свойств распределения генеральной совокупности.

Определение. Статистической гипотезой Н называется предположение относительно параметра или вида распределения изучаемой случайной величины Х.

Если распределение случайной величины Х известно, а по выборке наблюдений проверяют гипотезы о значении параметров распределения, то такие гипотезы называют параметрическими. Если же проверяются гтпотезы о виде самого распределения, то такие гипотезы называются непараметрическими.

Определение. Проверяемая гипотеза называется нулевой гипотезой и обозначается . Наряду с гипотезой рассматривают одну из альтернативных (конкурирующих) гипотез .

Например, если проверяется гипотеза о том, что параметр равен некоторому заданному значению , т.е. , тогда в качестве альтернативной гипотезы могут быть взяты следующие:

.

Выбор альтернативной гипотезы определяется конкретной формулировкой задачи.

Определение. Правило, по которому принимается решение принять или отклонить гипотезу , называется критерием К.

Решение признать или отклонить гипотезу, принимается на основе выборки наблюдений за случайной величиной Х. Поэтому, необходимо иметь некоторую подходящую статистику, называемую в этом случае статистикой Z критерия К.

Критерий К задают с помощью критического множества , которое является подмножеством множества значений статистики Z.

Решение принимают следующим образом:

  1. если выборочное значение статистики принадлежит критическому множеству (критической области), то отвергают нулевую гипотезу и принимают альтернативную гипотезу ;

  2. если выборочное значение статистики не принадлежит критическому множеству (то есть принадлежит дополнению множества до множества значений статистики Z), то отвергают альтернативную гипотезу и принимают нулевую гипотезу .

При использовании любого критерия возможны ошибки следующих видов:

  • принять гипотезу , если верна - ошибка первого рода;

  • принять гипотезу , если верна - ошибка второго рода.

Вероятности совершения ошибок первого и второго рода обозначаются соответственно, и :

, ,

где - выборочное значение статистики Z,

- вероятность события А при условии, что справедлива гипотеза .

Определение. Вероятность называют уровнем значимости критерия и фиксируют перед анализом выборки. Как правило, .

Определение. Величину ( ), которая равна вероятности отвергнуть нулевую гипотезу, если она верна, называют мощностью критерия.

Отметим, что при заданном объеме выборки нельзя одновременно уменьшить и , и . Как правило, уровень значимости критерия задают заранее, а критическую область следует выбирать таким образом, чтобы величина была минимальна.

Таким образом, проверка параметрической статистической гипотезы при помощи критерия значимости может быть разбита на следующие этапы:

  1. сформулировать проверяемую ( ) и альтернативную ( ) гипотезы;

  2. назначить уровень значимости ;

  3. выбрать статистику Z критерия для проверки гипотезы ;

  4. определить выборочное распределение статистики Z при условии, что верна гипотеза ;

  5. в зависимости от формулировки альтернативной гипотезы определить критическую область одним из неравенств или совокупностью неравенств и ;

  6. получить выборку наблюдений и вычислить выборочное значение статистики критерия;

  7. принять статистическое решение:

    • если , то отклонить гипотезу , как не согласующуюся с результатами наблюдений;

    • если , то принять гипотезу , то есть считать, что она не противоречит результатам наблюдений.

Для проверки гипотез о параметрах нормально распределенной генеральной совокупности используются следующие статистики.

Пример. Проверим гипотезу о том, что генеральная средняя нормально распределенной совокупности равна заданному числу .

Для проверки этой гипотезы при известной дисперсии следует использовать статистику: ,

которая имеет нормальное распределение с параметрами: (обозначается );

если дисперсия генеральной совокупности неизвестна, то статистику:

,

которая имеет распределение Стьюдента с степенью свободы.

Здесь - объем выборки,

- выборочное среднее,

- выборочная дисперсия,

- известное среднеквадратичное отклонение,

- заданное число.

Задача. Пусть из нормально распределенной генеральной совокупности

а) с известной дисперсией ,

б) с неизвестной дисперсией

извлечена выборка объема и найдена выборочная средняя . Требуется при уровне значимости проверить нулевую гипотезу (здесь - генеральная средняя), если конкурирующая гипотеза .

Решение. а) Поскольку дисперсия генеральной совокупности известна, выбираем статистику критерия , имеющую распределение .

Вычислим наблюдаемое (выборочное) значение статистики критерия -

.

Так как альтернативная гипотеза , то критическую область следует взять двухсторонней, она задается неравенствами: и .

Плотность нормального распределения симметрична, значит, критическая область будет задана неравенством: .

Таким образом, , (здесь - функция Лапласа) отсюда .

По таблице значений функции Лапласа (приложение 1) находим .

Так как (3 > 1.96), то выборочное значение статистики критерия попадает в критическую область, значит нулевую гипотезу отвергаем. Выборочное среднее и математическое ожидание генеральной совокупности различаются значимо.

б) Если дисперсия неизвестна, то в качестве статистики критерия возьмем статистику , которая имеет распределение Стьюдента с степенью свободы.

Плотность распределения Стьюдента нечетная функция, , поэтому критическая область определяется неравенством

. Тогда ,

.

По таблице квантилей распределения Стьюдента (приложение 2) находим , следовательно, вывод тот же, что и в предыдущем случае а).

Пример. Проверим гипотезу о том, что генеральная дисперсия нормально распределенной совокупности равна заданному значению .

Обозначим через n объем выборки, по которой найдена несмещенная дисперсия .

Для того, чтобы при заданном уровне значимости проверить нулевую гипотезу о равенстве неизвестной генеральной дисперсии гипотетическому (предполагаемому) значению при конкурирующей гипотезе , надо вычислить наблюдаемое значение статистики критерия , которая имеет распределение с степенью свободы. По таблице критических точек распределения , по заданному уровню значимости и числу степеней свободы находим критическую точку . Если - нулевая гипотеза принимается, если - нулевую гипотезу отвергают.

Задача. Из нормальной генеральной совокупности извлечена выборка объема и по ней найдена выборочная дисперсия . Требуется при уровне значимости проверить нулевую гипотезу , приняв в качестве конкурирующей гипотезы .

Решение. Найдем наблюдаемое значение критерия: . По условию, конкурирующая гипотеза имеет вид , поэтому критическая область – правосторонняя. По приложению 3, по уровню значимости и числу степеней свободы находим критическую точку . Так как - нулевая гипотеза принимается, т.е. различие между выборочной дисперсией и предполагаемой генеральной дисперсией незначимо.

Для проверки непараметрических гипотез также найден ряд подходящих статистик.

Пример. Проверим гипотезу о том, что генеральная совокупность имеет нормальное распределение.

Пусть эмпирическое распределение задано в виде последовательности равноотстоящих вариант и соответствующих им частот: .

Гипотезу можно проверить с помощью критерия Пирсона, в котором используют статистику: ,

где n – объем выборки, h – шаг, равный разности между соседними вариантами, - наблюдаемая частота, - теоретическая частота, - плотность нормального распределения .

Статистика Z имеет (хи-квадрат) распределение с степенями свободы (при условии, что математическое ожидание и дисперсия генеральной совокупности неизвестны).

Для проверки гипотезы при заданном уровне значимости , надо:

  1. Вычислить выборочную среднюю и выборочную дисперсию .

  2. Вычислить теоретические частоты

  3. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:

а) составляют расчетную таблицу, по которой находят наблюдаемое значение критерия

б) по таблице критических точек распределения , по заданному уровню значимости и числу степеней свободы находят критическую точку правосторонней критической области.

Если , то нет оснований отвергать гипотезу о нормальном распределении генеральной совокупности. Другими словами, эмпирические и теоретические частоты различаются незначимо (случайно).

Если - гипотезу отвергают. Другими словами, эмпирические и теоретические частоты различаются значимо.

Задача. Используя критерий Пирсона, при уровне значимости 0,01 установить, случайно или значимо расхождение между эмпирическими частотами и теоретическими частотами , которые вычислены, исходя из гипотезы о нормальном распределении генеральной совокупности : .

Решение. Найдем наблюдаемое значение статистики критерия Пирсона: . Составим расчетную таблицу:

-

1

8

6

2

4

0,667

2

16

18

-2

4

0,222

3

40

36

4

16

0,444

4

72

76

-4

16

0,211

5

36

39

-3

9

0,231

6

18

18

0

0

-

7

10

7

3

9

1,286

Из таблицы видно, что наблюдаемое значение критерия: . По таблице критических точек распределения , по уровню значимости 0,01 и числу степеней свободы (приложение 3) находим критическую точку правосторонней критической области . Так как , то нет оснований отвергать гипотезу о нормальном распределении генеральной совокупности, т.е. расхождение между эмпирическими и теоретическими частотами незначимо (случайно).

Отметим, что если вариационный ряд непрерывный, то весь интервал изменения случайной величины Х разбивают на промежутков одинаковой длины, и в качестве новых вариант берут середины интервалов: . Затем нормируют случайную величину Х, то есть переходят к новой случайной величине и находят теоретические частоты , где - функция Лапласа. При этом наименьшее значение Y приравнивают к , а наибольшее – к .

Статистика , - сумма частот, попавших в i - интервал, имеет также -распределение с степенями свободы. Затем вычисляют выборочное значение статистики критерия Пирсона и по таблице квантилей -распределения находят критическое значение статистики , соответствующее заданному уровню значимости и числу степеней свободы. Если , то гипотеза о нормальном распределении генеральной совокупности принимается, в противном случае гипотеза отвергается.