Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
177
Добавлен:
06.02.2016
Размер:
1.87 Mб
Скачать

Тема 20 . Проверка статистических гипотез

1. Задачи статистической проверки гипотез

На бытовом языке слово гипотеза означает предположение. В математической статистике это предположение относится к распределению вероятностей на выборочном пространстве.

Предположения могут быть как о конкретном законе распределения, так и о значениях его

параметров. Таким образом, статистическая гипотеза – это предположение о распределении вероятностей, которое нужно проверить по имеющимся статистическим данным.

Одна из часто встречающихся на практике задач, связанных с применением методов статистического анализа, состоит в решении вопроса о том, должно ли быть на основании данной выборки принято или напротив опровергнуто некоторое предположение (гипотеза) относительно генеральной совокупности (случайной величины).

Например, новое лекарство испытано на определённом количестве людей. Можно ли по данным результатам лечения сделать обоснованный вывод о том, что новое лекарство более эффективно, чем применявшиеся ранее лекарства?

Аналогичный вопрос логично задать, говоря о новом правиле поступления в ВУЗ, о новых инновационных методах (формах) обучения, о пользе голодания для здоровья, о пользе быстрой ходьбы, о преимуществах новой модели автомобиля, о преимуществах внедрения новой автоматической технологии в производстве, о новой форме управления экономикой, т.д.

Процедура обоснованного сопоставления высказанного предположения (гипотезы) с имеющимися в нашем распоряжении выборочными данными называется проверкой гипотез.

На практике часто встречаются задачи сравнения двух выборочных совокупностей. Например, нас может интересовать сравнение двух методов обработки статистических данных, т.е. двух различающихся действий, направленных к одной и той же цели: двух методик обучения, двух методик технологий управления процессами, двух способов получения информации и т.д.Для формирования статистической гипотезы необходимо признаки (черты) присущие конкретной проблеме, чтобы их можно было выразить в терминах, относящихся к распределению вероятности.

Отметим, что этот процесс является творческим, и его невозможно формализовать. При этом нужно помнить, что для ряда типовых случаев математическая теория (модель исследование) разработана достаточно хорошо (подробно), и нужно стараться по возможности задачу свести к одной из типовых статистических задач.

2. Статистическая гипотеза, статистический критерий

Под статистической гипотезой или просто гипотезой понимают всякое высказывание (предположение) о генеральной совокупности, проверяемое по выборке.

Статистические гипотезы служат инструментом проверки выдвигаемых теоретических предположений. Гипотезы могут быть высказаны относительно параметров статистического распределения вероятностей. Например, в случае нормального закона распределения с.в., относительно м.о. и дисперсии. Тогда гипотезу называют параметрической.

Предположения могут быть сделаны так же относительно самого распределения с.в. (подчинение закону Бернулли, Пуассона, геометрическому, равномерному, нормальному и т.д.). В этом случае проверяемую гипотезу называютнепараметрической.

На практике одну из гипотез выделяют в качестве основнойилинулевойи обозначают, (которая формируется в предположении отсутствия существенной различии между выборочной и генеральной совокупностями), а другуюконкурирующейгипотезы, являющуюся противоположной к, т.е. логическим отрицанием первого, в качествеальтернативной гипотезы и обозначается .

Гипотезу, однозначно фиксирующую распределение наблюдений, называют простой, если в ней идёт речь об одном значении параметра, в противном случае –сложной.

Например, гипотеза , состоящая в том, что математическое ожидание с.в.равно, то есть, является простой. В качестве альтернативной гипотезы, т.е. сложной можно рассматривать одну из следующих гипотез:или,.

Имея две гипотезы инадо на основе выборки, принять либо основную гипотезу, либо конкурирующую. Исследуя выборку, принимается решение: согласуется она с этой гипотезой или нет.Альтернативная гипотезапринимается после того, как опровергается основная (нулевая).

Правило, по которому принимается решение принять или отклонить гипотезу , или отклонить или принять, называетсястатистическим критериемили простокритерием проверки данной гипотезы.

Проверку гипотез осуществляют на основании результатов выборки , из некоторых формируют функцию выборки, называемойстатистикой критерия.

Основной принцип проверки гипотезсостоит в следующем. Множество возможных значений статистики критерияразбивается на два непересекающихся подмножества:критическую областьт.е. область отклонения гипотезыи областьпринятия гипотезы . Если фактически наблюдаемое значение статистики критерия, т.е. значение критерия, вычисленное по выборке:попадает в критическую областьто основная гипотезаотклоняется и принимается альтернативная гипотеза; если жепопадает в область, то принимается, аотклоняется.

Пример 1.Пусть в некотором Высшем учебном заведении нам нужно доказать, что студенты пятого курса в среднем выше ростом, чем студенты первого курса.

Решение. В качестве нулевой гипотезы выдвинем предположение о равенстве и их среднего роста:

,

где средний рост студентов 5-го курса,средний рост студентов 1-го курса.

В качестве альтернативной (конкурирующей) гипотезы к могла бы быть видвынута гипотеза, утверждающая существенные отличия их роста:

,

то есть возможные две случаи: . Если в результате статической проверки гипотезабудет опровергнута, то тем самым будет доказана возможность принятия гипотезы

. Если следовать здравому смыслу, то рост студентов в конце обучения уменьшится не может, следовательно, он действительно стал больше. Таким образом, альтернативную гипотезу в данном примере можно сформулировать как одностороннюю:

.

При проверке гипотезы может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов:

Ошибка первого родасостоит в том, что отвергается нулевая гипотеза, когда на самом деле она верна.

Ошибка второго родасостоит в том, что отвергается альтернативная гипотеза, когда она на самом деле верна.

Рассматриваемые случаи наглядно иллюстрирует следующая таблица.

Гипотеза

Опровергается

Принимается

верна

ошибка 1-го рода

правильное решение

неверна

правильное решение

ошибка 2-го рода


Вероятность ошибки 1-го рода обозначается числом и называетсяуровнем значимости критерия. Очевидно, что число выражает условную вероятность альтернативной гипотезыпо отношению уже принятой гипотезы. Чем меньше,тем меньше вероятность отклонить верную гипотезу.

Обычно, допустимую ошибку 1-го рода задают заранее. Для числа используются стандартные значения:. Например,означает, что в среднем из 100 испытаний в 5 случаях верная гипотеза будет опровергнута.

В общем случае величину задают в зависимости рассматриваемой задачи (когда речь идёт, например, о разрушении сооружений, гибели судна, прыжок с большой высоты с парашютом, тонкая хирургическая операция, стыковка космических кораблей и т.д., нельзя пренебречь обстоятельствами, которые могут появиться с вероятностью, равной 0,001).

Вероятность ошибки 2-го рода обозначается через , т. е.

Величину , т. е. вероятность недопущения ошибки 2-го рода (отвергнуть неверную гипотезу, принять верную ), называетсямощностью критерия.

Очевидно,

Чем больше мощность критерия, тем вероятность ошибки 2-го рода меньше, что, конечно, желательно (как и уменьшение ).

Последствия ошибок 1-го, 2-го рода могут быть совершенно раз­личными: в одних случаях надо минимизировать , в других нужно минимизировать. Так, применительно к радиолокации говорят, что вероятность пропуска сигнала,вероятность ложной тревоги.

Применительно к производству, к торговле можно сказать, что риск поставщика (т. е. доля товара подлежащего браковке по выборке всей партии изделий, удовлетворяющих стандарту),риск потребителя (т. е. прием по выборке всей партии изделий, не удовлетворяющей стандарту);

Применительно к судебной системе, ошибка 1-го рода приводит к оправданию виновного, ошибка 2-го рода приводит к осуждению невиновного.

Отметим, что одновременное уменьшение ошибок 1-го и 2-го рода возможно лишь при увеличении объема выборок. Поэтому обычно при заданном уровне значимостиα отыскивается критерий с наибольшей мощностью.

Методика проверки гипотез сводится к следующему:

1. При наличии выборки ,формируют основную (нулевую) гипотезу и альтернативную .

2. В каждом конкретном случае подбирают статистику критерия , обычно из следующих распределений:нормаль­ное распределение,распределение хи-квадрат (Пирсона),распределение Стьюдента,распределение Фишера - Снедекора.

3.По статистике критерия и уровню значимости определяют критическую область и (). Для ее отыскания достаточно найти критическую точкуtкp, т.е. границу (или квантиль), отделяющую областьS от.

Границы областей определяются, соответственно, из соотношений: . Для правосторонней критической областиS (рис. 76); для левосторонней критической обла­стиS (рис. 77);, для двусторонней критической областиS (рис. 78).

Рис 76

Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую приведен­ным выше соотношениям.

4. Для полученной реализации выборкиподсчи­тывают значение критерия, т.е..

  1. . Если (например,t >tкp для правосторонней областиS), то нулевую гипотезуотвергают; если же (t < tкр), то нет оснований, чтобы отвергнуть гипотезуН0.

Рис. 77

Рис. 78.

Соседние файлы в папке Теория вероятностей от исмоилова