Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
пособие по матем методам.doc
Скачиваний:
105
Добавлен:
20.04.2019
Размер:
2.75 Mб
Скачать

6. Статистические гипотезы

Гипотезой называется предположение, имеющее вероятностный характер, обладающее неопределенностью в отношении своей истинности. Гипотезы формулируются для того, чтобы представить в четком, лаконичном виде представления автора о том или ином факте, о его причинах.

В статистике гипотезы формулируются по поводу характеристик распределений, частот событий, положения событий относительно друг друга в ранжированном порядке и так далее. Подход к гипотезе в статистике четкий и в значительной мере формальный. Принято выделять статистические гипотезы двух основных видов - нулевую и альтернативную. Нулевая гипотеза, обозначаемая Н0, формулируется как гипотеза об отсутствии отличий: о сходстве двух распределений, о равенстве средних арифметических двух выборок и т.п. Нулевой она называется потому, что содержит 0: Х12=0, где Х1 и Х2 - значения признаков. Нулевая гипотеза утверждает, к примеру, что результаты выполнения задания экспериментальной группой и контрольной не различаются. Альтернативная гипотеза Н1 противоположна по смыслу нулевой, она утверждает наличие отличий в выборках, в параметрах их распределений и так далее (результаты экспериментальной группы значимо отличаются от результатов контрольной группы).

Две гипотезы - нулевая и альтернативная - образуют группу несовместных событий, то есть, если принимается одна из них, то другая отклоняется: принимая гипотезу об отсутствии различий Н0, мы отклоняем альтернативную гипотезу Н1, утверждающую, что различия есть, и, соответственно, наоборот.

Кроме этого, статистическая гипотеза может быть направленной или ненаправленной. Ненаправленная гипотеза фиксирует только наличие или отсутствие различий:

Н1 - ненаправленная альтернативная гипотеза: результаты экспериментальной группы значимо отличаются от контрольной,

Н0 - ненаправленная нулевая гипотеза: результаты экспериментальной группы значимо не отличаются от контрольной.

Направленная гипотеза говорит о наличии или отсутствии различий в определенном направлении:

Н1 - направленная альтернативная гипотеза: результаты экспериментальной группы выше (или, наоборот, ниже) результатов контрольной группы,

Н0 - направленная нулевая гипотеза: результаты экспериментальной группы не превышают результаты контрольной.

Общая схема классификации гипотез представляется в следующем виде:

Проверка гипотез производится с помощью статистических критериев. Статистический критерий - это правило, которое позволяет принимать истинную и отклонять ложную гипотезу с высокой степенью вероятности. Математически критерий представляет собой формулу, по которой мы рассчитываем некоторое число. Есть много разных видов статистических критериев, каждый из них разработан для решения определенного круга задач: так, по одному из них можно доказывать значимость различий средних арифметических значений двух выборок, по другому - согласованность изменения параметров двух распределений и так далее. Как правило, по формуле рассчитывается числовое значение критерия для имеющейся в нашем распоряжении выборки данных (полученное число называется эмпирическим значением критерия), и эмпирическое значение сравнивается с критическими значениями критерия, приведенными в таблицах. Различие между эмпирическим и критическим значениями критерия позволяет нам принять одну из статистических гипотез (нулевую или альтернативную) и отклонить другую.

Все статистические критерии делятся на параметрические и непараметрические. Параметрическими называются критерии, в формулу расчета которых входят параметры распределения (чаще всего это среднее арифметическое и стандартное отклонение). Непараметрические критерии, соответственно, параметры распределение в формулу расчета не включают, они оперируют только частотами или рангами. Каждая группа критериев имеет свои возможности, свои преимущества и недостатки, свои ограничения в использовании, которые будут рассмотрены при описании каждого из критериев. Параметрические методы следует применять при достаточно больших выборках (на практике обычно это означает больше 15 - 20 испытуемых), когда исследуемое распределение относится к нормальному типу. При небольшом количестве испытуемых, а также, если исследуемое распределение значимо отличается от нормального, следует воспользоваться непараметрическими методами. Непараметрические методы в психологии используются весьма широко, поскольку набрать достаточное количество испытуемых представляется возможным далеко не всегда.

В статистике за основной вариант принимается вариант рассмотрения истинности нулевой и ложности альтернативной гипотезы в генеральной совокупности. Применяя определенный критерий для принятия той или иной гипотезы по результатам обследования выборки, исследователь оказывается в следующей ситуации:

Таблица 6.

Действия

исследователя

Состояние нулевой гипотезы

Истинное

Ложное

Принимается Н0

Принято правильное решение (р=1-)

Совершена ошибка 2-го рода (р= )

Отклоняется Н0

Совершена ошибка 1-го рода (р=)

Принято правильное решение (р= 1-)

Такая ситуация складывается, потому что исследование проводится на выборке, а вывод делается об истинности гипотезы в генеральной совокупности. Понятно, что пока не изучена вся генеральная совокупность, дать окончательный ответ нельзя, а до того можно говорить лишь о большей вероятности одной гипотезы и меньшей другой и при этом указывать вероятность ошибки сделанного вывода.

Например, все признаки свидетельствуют о том, что должен пойти дождь. Нулевая гипотеза говорит нам об отсутствии различий между характеристикой сегодняшней погоды и характеристикой дождливого дня (низкое давление, низкая плотная облачность, высокая влажность). Альтернативная гипотеза утверждает, что различия есть, следовательно, дождя не будет.

Таблица 7.

Действия

В действительности

Н0: дождь будет

Н1: дождя не будет

Брать зонт

Правильное решение (1-)

Ошибка 2-го рода ()

Не брать зонт

Ошибка 1-го рода ()

Правильное решение (1-)

Как мы видно из таблицы, ошибка первого рода состоит в том, что мы отклонили нулевую гипотезу, которая на самом деле верна. Вероятность ошибки 1-го рода обозначается , соответственно вероятность правильного решения будет 1-. Вероятность 1- называется доверительной вероятностью. В каждом исследовании указывают вероятность ошибки (либо доверительную вероятность 1-) или в виде десятичной дроби (=0.05), или в процентах (=5%)

Ошибкой второго рода называется принятие по результатам выборочного исследования нулевой гипотезы, в то время как верна альтернативная. Обозначается вероятность ошибки второго рода , соответственно, вероятность правильного решения в данном случае 1-. Эта вероятность 1- называется мощностью критерия. Мощность критерия характеризует его способность отклонять ложную гипотезу.

Уровень ошибки первого рода исследователь, как правило, задает самостоятельно, либо ее можно рассчитать. Вероятность ошибки второго рода обычно остается неизвестной, только в некоторых случаях она может быть оценена примерно. Оба вида ошибок тесно связаны между собой: если отклоняется истинная нулевая гипотеза, то принимается ложная альтернативная, или, если принимается ложная нулевая гипотеза, то отклоняется истинная альтернативная. Задавая низкий уровень вероятности ошибки , мы тем самым резко увеличиваем вероятность ошибки второго рода , и наоборот, повышая вероятность ошибки , мы уменьшаем вероятность ошибки . В каждом конкретном случае следует проанализировать, какая из ошибок несет в себе меньшую опасность, и после этого задать тот или иной уровень доверительной вероятности. При использовании статистических методов в психологии обычно ориентируются на вероятность  = 0.05 (доверительная вероятность 95%, то есть ошибка вероятна лишь в одном случае из 20), считая его пограничным для принятия или отклонения альтернативной гипотезы. Если требуется принять альтернативную гипотезу с большей степенью надежности, то принимается  = 0.01 (доверительная вероятность 99%). А если мы хотим принять нулевую гипотезу с высокой степенью надежности, то нужно задать  = 0.10 или даже 0.20 (доверительная вероятность 90 или 80%), при этом вероятность ошибки второго рода понизится; в этом случае следует задать низкий уровень доверительной вероятности. Например, для ситуации с зонтом, как правило, более безболезненно пройдет ошибка второго рода - зонт возьмем, а дождя не случится.