Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
4 курс АФК / лабораторная_ проверка статистичеких гипотез.docx
Скачиваний:
79
Добавлен:
22.03.2015
Размер:
103.54 Кб
Скачать

Проверка статистических гипотез: гипотеза о равенстве средних для двух выборки

Работа носит вспомогательный характер, должна служить фрагментом других лабораторных работ.

Ни одно грамотное социологическое исследование не может обойтись без выдвижения гипотез. По большому счету можно вообще сказать, что главная его цель - это опровержение или подтверждение какого-либо предположения исследователя о социальной реальности на основе собранных им эмпирических данных. Мы выдвигаем гипотезу, собираем данные и делаем на основе статистического материала вывод. Но именно эта цепочка гипотеза-данные-вывод и содержит в себе массу вопросов, с которыми сталкивается практически любой начинающий исследователь. Основной из таких вопросов заключается в следующем: как перевести выдвинутую нами гипотезу на математический язык для того, чтобы ее потом можно было соотнести со статистическим массивом и, обработав с помощью методов математической статистики, опровергнуть или подтвердить? Здесь мы постараемся ответить на этот вопрос на примере проверки гипотез о равенстве средних.

Проверка статистических гипотез о равенстве средних

Под статистической гипотезой понимаются различного рода предположения относительно характера или параметров распределения случайной переменной, которые можно проверить, опираясь на результаты в случайной выборке.

Следует иметь в виду, что проверка статистической гипотезы имеет вероятностный характер. Также как мы никогда не можем на 100% быть уверены в том, что какой-либо выборочный параметр совпадает с параметром генеральной совокупности, мы никогда не можем абсолютно точно сказать, верна или ложна выдвинутая нами гипотеза.

Для того чтобы проверить статистическую гипотезу необходимо следующее:

1.      Преобразовать содержательную гипотезу в статистическую: сформулировать нулевую и альтернативную статистические гипотезы.

2.      Определить зависимые[12] или независимые у нас выборки.

3.      Определить объем выборок.

4.      Выбрать критерий.

5.      Выбрать уровень значимости, контролирующий допустимую вероятность ошибки первого рода, и определить область допустимых значений.

6.      Посчитать значение критерия и сравнить его с критическим.

7.      Отвергнуть или принять нулевую гипотезу.

Теперь рассмотрим каждый из шести пунктов более подробно.

Формулировка гипотезы

В статистических задачах часто бывает нужно сравнить средние двух разных выборок[13]. Например, нас может интересовать разница средних зарплат мужчин и женщин, средних возрастов неких групп <А> и <В> и т.д. Или же, сформировав две независимые экспериментальные группы, мы можем сравнивать их средние с целью проверить, насколько различается, скажем, воздействие двух разных лекарств на кровяное давление или насколько размер группы влияет на отметки студентов. Иногда бывает так, что мы разбиваем совокупность на две группы попарно, то есть, имеем дело с близнецами, супружескими парами или одним и тем же человеком до и после какого-либо эксперимента и т.д. Чтобы стало более ясно, рассмотрим характерные примеры, где применяются различные критерии о равенстве средних.

Пример №1. Фирма разработала два разных препарата, понижающих давление (назовем их препараты Х и Y) и хочет узнать различается или нет воздействие данных лекарств на больных, страдающих гипертонией. Из 50 человек с соответствующим заболеванием случайно выбираются 20 и случайно эти 20делятся на две группы по 10 человек. Первая группа в течение недели пользуется препаратом Х, вторая - препаратом Y. Затем у всех больных измеряется давление. Выдвигаемая содержательная гипотеза: препараты Х и Y по-разному влияют на кровяное давление больных.

Пример №2. Исследователь хочет узнать, как влияет продолжительность лекции на успеваемость студентов. Допустим, он избрал следующий путь: из 200 студентов случайно выбрал 50 человек и в течение месяца наблюдал за их успеваемостью. Далее он увеличил продолжительность лекций на 10 минут и в течение следующего месяца смотрел на успеваемость все тех же50 студентов. Потом он сравнил результаты каждого студента до и после увеличения продолжительности лекции. Выдвигаемая содержательная гипотеза: продолжительность лекции влияет на успеваемость студента.

Пример №3. Из 200 студентов случайно были выбраны 80 человек, и эти 80 человек разделили на две группы по 40. Одной группе задавали вопрос без установки: <Сколько вы готовы заплатить за натуральный йогурт?>, а второй группе задавали вопрос с установкой: <Сколько вы готовы заплатить за натуральный йогурт, если известно, что люди, потребляющие йогуртовые культуры, страдают на 10-15% меньше от заболеваний желудка?> Исследователь предполагал, что положительная информация о продукте, содержащаяся во втором вопросе, повлияет на респондента, и люди, отвечающие на вопрос с установкой, будут готовы заплатить за йогурт больше, нежели те, которым был предложен вопрос без установки. Выдвигаемая содержательная гипотеза: постановка вопроса влияет на ответ респондента.

Перед нами три примера, каждый из которых демонстрирует формулировку содержательной гипотезы. Теперь преобразуем наши содержательные гипотезы в статистические, но для начала немного скажем о статистических гипотезах в целом.

Наиболее частый подход к формулировке статистических гипотез - это выдвижение двух двусторонних гипотез:

Как видно из формулы, нулевая гипотеза говорит о том, что какой-либо параметр выборки или, скажем, разница между параметрами двух выборок равна некоему числу а. Альтернативная гипотеза утверждает обратное: интересующий нас параметр не равен а. Таким образом, данные две гипотезы содержат в себе все возможные варианты исходов.

Также возможна формулировка односторонних гипотез:

Иногда такие гипотезы оказываются более осмысленными. Обычно они имеют место в том случае, когда вероятность того, что наш параметр может оказаться больше (или меньше) а равна нулю, то есть такое невозможно.

Теперь сформулируем нулевую и альтернативную статистические гипотезы для наших трех примеров.

Таблица №1.

 

Пример №1

Пример №2

Пример №3

Содержательная гипотеза

Препараты Х и Y по-разному влияют на кровяное давление больных

Продолжительность лекции влияет на успеваемость студентов

Постановка вопроса влияет на ответ респондента

Задача исследователя

Посчитать среднее давление в первой и во второй группах больных после недельного использования изучаемых препаратов, соответственно и

1. Посчитать средний балл студента до увеличения продолжительности лекций

2. Посчитать средний балл студента после увеличения продолжительности лекций

3. Посчитать для каждого студента разность между средними до и после

4.Найти среднее арифметическое разностей для всех студентов, обозначаемое 

Посчитать, сколько в среднем готовы заплатить за йогурт респонденты, отвечающие на вопрос с установкой и на вопрос без установки, соответственно и

Нулевая гипотеза

Смысл нулевой гипотезы

исредние генеральных совокупностей, из которых взяты выборки со среднимии. Нулевая гипотеза говорит о том, что влияние обоих лекарств на давление в среднем незначительно, и если даже выборочные средние не равны, то это объясняется лишь погрешностью выборки или иными не зависящими от нас причинами

- среднее разностей для студентов в генеральной совокупности. Нулевая гипотеза говорит о том, что на самом деле нет разницы между средним баллом студента до и после увеличения продолжительности лекции, и если даже выборочное среднее разностей отлично от нуля, то это объясняется лишь погрешностью выборки или иными не зависящими от нас причинами

Посколькусовпадает св примере №1, то объяснения можно найти в первой колонке (см. пример 1)

Альтернативная гипотеза

Вывод относительно содержательной гипотезы

Если мы принимаем нулевую гипотезу - препараты оказывают одинаковое влияние (разницы между средними нет), то мы отвергаем содержательную гипотезу, в противном случае - мы принимаем содержательную гипотезу

Если мы принимаем нулевую гипотезу - продолжительность лекции не влияет на успеваемость, то мы отвергаем содержательную гипотезу и наоборот

Если мы принимаем нулевую гипотезу - вопрос не влияет на выбор респондента, то мы отвергаем содержательную гипотезу и наоборот.[14]