- •Проверка статистических гипотез о равенстве средних
- •Формулировка гипотезы
- •Зависимые или независимые выборки
- •Объем выборок
- •Тест на равенство двух дисперсий. (Критерий Ливиня)
- •Выбор критерия
- •Уровень значимости и определение области допустимых значений
- •Вычисление значения t и z критериев
- •Z-критерий
- •T-критерий
Вычисление значения t и z критериев
Многие критерии для проверки гипотез (интересующие нас критерии не являются исключением) вычисляются по следующему принципу:
Для проверки гипотезы о равенстве средних для двух независимых выборок <наблюдаемым значением> будет являться разница между средними двух групп, то есть . <Ожидаемое значение> или, в нашем случае, <истинное значение>, то, которое существует в реальности в генеральной совокупности, обозначим как, или <истинное> среднее первой группы минус <истинное> среднее второй группы.
Теперь нам осталось посчитать стандартную ошибку. Естественно, она будет отличаться для z-критерия и для t-критерия. Начнем с z-критерия.
Z-критерий
Представим, что мы сделали не две выборки, для которых посчитали разницу между двумя средними (), а произвели бесконечное число сравнений пар таких выборок. Тогда получим некоторое число разностей между средними и можем посчитать стандартное отклонение для распределения таких разностей. Посчитанное нами стандартное отклонение и будет являться интересующей нас стандартной ошибкой или пределом, в рамках которого будет варьироваться разность между средними, существующая в реальности в генеральной совокупности.
Формула стандартной ошибки разности между двумя средними будет выглядеть следующим образом:
где и- величины стандартного отклонения генеральной совокупности[17] для первой и второй групп; и- число наблюдений в первой и второй группах (объем выборок).
Зная стандартную ошибку, можем записать общую формулу для z-критерия:
где и- средние первой и второй выборок;и- средние, существующие в реальности в генеральной совокупности. (При нулевой гипотезе -поэтому нередко можно встретить формулу для z-критерия, где числитель состоит только из;и- величины стандартного отклонения генеральной совокупности, для первой и второй групп;и- число наблюдений в первой и второй группах (объем выборок).
T-критерий
Логика построения этой формулы, естественно, такая же, как и для предыдущей, только здесь при вычислении стандартной ошибки будет присутствовать число степеней свободы.
t-критерий для выборок с равными дисперсиями:
обозначения те же что и для z-критерия (см. выше).
t-критерий для выборок с неравными дисперсиями:
На этом мы завершаем теоретическое рассмотрение логики проверки статистических гипотез о равенстве средних. Настоящий исследователь-социолог кроме теоретической грамотности должен иметь и практические навыки владения компьютером. Очевидно, что большой объем информации невозможно обработать вручную без применения компьютерных программ.
Вычисление в SPSS
Для начала вспомним два вопроса с установкой и без установки (см. пример №3):
Вопрос №1 без установки |
Вопрос №2 с установкой |
1. Сколько вы готовы заплатить за натуральный йогурт? 1. 3 - 4руб. 2. 4 - 5руб. 3. 5 - 6руб. 4. 6 - 7руб. 5. 7 - 8руб. 6. 8 - 9руб.
|
1. Сколько вы готовы заплатить за натуральный йогурт, если известно, что люди, потребляющие йогуртовые культуры, страдают на 10-15% меньше от заболеваний желудка? 1. 3 - 4руб. 2. 4 - 5руб. 3. 5 - 6руб. 4. 6 - 7руб. 5. 7 - 8руб. 6. 8 - 9руб. |
Предполагается, что респонденты, отвечающие на вопрос с положительной установкой, будут готовы заплатить за йогурт в среднем больше, чем респонденты, отвечающие на вопрос без установки. Итак, мы опросили две группы респондентов: одной группе мы задавали вопрос с установкой, другой - без установки. Рассчитаем для них средние и z-критерий для того, чтобы узнать, влияет ли установка вопроса на ответ респондента, действительно ли совпадают (или не совпадают) средние наших двух групп (подробнее о выдвигаемой нами гипотезе см. таблица №1, пример №3). Выберите в меню:
Statistics ? Compare means ? Independent Samples T Test.
В окошко Test Variable(s) переносим переменную <цена>, а в окошко Grouping Variable - переменную <группа>[18]. Нажимаем Define Groups и в Group 1 ставим цифру 1, а в Group 2 - цифру 2. Далее: Continue, OK. Первая таблица, которая у нас получилась:
Мы видим, что полученные нами средние близки к друг другу, что стандартные отклонения для обоих распределений практически равны. Смотрим таблицу дальше:
Вторая таблица разбита на две части: первая строка для групп с равными дисперсиями, вторая для групп с неравными дисперсиями. Первые два столбика - Критерий Ливиня для проверки гипотезы о равенстве дисперсий. Он применяется для того, чтобы определить, различается ли разброс в разных группах. Нулевая гипотеза говорит, что дисперсии двух совокупностей равны. Если полученный уровень значимости[19] (Sig.) мал (например, меньше 0,05), то для средних следует использовать t-критерий для неравных дисперсий (нижняя строчка). В нашем случае F-статистика равна 0,053 со значимостью 0,819, что говорит в пользу t-критерия для равных дисперсий (верхняя строчка).
Итак, мы пользуемся верхней строчкой: t-критерий для равных дисперсий равен -1,172 и его значению соответствует полученная значимость 0,245. Это говорит о том, что наша нулевая гипотеза подтверждается: выборочные средние получены из совокупностей с одинаковыми генеральными средними, то есть в данном случае наличие установки в вопросе не повлияло на выбор респондентом ответа.
Если бы полученный уровень значимости был менее 0,05, мы бы отвергли нулевую гипотезу и признали бы наличие разности между средними.