- •234Глава 6
- •Значимые результаты
- •Нуль-гипотеза
- •Третье возможное заключение
- •Заключение — результаты подтверждают:
- •Отвержение или неотвержение нуль-гипотезы
- •241Заключение — результаты подтверждают:
- •Разновидности риска и типы ошибок
- •Валидность выводов
- •251Неприятные проблемы, которые остаются
- •Бросающиеся и не бросающиеся в глаза результаты
- •Количество не помогает
- •254Справедлив ли вывод для всех испытуемых!
- •255Другие аспекты валидности
- •Внешняя валидность
- •256Систематическое смешение
- •Краткое изложение
- •Вопросы
- •Статистическое приложение: t-критерий
- •Стандартная ошибка
- •Определение величины t
- •Отвержение или неотвержение нуль-гипотезы
- •264Разности между средними, необходимую для отвержения нуль-гипотезы. Давайте перерисуем выборочное распределение разностей.
- •265Нуль-гипотеза и ω2
- •266Статистическая таблица 2 Величина t-критерия, отвергающая нуль-гипотезу
Вопросы
1. Почему Флинер и Кернс заключили, что старшие дети больше плачут при уходе матери, чем при уходе ассистентки, а у младших детей такого различия нет?
2. Что такое нуль-гипотеза?
3. Почему в эксперименте Флинера и Кернса возможно третье заключение, в то время как в эксперименте 259Иоки по предпочтению сорта томатного сока только два?
4. Что показывает диаграмма, иллюстрирующая: различие между средними для каждого условия, статистическое решение и заключение об экспериментальной гипотезе?
5. Как влияет уменьшение надежности на величину различия между средними, требуемую для отвержения нуль-гипотезы?
6. Как влияет альфа-уровень в правиле решения на величину различия между средними, требуемую для отвержения нуль-гипотезы?
7. Соотнесите альфа-уровень с риском ошибок I и II типов.
8. Когда особенно важно избегать ошибки I типа?
9. Опишите три фактора, влияющие на вероятность бета. Что это означает в отношении риска ошибки II типа?
10. При каких условиях экспериментатор может заключить, что независимая переменная не оказывает действия?
11. Почему говорят, что разумное использование правила статистического решения способствует внутренней валидности?
12. Может ли быть в эксперименте слишком много испытуемых?
13. Если в эксперименте получены надежные данные и высоко значимые различия между условиями, обеспечивает ли это полностью валидность вывода?
Статистическое приложение: t-критерий
В данном приложении будет описан метод нахождения величины различия между средними, необходимой для отвержения нуль-гипотезы. Фактически мы будем подробно объяснять диаграммы, представленные на рис. 6.1.
260Выборочное распределение
Давайте еще раз предположим, что данные по времени реакции, представленные в предыдущих статистических приложениях, получены в межгрупповом эксперименте. Мы, таким образом, имеем среднее время реакции для каждого из 17 испытуемых, которым предъявлялось условие А (свет), и среднее время реакции для каждого из 17 испытуемых, которым предъявлялось условие Б (тон). Более того, известно общее среднее для испытуемых в условии А (185 мс) и общее среднее в условии Б (162 мс). Наконец, мы знаем разницу между этими двумя средними, МА—Мб, равную. +.23 мс.
Если бы исследовались две другие группы испытуемых, отобранные тем же способом, то, конечно, не следовало бы ожидать МА—Мб в точности равной 23 мс. Нельзя было бы ожидать точно такой же разницы + 23 мс и в третьем эксперименте. Напротив, мы предполагаем, что это значение МА—Мб будет несистематически варьировать от эксперимента к эксперименту.
Допустим, что путем повторения этого эксперимента был реализован бесконечный эксперимент, при котором каждое условие предъявлялось 17 испытуемым бесконечное число раз. Предположим далее, что нуль-гипотеза верна. Тогда различие между общими средними — которое есть параметр — должно равняться нулю. Другими словами, М̅А—М̅б=0. Однако величина статистики МА—Мб должна варьировать от эксперимента к эксперименту.
Распределение величин МА—Мб для серии последовательных экспериментов может быть представлено так, как было описано ранее. Обозначим величину +23, которая была получена в реальном эксперименте, номером 1; предположим, что мы провели второй такой же эксперимент и получили величину — 4, обозначим ее номером 2; величину, полученную в третьем эксперименте (допустим, 0), — номером 3 и т. д. Таким образом, результаты девяти экспериментов, в случае МА—Мб = 0, могли бы выглядеть следующим образом.
261 |
Рис, 6.2. Ось абсцисс — МА—Мб. Ось ординат — частота |
К счастью, можно вывести, как это распределение выглядело бы для бесконечного числа экспериментов. Мы можем реально изобразить ожидаемое распределение величин МА—Мб. Более того, мы можем оценить стандартное отклонение, которое имело бы это распределение. Такой тип теоретически выведенного распределения называют выборочным распределением. Описываемое здесь распределение является выборочным распределением разностей между средними (имеются также выборочные распределения для средних, для стандартных отклонений и т. д.).
Приводим выборочное распределение для нашего эксперимента по времени реакции с предположением, что нуль-гипотеза М̅А—М̅б=0 верна.
Заметьте, что стандартное отклонение (СО) равно 6,1.
Рис. 6.3. Ось абсцисс — МА—Мб . Ось ординат — относительная частота |
262Поэтому разность МА—Мб = +12,20, полученная в каком-то эксперименте, находится на расстоянии двух стандартных отклонений выше предполагаемой величины М̅А—М̅б = 0, а разность МА—Мб , равная —18,30, -- на три стандартных отклонения ниже предполагаемого нуля и т. д.