- •Калинин а.А., Гусева с.И. Простейшие методы анализа данных в психологии
- •Введение
- •1. Шкалы
- •2. Случайное событие
- •3. Случайная величина
- •3.1 Распределение случайной величины
- •Способность обобщения учеников 10 класса одной из школ Ленинградской области (по результатам штур)
- •3.2 Параметры распределения
- •3.3 Нормальное распределение
- •4. Генеральная совокупность и выборка
- •5. Стандартизация психодиагностических методов
- •6. Статистические гипотезы
- •7. Математический аппарат проверки статистических гипотез
- •Подготовка данных и выбор критерия
- •Формулирование нулевой и альтернативной гипотез.
- •7.1. Подготовка данных
- •7.1.1 Порядок выявления аномальных значений
- •7.1.2 Проверка эмпирического распределения на его соответствие нормальному распределению
- •7.2 Сравнение среднего значения некоторой выборки со средним значением генеральной совокупности или с нормативным значением
- •7.3 Сравнение уровня признака в независимых выборках
- •7.4 Сравнение уровня признака в зависимых выборках
- •7.5 Оценка сходства-различия распределений признаков
- •8. Изучение взаимосвязи психологических явлений
- •8.1 Меры связи явлений, измеренных в номинативных шкалах
- •8.2 Корреляционная связь
- •8.2.1 Меры связи для явлений, измеренных в ранговых шкалах
- •8.2.2 Меры связи для явлений, измеренных в разных шкалах
- •8.2.3 Меры связи для явлений, измеренных в шкале интервалов или отношений
- •8.3 Корреляционный анализ
- •Список использованной литературы:
- •Критические значения f-критерия Фишера
- •Приложение 2 . Результаты штур, использованные при составлении задач настоящего методического пособия
- •11 Класса одной из школ Ленинградской области
- •Калинин а.А., Гусева с.И. Простейшие методы анализа данных в психологии
- •189620, Г. Пушкин, Петербургское шоссе, 10
7.4 Сравнение уровня признака в зависимых выборках
При сопоставлении уровня результатов в двух зависимых выборках, когда измерения производятся на одних и тех же испытуемых в различных условиях X и Y, следует учитывать взаимозависимость результатов у каждого отдельного испытуемого.
Формула t-критерия Стьюдента при решении задачи такого рода имеет вид
где di = xi - yi, т.е. разности значений признака для каждого испытуемого. Следует различать (di2) - сумму квадратов di - и ( di) 2 - квадрат суммы di.
Количество степеней свободы определяется по формуле
= N-1
Корректное применение t-критерия предполагает, что распределение признака относится к нормальному типу. Альтернативная гипотеза принимается, если t эмп t кр. Задача сравнения результатов двух зависимых выборок предполагает направленное изменение результатов в ту или иную сторону, поэтому критические значения t кр берутся из колонки для одностороннего критерия.
В программе Microsoft Excel расчет эмпирического значения критерия Стьюдента для зависимых выборок выполняется с использованием встроенного «Парного двухвыборочного t-теста для средних». Чтобы воспользоваться встроенной функцией Microsoft Excel надо войти в раздел «Анализ данных» из меню «Сервис», где и выбрать «Парный двухвыборочный t-тестдля средних». На экране высвечивается меню «Парного двухвыборочного t-теста для средних», в котором задаются интервалы обеих переменных, вероятность ошибки первого рода Альфа и выходной интервал (номер левой верхней ячейки выходного интервала). Гипотетическая средняя разность равна нулю по умолчанию. Выходные данные включают средние арифметические значения переменных в выборках, значения дисперсии, количество наблюдений в выборках, коэффициент линейной корреляции Пирсона, число степеней свободы, эмпирическое значение t-критерия и критические значения для одностороннего и двустороннего критериев.
Задача: Учащиеся старших классов выполняли тест ADOR в десятом, а затем через год в одиннадцатом классе. Увеличился ли за это время показатель враждебности к матери у девушек-учениц данной школы?
Н0: уровень враждебности к матери у девушек в 11 классе значимо не выше такового в 10 классе.
Н1: показатели уровня враждебности к матери у девушек в 11 классе выше уровня враждебности, который был за год до этого - в 10 классе.
Таблица 14
Оценка значимости изменения показателя враждебности к матери по тесту ADOR для учениц одной из школ Ленинградской области (по t-критерию Стьюдента) |
|
|||||
Результат по тесту ADOR |
|
|
|
|||
в 11классе |
в 10 классе |
d |
d2 |
|
||
11 |
11 |
0 |
0 |
|
||
12 |
11 |
1 |
1 |
|
||
13 |
7 |
6 |
36 |
|
||
5 |
4 |
1 |
1 |
|
||
13 |
13 |
0 |
0 |
|
||
19 |
8 |
11 |
121 |
|
||
12 |
3 |
9 |
81 |
|
||
11 |
9 |
2 |
4 |
|
||
11 |
4 |
7 |
49 |
|
||
9 |
9 |
0 |
0 |
|
||
17 |
2 |
15 |
225 |
|
||
4 |
2 |
2 |
4 |
|
||
0 |
6 |
-6 |
36 |
|
||
14 |
8 |
6 |
36 |
|
||
7 |
5 |
2 |
4 |
|
||
3 |
1 |
2 |
4 |
|
||
11 |
9 |
2 |
4 |
|
||
17 |
6 |
11 |
121 |
|
||
9 |
6 |
3 |
9 |
|
||
17 |
7 |
10 |
100 |
|
||
13 |
2 |
11 |
121 |
|
||
4 |
3 |
1 |
1 |
|
||
10 |
12 |
-2 |
4 |
|
||
0 |
6 |
-6 |
36 |
|
||
4 |
1 |
3 |
9 |
|
||
10 |
4 |
6 |
36 |
|
||
8 |
2 |
6 |
36 |
|
||
7 |
11 |
-4 |
16 |
|
||
12 |
3 |
9 |
81 |
|
||
14 |
3 |
11 |
121 |
|
||
4 |
10 |
-6 |
36 |
|
||
5 |
7 |
-2 |
4 |
|
||
4 |
5 |
-1 |
1 |
|
||
13 |
9 |
4 |
16 |
|
||
|
|
di =114 |
(di2) =1354 |
|
||
Мх = 9.50 = 4.937 |
Мх = 6.15 = 3.421 |
(di)2/34 = 382,2 |
|
|
||
|
=3,603 |
t кр.=2.44 (=0.01) |
|
|||
tэмп.>tкр. принимается альтернативная гипотеза. Ответ: враждебность девушек в 11 классе по отношению к матери (по тесту ADOR) значимо выше, чем она была у них за год до этого (р=0.01). |
Если измерения проводились на двух зависимых выборках, но распределение признака хотя бы в одной из них оказалось отличным от нормального, либо недостаточным является объем выборок, то для оценки значимости изменений в этом случае используется непараметрический Т-критерий Вилкоксона для попарных сравнений. Т-критерий Вилкоксона применяется для признаков, измеренных в шкалах рангов, интервалов или отношений в двух различных условиях на одной и той же группе испытуемых. Критерий используется при минимальном количестве испытуемых 5 человек, а максимальное количество - 50 испытуемых (это ограничение связано с тем, что для большего числа испытуемых критические значения критерия не рассчитаны).
Вычисления производятся в следующей последовательности:
Находится разность результатов для каждого испытуемого: из результата при условии 2 вычитается результат при условии 1.
Полученные разности ранжируются от наименьшего к наибольшему по абсолютной величине. Нулевые разности не учитываются.
Отдельно записываются ранги положительных и отрицательных разностей и суммируются отдельно. Правильность подсчета суммы рангов проверяется так же, как в критерии Манна-Уитни.
В качестве эмпирического значения принимается наименьшая сумма рангов.
Эмпирическое значение Т-критерия сравнивается с табличными значениями критических значений для =0.05 и =0.01 (Таблица 8 Приложения) и числа испытуемых в исходной выборке. Нулевая гипотеза отклоняется, если Тэмп Ткрит.
Аналогично приведенным выше задачам, если нас интересует только сам факт наличия изменений в выборке, то используются критические значения для двустороннего критерия, а если нам важна направленность изменений (при использовании Т-критерия Вилкоксона это случается чаще), то берутся критические значения для одностороннего критерия.
Задача: Учащиеся старших классов (юноши) выполняли тест ADOR в десятом, а затем через год в одиннадцатом классе. Увеличился ли за это время показатель враждебности к отцу у юношей - учеников данной школы?
Н0: уровень враждебности к отцу у юношей в 11 классе не выше такового в 10 классе.
Н1: показатели уровня враждебности к отцу у юношей в 11 классе значимо выше уровня враждебности, который был за год до этого - в 10 классе.
Таблица 15
Оценка значимости изменения показателя враждебности к отцу по тесту ADOR для учеников одной из школ Ленинградской области |
||||
11 класс |
10 класс |
Разность |
Абс.значение разности |
Ранговый номер |
7 |
1 |
6 |
6 |
7 |
4 |
12 |
-8 |
8 |
9,5 |
12 |
6 |
6 |
6 |
7 |
1 |
2 |
-1 |
1 |
1,5 |
12 |
12 |
0 |
|
|
2 |
8 |
-6 |
6 |
7 |
8 |
5 |
3 |
3 |
4 |
3 |
3 |
0 |
|
|
5 |
3 |
2 |
2 |
3 |
8 |
7 |
1 |
1 |
1,5 |
10 |
2 |
8 |
8 |
9,5 |
5 |
1 |
4 |
4 |
5 |
14 |
5 |
9 |
9 |
11 |
Me= 7 q=3.75 |
Me=5 q=2.75 |
|
|
|
Сумма |
|
|
|
66 |
T(+) = |
48 |
|
|
|
T(-) = |
18 |
|
|
|
Т эмп.=18. Ткр.=19 (при =0.01)
Т эмп.< Ткр. (при =0.01) принимается альтернативная гипотеза.
Ответ: показатель враждебности к отцу у учеников 11 класса значимо выше, чем он был за год до этого (р=0.01).
L-критерий Пейджа по своему назначению схож с Т-критерием Вилкоксона, с той разницей, что он применяется для сопоставления трех и более показателей, измеренных на одной и той же выборке испытуемых. При этом он не только констатирует наличие изменений, но и указывает их направление. Критерий позволяет проверить наши предположения об определенной возрастной или ситуативной динамике. Таблицы критических значений критерия рассчитаны лишь для небольших выборок (от 2 до 12 испытуемых) и ограниченное количество сопоставляемых замеров (до 6).
Порядок действий при использовании L-критерия Пейджа следующий:
Проранжировать индивидуальные значения, полученные в первом, втором, третьем и т.д. замерах для каждого из испытуемых. Самому низкому значению присвоить ранг 1, самому высокому - наивысший, согласно числу замеров.
Просуммировать ранги по условиям, при которых выполнялись замеры. Проверить совпадение общей суммы рангов с расчетной по формуле R=nc(c+1)/2, где n - число испытуемых, с - число замеров.
Расположить условия в таблице в порядке возрастания ранговых сумм.
Определить значение L по формуле
L=(Tj.j),
где Tj- сумма рангов по данному условию, а j - порядковый номер, приписанный данному условию в упорядоченной последовательности условий.
По таблицам критических значений (Таблица 9 Приложения) определить критические значения L для данного количества испытуемых N и для данного количества условий с. Если L равен критическому значению или превышает его, то тенденция достоверна.
Задача: Изменяется ли уровень тревожности испытуемых в течение дня?
Таблица 16
№ |
Утром |
Днем |
Вечером |
1 |
8 |
7 |
8 |
2 |
4 |
6 |
8 |
3 |
5 |
11 |
10 |
4 |
4 |
6 |
9 |
5 |
4 |
3 |
8 |
6 |
3 |
5 |
13 |
7 |
6 |
6 |
7 |
Н0: уровень тревожности в течение дня значимо не изменяется.
Н1: уровень тревожности в течение дня значимо повышается.
Таблица 17.
№ |
Утром |
Ранг |
Днем |
Ранг |
Вечером |
Ранг |
1 |
8 |
2.5 |
7 |
1 |
8 |
2.5 |
2 |
4 |
1 |
6 |
2 |
8 |
3 |
3 |
5 |
1 |
11 |
3 |
10 |
2 |
4 |
4 |
1 |
6 |
2 |
9 |
3 |
5 |
4 |
2 |
3 |
1 |
8 |
3 |
6 |
3 |
1 |
5 |
2 |
13 |
3 |
7 |
6 |
1.5 |
6 |
1.5 |
7 |
3 |
Сумма рангов |
10 |
|
12.5 |
|
19.5 |
Результаты ранжирования по строкам и суммы рангов для каждого из условий приведены в таблице. Проверка по формуле R = n c(c+1)/2=42 подтверждает правильность ранжирования. Колонки расположены в порядке возрастания ранговых сумм, поэтому колонка «утро» получает номер 1, колонка «день» номер 2 и «вечер» - номер 3. Теперь можно рассчитать эмпирическое значение L-критерия: Lэмп=10х1+12.5х2+19.5х3 = 93.5. Эмпирическое значение критерия Lэмп больше критического Lкр=93 для уровня доверительной вероятности 95%, поэтому можно принять альтернативную гипотезу.
Ответ: тенденция увеличения уровня тревожности в течение дня является достоверной (=0.05).