- •3. Основные понятия математической статистики важные для психологии
- •4. Меры центральной тенденции
- •5. Меры рассеивания
- •6. Меры связи двух случайных величин
- •6.6. Примеры расчетов коэффициентов корреляции
- •7. Статистичекая проверка гипотез
- •7.12. Обнаружение интересующего исследователя эффекта в одной или разных выборках испытуемых.
- •8. Дисперсионный анализ
- •9. Регрессионный анализ
- •10. Факторный анализ
- •Список литературы
- •Критические значения коэффициента Стьюдента (t-критерия) для различной доверительной вероятности p и числа степеней свободы f:
- •Критерий χ²r Фридмена Алгоритм
- •Литература:
Список литературы
1. Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. – К., 1989.
2. Глас Дж., Стенли Дж. Статистичні методи в педагогиці та психології. − М.: Прогрес, 1976.
3. Рокицкий П.Ф. Биологическая статистика. Изд. 2-е, испр. − Минск: Высшая школа, 1967.
4. Сидоренко Е.В. Методы статистической обработки экспериментальных психологических даннях. − Л.: Соціально-психологический центр, 1996.
5. Скворцов С.Ю. Основи курса „Мат. методы в психологии”, ч.1. − Киров: ВСЭИ, 1998.
6. Суходольский Г.В. Основы математической статистики для психологов. − Л.: ЛГУ, 1989.
7. Шошин П.Б. Психологические измерения. Ч.1. под ред. М.Б. Михайлевской. − М.: МГУ, 1989.
ПРИЛОЖЕНИЕ 1
Критические значения коэффициента Стьюдента (t-критерия) для различной доверительной вероятности p и числа степеней свободы f:
f |
p |
|||||||
0.80 |
0.90 |
0.95 |
0.98 |
0.99 |
0.995 |
0.998 |
0.999 |
|
1 |
3.0770 |
6.3130 |
12.7060 |
31.820 |
63.656 |
127.656 |
318.306 |
636.619 |
2 |
1.8850 |
2.9200 |
4.3020 |
6.964 |
9.924 |
14.089 |
22.327 |
31.599 |
3 |
1.6377 |
2.35340 |
3.182 |
4.540 |
5.840 |
7.458 |
10.214 |
12.924 |
4 |
1.5332 |
2.13180 |
2.776 |
3.746 |
4.604 |
5.597 |
7.173 |
8.610 |
5 |
1.4759 |
2.01500 |
2.570 |
3.649 |
4.0321 |
4.773 |
5.893 |
6.863 |
6 |
1.4390 |
1.943 |
2.4460 |
3.1420 |
3.7070 |
4.316 |
5.2070 |
5.958 |
7 |
1.4149 |
1.8946 |
2.3646 |
2.998 |
3.4995 |
4.2293 |
4.785 |
5.4079 |
8 |
1.3968 |
1.8596 |
2.3060 |
2.8965 |
3.3554 |
3.832 |
4.5008 |
5.0413 |
9 |
1.3830 |
1.8331 |
2.2622 |
2.8214 |
3.2498 |
3.6897 |
4.2968 |
4.780 |
10 |
1.3720 |
1.8125 |
2.2281 |
2.7638 |
3.1693 |
3.5814 |
4.1437 |
4.5869 |
11 |
1.363 |
1.795 |
2.201 |
2.718 |
3.105 |
3.496 |
4.024 |
4.437 |
12 |
1.3562 |
1.7823 |
2.1788 |
2.6810 |
3.0845 |
3.4284 |
3.929 |
4.178 |
13 |
1.3502 |
1.7709 |
2.1604 |
2.6503 |
3.1123 |
3.3725 |
3.852 |
4.220 |
14 |
1.3450 |
1.7613 |
2.1448 |
2.6245 |
2.976 |
3.3257 |
3.787 |
4.140 |
15 |
1.3406 |
1.7530 |
2.1314 |
2.6025 |
2.9467 |
3.2860 |
3.732 |
4.072 |
16 |
1.3360 |
1.7450 |
2.1190 |
2.5830 |
2.9200 |
3.2520 |
3.6860 |
4.0150 |
17 |
1.3334 |
1.7396 |
2.1098 |
2.5668 |
2.8982 |
3.2224 |
3.6458 |
3.965 |
18 |
1.3304 |
1.7341 |
2.1009 |
2.5514 |
2.8784 |
3.1966 |
3.6105 |
3.9216 |
19 |
1.3277 |
1.7291 |
2.0930 |
2.5395 |
2.8609 |
3.1737 |
3.5794 |
3.8834 |
20 |
1.3253 |
1.7247 |
2.08600 |
2.5280 |
2.8453 |
3.1534 |
3.5518 |
3.8495 |
21 |
1.3230 |
1.7200 |
2.2.0790 |
2.5170 |
2.8310 |
3.1350 |
3.5270 |
3.8190 |
22 |
1.3212 |
1.7117 |
2.0739 |
2.5083 |
2.8188 |
3.1188 |
3.5050 |
3.7921 |
23 |
1.3195 |
1.7139 |
2.0687 |
2.4999 |
2.8073 |
3.1040 |
3.4850 |
3.7676 |
24 |
1.1378 |
1.7109 |
2.0639 |
2.4922 |
2.7969 |
3.0905 |
3.4668 |
3.7454 |
25 |
1.3163 |
1.7081 |
2.0595 |
2.4851 |
2.7874 |
3.0782 |
3.4502 |
3.7251 |
26 |
1.315 |
1.705 |
2.059 |
2.478 |
2.778 |
3.0660 |
3.4360 |
3.7060 |
27 |
1.3137 |
1.7033 |
2.0518 |
2.4727 |
2.7707 |
3.0565 |
3.4210 |
3.6896 |
28 |
1.3125 |
1.7011 |
2.0484 |
2.4671 |
2.7633 |
3.0469 |
3.4082 |
3.6739 |
29 |
1.3114 |
1.6991 |
2.0452 |
2.4620 |
2.7564 |
3.0360 |
3.3962 |
3.8494 |
30 |
1.3104 |
1.6973 |
2.0423 |
2.4573 |
2.7500 |
3.0298 |
3.3852 |
3.6460 |
Понятие о непараметрических критериях
Непараметрическими критериями называют те приемы обработки экспериментальных данных, которые не рассматривают анализируемое статистическое распределение как функцию, их применение не предполагает предварительного вычисления параметров распределения. Эти критерии сопоставляют не сами по себе полученные величины, а порядок их расположения, их соотношение по типу больше – меньше.
В большинстве психолого-педагогических исследованиях для оценки существенных различий используют параметрический t - критерий Стьюдента, который основан на предположении, что сравниваемые выборки принадлежат нормальным распределениям совокупностей. Между тем, в психологических исследованиях распределения могут значительно отличаться от нормального. В этих случаях и даже тогда, когда просто неизвестно, являются ли распределения нормальными, применение t – критерия является необоснованным и может привести к ошибочным заключениям. Именно поэтому все большее распространение получают непараметрические критерии различий, не зависящие от формы распределений. Их название связано с тем, что эти критерии не требуют вычисления параметров известных распределений.
Назовем основные преимущества непараметрических критериев:
- при распределениях, близких к нормальному, они дают хороший результат;
- при распределениях, далеких от нормального, позволяют обнаружить существенные различия, когда t-критерий их не выявляет;
- не все психологические признаки распределяются нормально;
- применимость к порядковым, а не строго к количественным показателям;
- рассмотрение качественных признаков, которые выражаются порядковыми номерами или индексами;
- небольшая трудоемкость исследования и относительная простота математического аппарата.
Данные. Для исследования нужны однородные объекты, разделенные на две группы. Взаимные влияния и взаимодействия должны быть исключены. Для каждого объекта регистрируется некоторая его числовая характеристика. Возникающие при этом две группы чисел можно рассматривать как две независимые выборки.
Постановка задачи. Какие задачи наиболее часто рассматриваются при сравнении двух выборок? Обычно две выборки получаются как результаты применения различных условий эксперимента к двум группам испытуемых, однородных по своему составу. Изменение условий эксперимента обычно сказывается на изменении положения распределения измеряемой числовой характеристики на числовой прямой. Масштаб и форма распределения при малых изменениях условий эксперимента обычно остаются практически неизменными. При больших изменениях наряду с изменением положения распределения изменяется и его дисперсия. Крайне редко происходит изменение самой формы распределения, поэтому при исследовании различий в двух выборках обычно предполагают, что законы распределения двух анализируемых выборок отличаются только сдвигом и относятся к сдвиговому семейству распределений. Исследователю приходится иметь дело не только с количественными, но и с качественными признаками, многие из которых выражаются порядковыми номерами, индексами и другими условными знаками. В таких случаях необходимо использовать непараметрические критерии.
G – КРИТЕРИЙ ЗНАКОВ
Назначение
G-критерий знаков применяется при выяснении направления сдвига при переходе от первого измерения ко второму на одной и той же выборке испытуемых.
Ограничения
Количество измерений в каждом из двух замеров не менее 5 и не более 300, т.е. 5 ≤ n1 ≤ 300 и 5 ≤ n2 ≤ 300.
Алгоритм использования
1. проверить выполнение ограничений;
2. занести данные измерений в таблицу:
Испытуемые |
1 |
2 |
3 |
… n |
Значения «до воздействия» |
. |
. |
. |
… . |
Значения «после воздействия» |
. |
. |
. |
… . |
Сдвиг («после» - «до») |
. |
. |
. |
…. |
Сдвиг количественно не подсчитывается, ставится просто, знак разности (« + » или « - »), когда из значения «после воздействия» вычитается значение «до воздействия». Если разность эта равна нулю, то в таблице пишут нуль.
3. подсчитать количество нулевых реакций n0 и вычесть их из объема выборки п. Новый объем выборки найти по формуле: n = n - n0;
4. определить, каких сдвигов больше: положительных или отрицательных. Считать «типичными» те сдвиги, которых больше. А «нетипичными» - те, которых меньше;
5. сформулировать гипотезы:
Но: Сдвиг в типичную сторону является случайным;
H1: Сдвиг в типичную сторону является неслучайным.
6. подсчитать количество «нетипичных» сдвигов и найти эмпирическое значение G-критерия: G эмп. равно количеству «нетипичных» сдвигов;
7. по таблице 1 приложения по значению n найти G кр. (p ≤ 0,05) и G кр. (p ≤ 0,01), изобразить все полученные значения на оси значимости.
зона значимости зона неопределенности зона не значимости
G кр. (p ≤ 0,01) G кр. (p ≤ 0,05)
Если G эмп. ≤ G кр. на некотором уровне значимости, то H0 отвергается, а H1 принимается на этом уровне значимости.
Если G эмп. › G кр. на некотором уровне значимости, то H0 принимается на том же уровне значимости. Чем меньше G эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен.
Замечание
На практике всегда желательно брать группу испытуемых больше пяти человек.
Пример 1
На одной и той же группе испытуемых произведены два замера некоторого признака - «до обучения» и «после обучения». Можно ли считать обучение эффективным, если результаты таковы:
Испытуемые |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Значения «до» |
8 |
6 |
3 |
2 |
5 |
5 |
7 |
8 |
10 |
12 |
Значения «после» |
12 |
8 |
3 |
5 |
10 |
4 |
9 |
8 |
9 |
15 |
Решение
Оценки испытуемых в общей массе после воздействия возросли, то есть без исследования можно было бы сделать вывод об эффективности обучения.
Так как речь идет об одной группе испытуемых, то следует применить G - критерий знаков, действуя по алгоритму:
1. Проверим ограничения. Так как n = 10 и 5 < 10 < 300, то критерий применим.
2. Заполним таблицу вида:
Испытуемые |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Значения «до» |
8 |
6 |
3 |
2 |
5 |
5 |
7 |
8 |
10 |
12 |
Значения «после» |
12 |
8 |
3 |
5 |
10 |
4 |
9 |
8 |
9 |
15 |
Сдвиг («после» - «до) |
+ |
+ |
0 |
+ |
+ |
- |
+ |
0 |
- |
+ |
3. подсчитаем количество нулевых реакций и найдем новый объем выборки. Количество n0 = 2, значит n = 10 - 2 = 8 - новый объем выборки;
4. подсчитаем количество положительных и отрицательных сдвигов: сдвигов «+» - 6, сдвигов «-» - 2. Значит, «+» сдвиги - «типичные», а « - » сдвиги - «нетипичные»;
5. сформулируем гипотезы:
H0: Сдвиг показателей в типичную сторону является случайным;
H1: Сдвиг показателей в типичную сторону является неслучайным.
6. найдем G эмп., равное количеству «нетипичных сдвигов» - 2;
7. по таблице 1 для критерия знаков приложения для n = 8 найдем
G кр. (p ≤ 0,05) = 1 и G кр. (p ≤ 0,01) = 0.
Изобразим ось значимости:
зона значимости зона неопределенности зона не значимости
G кр. (p ≤ 0,01) G кр. (p ≤ 0,05) G эмп.
Так как G эмп. > Gкp. (p ≤ 0,05), то Но принимается, т. е. различия случайны.
Ответ
Обучение нельзя считать эффективным.
Пример 2
В эксперименте по непроизвольному запоминанию слов 12 испытуемых (А, Б, В ... ) запомнили по разному слова, обозначающие профессии (слесарь, химик, электрик, физик, биолог, геолог, юрист, анатом, токарь, оператор) и обозначающие научные абстракции (гипотеза, суждение, аналогия, теорема, знание, вывод, закон, анализ, аксиома, синтез).
Значимы ли различия в эффективности запоминания этих категорий слов в данной группе испытуемых?
Объем запоминания |
испытуемые |
|||||||||||
А |
Б |
В |
Г |
Д |
Е |
Ж |
З |
И |
К |
Л |
М |
|
Профессии |
4 |
3 |
3 |
3 |
1 |
3 |
5 |
1 |
4 |
5 |
4 |
2 |
Научные абстракции |
1 |
4 |
2 |
2 |
2 |
4 |
1 |
4 |
2 |
2 |
0 |
1 |
1. проверим ограничения. Так как n = 12 и 5 < 12 < 300, то критерий применим;
2. составим таблицу:
Испытуемые |
А |
Б |
В |
Г |
Д |
Е |
Ж |
З |
И |
К |
Л |
М |
Профессии |
4 |
3 |
3 |
3 |
1 |
3 |
5 |
1 |
4 |
5 |
4 |
2 |
Научные абстракции |
1 |
4 |
2 |
2 |
2 |
4 |
1 |
4 |
2 |
2 |
0 |
1 |
Знак разности |
+ |
- |
+ |
+ |
- |
- |
+ |
- |
+ |
+ |
+ |
+ |
3. подсчитаем количество нулевых реакций: n0 = О, значит n = 12 - О = 12;
4. подсчитаем количество «+» и (-) сдвигов: сдвигов «+ » - 8, сдвигов «-» - 4. Значит, «+» сдвиги - «типичные», а «-), - «нетипичные»;
5. сформулируем гипотезы:
Н0: Сдвиг показателей в типичную сторону является случайным.
H1: Сдвиг показателей в типичную сторону является неслучайным.
6. найдем G эмп., равное количеству «нетипичных» сдвигов – 4;
7. по таблице 1 приложения для n = 12 найдем С кр. (p ≤ 0,05) = 3; т. к. G кр. (p ≤ 0,05) < G эмп., то Но принимается, т.е. различия случайны.
Ответ
Преобладание эффективности запоминания профессий по сравнению с эффективностью запоминания научных абстракций не является статистически значимым.
Т – критерий Вилкоксона
Назначение
Т-критерий Вилкоксона применяется для сопоставления показателей, измеренных на одной и той же выборке, и позволяет оценить не только направленность сдвигов, но и их интенсивность.
Ограничение
Объем выборки должен быть 5 ≤ n ≤ 50.
Алгоритм использования:
1. проверить выполнение ограничений;
2. поместить данные в таблицу, записав в первый столбец испытуемых в каком-то определенном порядке (или их коды), во второй - результаты первого замера, а в третий - результаты второго замера:
№ испытуемого |
Замер 1 |
Замер 2 |
di = «после» - «до» |
| di | |
Ранг | di | |
Ранг «не типичные» |
1 |
Х1 |
Y1 |
. |
. |
. |
. |
2 |
Х2 |
Y2 |
. |
. |
. |
. |
3 |
Х3 |
Y3 |
. |
. |
. |
. |
… |
… |
… |
… |
… |
… |
… |
n |
Xi |
Yi |
. |
. |
. |
. |
Суммы |
- |
- |
- |
- |
Ri=? |
∑Rнетип.=? |
3. вычислить разность между значениями di = «после» - «до» - «после» для каждого испытуемого и занести в четвертый столбец. Нулевые сдвиги, если они получились, далее не рассматривать, уменьшить объем выборки на количество нулевых сдвигов n0. Новый объем выборки n = n – n0.
В пятый столбец записать модули разностей: |di|, затем проранжировать их, приписывая меньшему значению меньший ранг, а равным значениям - равные ранги. Результаты ранжирования записать в шестой столбец таблицы. Проверить совпадение суммы рангов с расчетной суммой по формуле:
∑ Ri = (n + 1) : 2;
4. определить «типичные» и «нетипичные» сдвиги («типичные» - те, которых больше, «нетипичные» - те, которых меньше). Выписать ранги «нетипичных» сдвигов R нетипичн. в седьмой столбец таблицы и просуммировать их;
5. сформулировать гипотезы.
H0: Интенсивность сдвигов в типичном направлении не превышает интенсивность сдвигов в нетипичном направлении.
Н1: Интенсивность сдвигов в типичном направлении превышает интенсивность сдвигов в нетипичном направлении.
6. подсчитать эмпирическое значение критерия по формуле:
Т эмпир. = ∑ R нетип.
7. по n и таблице 2 приложения найти T кр. (p ≤ 0,05) и T (p ≤ 0,01). Построить ось значимости:
зона значимости зона неопределенности зона не значимости
T кр. (p ≤ 0,01) T кр. (p ≤ 0,05)
Если Т эмп. ≤ Т кр. на некотором уровне значимости, то Но отвергается и принимается Н1 на этом уровне значимости.
Если Т эмп. › Т кр. (p ≤ 0,05), то принимается Но.
Чем меньше Т эмп., тем более вероятно, что сдвиг в типичном направлении статистически достоверен.
Пример 1
На одной и той же группе испытуемых произведены два замера некоторого признака - «до обучения» и «после обучения». Можно ли считать обучение эффективным, если его результаты таковы:
-
Испытуемые
1
2
3
4
5
6
7
8
9
10
Значения «до»
8
6
3
2
5
5
7
8
9
15
Значения «после»
12
8
3
5
10
4
9
8
9
15
Решение
Используем для решения примера алгоритм Т-критерия:
1. проверим выполнимость ограничений: 5 ≤ 10 ≤ 50;
2. запишем данные в таблицу и сделаем необходимые вычисления:
№ испыт. |
Замер 1 |
Замер 2 |
di = «после» - «до» |
|di| |
Ранг |di| |
Ранг «нетип.» |
1 |
8 |
12 |
4 |
4 |
7 |
- |
2 |
6 |
8 |
2 |
2 |
3,5 |
- |
3 |
3 |
3 |
0 |
0 |
- |
- |
4 |
2 |
5 |
3 |
3 |
5,5 |
- |
5 |
5 |
10 |
5 |
5 |
8 |
- |
6 |
5 |
4 |
-1 |
1 |
1,5 |
1,5 |
7 |
7 |
9 |
2 |
2 |
3,5 |
- |
8 |
8 |
8 |
0 |
0 |
- |
- |
9 |
10 |
9 |
-1 |
1 |
1,5 |
1,5 |
10 |
12 |
15 |
3 |
3 |
5,5 |
- |
Суммы |
- |
- |
- |
- |
36 |
3 |
В пятом столбце получились числа 4; 2; 0; 3; 5; 1; 2; 0; 1; 3. Исключим нулевые сдвиги и подсчитаем новый объем выборки: n.= 10 - 2 = 8;
3. запишем модули сдвигов в ряд по возрастанию и укажем их места в этом ряду, а затем припишем соответствующие ранги:
|di| |
1 |
1 |
2 |
2 |
3 |
3 |
4 |
5 |
Место |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
Ранг |
1,5 |
1,5 |
3,5 |
3,5 |
5,5 |
5,5 |
7 |
8 |
Проверим совпадение ранговой суммы с контрольной:
∑ Ri = 1,5 + 1,5 + 3,5 + 3,5 + 5,5 + 5,5 + 7 + 8 = 36;
n * (n + 1) : 2 = 8 * (8 + 1) : 2 = 36;
4. определим, какие сдвиги являются «типичными», а какие - «нетипичными». Положительных сдвигов больше, их шесть, значит, они «типичные». Отрицательных - меньше, их всего два, значит, они «нетипичные»;
5. сформулируем гипотезы:
Н 0: интенсивность сдвига в типичном направлении не превосходит интенсивность сдвига в нетипичном направлении;
Н 1: интенсивность сдвига в типичном направлении превосходит интенсивность сдвига в нетипичном направлении.
6. подсчитаем Т эмп. = ∑ R нетип. = 1,5 + 1,5 = 3;
6. по числу n и таблице 2 приложения найдем Т кр. (p ≤ 0,05) = 5 и Т кр. (p ≤ 0,0 1) = 1. Построим ось значимости и отметим на ней все найденные значения:
зона значимости зона неопределенности зона не значимости
1 3 2
T кр. (p ≤ 0,01) Т эмп. T кр. (p ≤ 0,05)
Так как Т эмп. < Т кр. (p ≤ 0,05), то Н 0 отвергается и принимается Н 1, на уровне значимости p ≤ 0,05, то есть сдвиг в типичном направлении более интенсивен, чем сдвиг в нетипичном направлении, что мы можем утверждать с вероятностью, большей 95 %.
Ответ
Обучение можно считать эффективным (с вероятностью, большей 95 %).
С помощью Т - критерия мы выявили неслучайный сдвиг в положительном направлении при воздействии, то есть можно с вероятностью, большей 95 %, сказать, что обучение эффективно, но с вероятностью, большей 99 %, этого утверждать нельзя, так как Т эмп. › Т кр. (p ≤ 0,0 1).
Пример 2
В эксперименте по непроизвольному запоминанию слов 12 испытуемых (А, Б, В ... ) запомнили по-разному слова, обозначающие профессии (слесарь, химик, электрик, физик, геолог, биолог, юрист, анатом, токарь, оператор) и обозначающие научные абстракции (гипотеза, суждение, аналогия, теорема, знание, вывод, закон, анализ, аксиома, синтез).
Объем запоминания |
А |
Б |
В |
Г |
Д |
Е |
Ж |
З |
И |
К |
Л |
М |
Профессии |
4 |
3 |
3 |
5 |
1 |
3 |
5 |
1 |
4 |
5 |
4 |
2 |
Научные абстракции |
1 |
4 |
2 |
2 |
2 |
4 |
1 |
4 |
2 |
2 |
0 |
1 |
Значимы ли различия в эффективности запоминания этих категорий слов в данной группе испытуемых?
Решение
1. проверим выполнимость ограничений: 5 ≤ 12 ≤ 50;
2. запишем данные в таблицу и сделаем необходимые вычисления:
Профессии |
4 |
3 |
3 |
5 |
1 |
3 |
5 |
1 |
4 |
5 |
4 |
2 |
Научные абстракции |
1 |
4 |
2 |
2 |
2 |
4 |
1 |
4 |
2 |
2 |
0 |
1 |
Разность |
+3 |
-1 |
+1 |
+3 |
-1 |
-1 |
+4 |
-3 |
+2 |
+3 |
+4 |
+1 |
Ранг разности по абсолютной величине |
8,5 |
3 |
3 |
8,5 |
3 |
3 |
11,5 |
8,5 |
6 |
8,5 |
11,5 |
3 |
3. поясним, как записывается нижняя строка. Наименьшее значение разности (- 1), таких значений 5 (независимо от знака), суммируем их номера (1, 2, 3, 4, 5), находим среднее арифметическое (- 3), проставляем всем единицам один и тот же ранг З. Следующий ранг - 6 получает значение разности 2. На ранги 7, 8, 9, 10 претендуют четыре значения 3, их помечаем рангом 8,5.
(7 + 8 + 9 + 10): 4 = 8,5
4. определим, какие сдвиги являются «типичными», а какие «нетипичными». Положительных - больше, их 8, значит они – «типичные». Отрицательных - меньше, их всего 4, значит, они - «нетипичные»;
5. сформулируем гипотезы:
Н 0: интенсивность сдвига в типичном направлении не превосходит интенсивность сдвига в нетипичном направлении;
Н 1: интенсивность сдвига в типичном направлении превосходит интенсивность сдвига в нетипичном направлении.
6. подсчитаем Т эмп. = ∑R нетип. = 3 + 3 + 3 + 8,5 = 17,5;
7. по таблице 2 приложения и n = 12 находим Т кр. (p ≤ 0,05) = 17, Т кр. (p ≤ 0,01) = 9;
Так как Т эмп. › Т кр. (p ≤ 0,01) и тем более Т эмп. › Т кр. (p ≤ 0,05), следовательно, различия в величинах объема запоминания разных качеств слов не являются в данной группе испытуемых статистически значимыми.
Угловой ф – критерий Фишера
Назначение
Угловой φ - критерий Фишера предназначен для сопоставления двух выборок по частоте встречаемости некоторого эффекта, заинтересовавшего исследователя. Особенно удобно его использовать при проверке «отсутствия - наличия эффекта» при сравнении контрольной и экспериментальной групп.
Ограничения
1. если n A и n B - объемы выборок, то n A ≥ 5, n B ≥ 5. Допускаются также случаи:
n A = 2, n B ≥ 30;
n A = 3, n B ≥ 7;
n A = 4, n B ≥ 5.
2. ни одна из сопоставляемых долей в каждой выборке не должна быть равна нулю.
Алгоритм использования
1. проверить выполнимость ограничений для n A и n B;
2. определить значения признака, которые будут делить испытуемых на тех, у которых «есть эффект». И на тех, у которых «нет эффекта». Подсчитать количество таких испытуемых в группах А и В. Занести данные в таблицу:
|
«Есть эффект» |
«Нет эффекта» |
Сумма |
Группа А |
А |
B |
A + B |
Группа В |
С |
D |
C + D |
|
А + С |
B + D |
A + B + C + D |
Проверить совпадение контрольной суммы A + B + C + D = n A + n B;
3. подсчитать процентные доли испытуемых, у которых «есть эффект», и тех, у кого «нет эффекта», в обеих выборках и занести в четырех клеточную таблицу:
|
«Есть эффект» (%) |
«Нет эффекта» (%) |
Группа А |
M (%) |
K (%) |
Группа В |
P (%) |
Q (%) |
Проверить, не равны ли некоторые процентные доли нулю. Если одна из долей равна нулю, то можно сдвинуть точку деления признака на две группы;
4. сформулировать гипотезы:
Н 0: доля испытуемых, у которых «есть эффект» в группе А, не выше доли испытуемых в группе В;
Н 1: доля испытуемых, у которых «есть эффект» в группе А, выше доли испытуемых в группе В.
5. по таблице 3.1 приложения найти величины углов φ 1 и φ 2 для процентной доли тех, у кого «есть эффект», в каждой выборке;
6. подсчитать эмпирическое значение критерия по формуле
φ эмп. = (φ 1 – φ 2) √ n 1 n 2 / n 1 + n 2;
7. по таблице 3.2 приложения определить р – уровень значимости различий для полученных процентных долей. Для контроля сравнить φ эмп. с φ кр. (p ≤ 0,05 ) = 1,64 и φ кр. (p ≤ 0,01) = 2,31.
Изобразить найденные значения на оси значимости:
зона значимости зона неопределенности зона не значимости
φ кр. (p ≤ 0,01) φ кр. (p ≤ 0,01)
Если φ эмп. ≥ φ кр. на некотором уровне значимости, то Н0 отвергается на этом уровне значимости. Если φ эмп. ≤ φ кр. (p ≤ 0,05), то принимается Н0.
Пример 1
Имеются две группы детей из параллельных средних групп детского сада, одна из них экспериментальная, другая - контрольная. В экспериментальной группе проводилась работа по развитию пространственных представлений по новой методике, в контрольной группе по обычной методике. После этого в обеих группах давалась задача на прохождение лабиринта. В экспериментальной группе из 20 человек с заданием справились 12, а в контрольной группе из 25 человек с заданием справились 10. Достоверно ли различаются результаты в этих группах?
Решение
1. проверим выполнимость ограничений:
(n 1 = 20 > 5 и n 2 = 25 > 5);
2. разделим группы детей на части с помощью признака «справился с заданием» и «не справился с заданием». Заполним таблицу:
|
«Есть эффект» |
«Нет эффекта» |
Сумма |
Экспериментальная группа |
12 |
8 |
20 |
Контрольная группа |
10 |
15 |
25 |
|
22 |
23 |
45 |
Контрольные суммы совпадают:
а + b + с + d = 12 + 8 + 10 + 15 = 20 + 25 = n1 + n2;
3. подсчитываем процентные доли количества детей, «справившихся с заданием» в экспериментальной и контрольной группах. В экспериментальной группе всего 20 человек, которые составляют 100 %, из них справились с заданием 12 человек, они составляют х %. Тогда
20 / 12 = 100 / х;
Х = 12 * 100 % / 20 = 60 %;
Значит, не справились с заданием в экспериментальной группе 100 % -60 % =40 %.
Аналогично, в контрольной группе 25 человек, которые составляют 100 %, из них справились с заданием 10 человек, которые составляют y %. Значит,
25 / 10 = 100 / y;
Y = 10 * 100% / 25 = 40%;
Тогда доля, не справившихся с заданием в контрольной группе равна 60 %.
Заполним четырехклеточную таблицу:
|
«Есть эффект» |
«Нет эффекта» |
Экспериментальная группа |
60 % |
40 % |
Контрольная группа |
40 % |
60 % |
Отсюда видно, что ни одна из процентных долей не равна нулю.
4. Сформулируем гипотезы:
Н 0: доля испытуемых в экспериментальной группе, у которых «есть эффект», не превосходит доли таких же испытуемых в контрольной группе;
Н 1: доля испытуемых в экспериментальной группе, у которых «есть эффект», превосходит долю таких же испытуемых в контрольной группе.
5. по таблице 3.1 приложения найти значения φ 1 и φ 2 по процентному содержанию тех испытуемых, у которых «есть эффект»:
φ 1 (60%) = 1,772;
φ 2 (40%) = 1,369.
6. подсчитаем
φ эмп. = (φ1 – φ2) √ n 1* n 2 = (1,772 – 1,369) √ 20 * 25 = 1,34;
n1 + n2 20 + 25
7. по таблице 3.2 приложения найдем уровень значимости различия процентных долей: φ эмп. = 1,34 соответствует уровню значимости p = 0,09.
Для практики этот уровень мал, поэтому следует сравнить φ эмп. с φ кр. (p ≤ 0,05) = 1,64 и φ кр. (p ≤ 0,01) = 2,31 (их тоже найти по таблице 3.2 приложения).
Ось значимости имеет следующий вид:
зона значимости зона неопределенности зона не значимости
1,34 1,64 2,31
φ эмп. φ кр. (p ≤ 0,05) φ кр. (p = 0,01)
Так как φ эмп. < φ кр. (p ≤ 0,05), а тем более φ эмп. < φ кр. (p ≤ 0,01), то принимается Н 0 с вероятностью ≥ 99 %.
Доля детей в экспериментальной группе, которые справились с заданием, не выше, чем доля таких детей в контрольной группе. Статистически такой процент различий недостаточен (хотя, на первый взгляд, разница в показателях у них большая - 20 %).
Ответ
Различия в результатах групп статистически незначительны.
Пример 2
В эксперименте по исследованию интермодального переноса получено, что в одной группе испытуемых более эффективным оказалось тактильное ознакомление с последующим зрительным узнаванием (8 человек из 14), тогда как во второй группе (nb = 10 чел.) только для трех испытуемых этот вид переноса был эффективнее, чем перенос в направлении зрение-осязание. Значимы ли различия этих двух групп испытуемых в части эффективности переноса осязание-зрение?
Решение
1. проверим выполнимость ограничений
(n А = 14 > 5 и n B =10 > 5);
2. разделим группы детей на части с помощью признака «справился с заданием» и «не справился с заданием». Заполним таблицу:
|
«Есть эффект» |
«Нет эффекта» |
Сумма |
Группа А |
8 |
6 |
14 |
Группа В |
3 |
7 |
10 |
|
11 |
13 |
24 |
Контрольные суммы совпадают:
a + b + c + d = 8 + 6 + 3 + 7 = 14 + 10 = n A + n B;
3. подсчитаем процентные доли количества детей, «справившихся с заданием» и «не справившихся с заданием) в группе А и группе В. В группе А всего 14 человек, которые составляют 100 %, из них справились с заданием 8 человек, они составляют х %. Тогда:
14 / 3 = 100 / x;
Х = 8 * 100 % / 14 = 57 %.
Значит, не справились с заданием в экспериментальной группе 100% - 57 % = 43 %.
Аналогично, во второй группе 10 человек, которые составляют 100%, из них справились с заданием 3 человека, которые составляют у %. Значит:
10 / 3 = 100 / y;
Y = 3 * 100 % / 10 = 30 %.
Тогда доля, не справившихся с заданием в контрольной группе равна 100 % - 30 % = 70 %. Заполним таблицу:
|
«Есть эффект» |
«Нет эффекта» |
Группа А |
57 % |
43 % |
Группа В |
30 % |
70 % |
Ни одна из процентных долей не равна нулю.
4. Сформулируем гипотезы:
Н 0: доля испытуемых в группе А, у которых «есть эффект», превосходит доли таких же испытуемых в группе В;
Н 1: доля испытуемых в группе А, у которых «есть эффект», не превосходит долю таких же испытуемых в группе В;
5. по таблице 3.1 приложения найдем значения φ 1 и φ 2 по процентному содержанию тех испытуемых, у которых «есть эффект»:
φ 1 (57 %) = 1,711;
φ 2 (30%) = 1,159.
6. Подсчитаем
φ эмп. = (φ1 – φ2) √ n 1* n 2 = (1,711 – 1,159) √ 14 * 10 = 1,33;
n1 + n2 14 + 10
7. по таблице 3.2 приложения для уровня статистической значимости разных значений φ - критерия найдем уровень значимости различия процентных долей: φ эмп. = 1,33, соответствует уровню значимости p = 0,092.
Сравним φ эмп. с φ кр. (p ≤ 0,05) = 1,64 и φ кр. (p ≤ 0,01) = 2,31.
Ось значимости имеет следующий вид:
зона значимости зона неопределенности зона не значимости
1,33 1,64 2,31
φ эмп. φ кр. (p ≤ 0,05) φ кр. (p = 0,01)
Так как φ эмп. < φ кр. (p ≤ 0,05) и тем более φ эмп. < φ кр. (p ≤ 0,0 1), то принимается Н 0...
Ответ
Различия в результатах групп статистически незначимы.
Q – критерий Розенбаума
Назначение
Q-критерий Розенбаума применяется для оценки различий между двумя независимыми выборками по уровню какого-либо признака или свойства, измеренного количественно.
Ограничения
В каждой выборке должно быть не менее 11 наблюдений, т.е. n 1 ≥ 11, n 2 ≥ 11, n 1 ≈ n 2.
При этом:
если n 1 ≤ 50, n 2 ≤ 50, то (n 1 – n2) ≤ 10;
если 51 ≤ n 1 ≤ 100, то (n l – n 2) ≤ 20;
если n 1 ≥ 100, n 2 ≥ 100, то n 1 : n 2 ≤ 1,5, где n 1 ≥ n 2.
Алгоритм использования
1. проверить выполнение ограничений критерия:
(n 1 ≥ 11, n 2 ≥ 11, n 1 ≈ n 2)
2. упорядочить значения признака в каждой выборке по убыванию. Определить в каждой выборке максимальное и минимальное значения исследуемого параметра. Считать первой ту выборку, в которой максимальное значение параметра больше, а второй - ту, в которой максимальное значение меньше.
3. сформулировать гипотезы:
Н 0: уровень признака в выборке 1 не превышает уровня признака в выборке 2;
Н 1: уровень признака в выборке 1 превышает уровень признака в выборке 2;
4. подсчитать количество значений (S 1) в выборке 1, которые больше максимального значения в выборке 2, и количество значений (S 2) в выборке 2, которые меньше минимального значения в выборке 1;
5. найти эмпирическое значение Q-критерия Розенбаума по формуле:
Q эмп. = S 1 + S 2;
6. по таблице 4 приложения для данных n 1 и n 2 определить критические значения критерия с уровнями значимости p ≤ 0,05 и p ≤ 0,01. Сравнить Q эмп. и Q кр..
Если Q кр. ≥ Q кр. на некотором уровне значимости, то Н 0 отклоняется на том уровне значимости, на котором вычислено критическое значение, а принимается Н 1. Если Q эмп. < Q кр. (p ≤ 0,05), то принимается Н 0.
Чем больше значения Q эмп., тем более достоверны различия.
Построить ось значимости:
зона значимости зона неопределенности зона не значимости
Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01)
Замечание
Q - критерий нежелательно применять тогда, когда максимальное и минимальное значения признака принадлежит одной группе. В этом случае погрешность очень велика.
Пример 1
У двух групп испытуемых (группа А и группа В) измерен по одной и той же методике уровень вербального интеллекта. Можно ли утверждать, что в первой группе оценки выше, чем во второй?
Оценки таковы:
группа А: 121; 104; 115; 116; 115; 109; 115; 109; 108; 112; 112;109.
группа В: 121; 113; 123; 124; 121; 121; 120; 121; 111; 116; 118; 125; 125; 125; 126.
Решение
Так как даны две независимые выборки испытуемых, у которых измерен один и тот же признак, то можно попытаться применить Q-критерий Розенбаума.
1. проверим выполнимость ограничений:
n A = 12; n B = 15; (n A – n B) = (12 -15) == 3 < 10.
Ограничения выполнены.
2. упорядочим значения признака по убыванию в каждой выборке и найдем максимальное и минимальное значения признака:
группа А: 121; 116; 115; 115; 115; 112; 112; 109; 109; 109; 108; 104;
группа В: 126; 125; 125; 125; 124; 123; 121; 121; 121;121; 120; 118; 116; 113; 111;
x max (А) = 121; x min (A) = 104; x max (В) = 126; x min (B) = 111;
Назовем выборкой 1 группу В, выборкой 2 - группу А;
3. сформулируем гипотезы:
Н 0: уровень вербального интеллекта в выборке 1 не выше уровня вербального интеллекта в выборке 2;
H 1: уровень вербального интеллекта в выборке 1 выше уровня вербального интеллекта в выборке 2;
4. подсчитаем S 1 - количество значений в выборке 1, которые больше max значения в выборке 2, S 1 = 6, так как шесть значений в выборке 1 больше x max (2) = 121, а именно: 126, 125, 125, 125, 124, 123.
Так же для S 1 - количество значений в выборке 2, которые меньше минимального значения в выборке 1. S 2 = 5, так как в выборке 2 пять значений (109, 109, 109, 108 и 104), меньших х min (1) = 111;
5. найдем эмпирическое значение Q-критерия Розенбаума
Q эмп. = S 1 + S 2 = 6 + 5 = 11;
6. по таблице 4 приложения найдем для n 1 = 15 и n 2 = 12 Q кр. (p ≤ 0,05) = 7 и Q кр. (p ≤ 0,01) = 9.
Изобразим ось значимости:
зона значимости зона неопределенности зона не значимости
7 9 11
Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01) Q эмп.
Так как Q эмп. > Q кр. (p ≤ 0,01) (и больше Q кр. (p ≤ 0,05)), то Н 0 отвергается, Н l принимается с уровнем значимости p ≤ 0,01, т.е. различия статистически значимы.
Ответ
Уровень вербального интеллекта испытуемых группы В выше уровня вербального интеллекта испытуемых группы А, причем различия статистически значимы, достоверность получаемых различий более 99 %.
Пример 2
У двух групп испытуемых (группа А и группа В) измерен показатель концентрации внимания к:
группа А: 56,40,93,89,87,93,94,88,87, 71, 91, 58, 79, 69.
группа В: 74, 61, 74, 99, 75, 61, 74, 79, 70, 96, 45.
Можно ли утверждать, что в одной группе показатель выше, чем в другой?
Решение
Так как даны две независимые выборки испытуемых, у которых измерен один и тот же признак, то можно применить Q-критерий Розенбаума.
1. проверим выполнимость ограничений:
n 1 = 14; n 2 = 11; (n 1 – n 2) = (14 -11) =3 < 10.
Ограничения выполнены.
2. упорядочим значения признака по убыванию в каждой выборке и найдем максимальное и минимальное значения признака:
группа А: 94, 93, 93, 91, 89, 88, 87, 87, 79, 71, 69, 58, 56, 40;
группа В: 99, 96, 79, 75, 74, 74, 74, 70, 61, 61, 45;
x max (А) = 94; x min (А)= 40; x max (В) = 99; x min (B) = 45.
Назовем выборкой 1 группу В, выборкой 2 - группу А.
3. Сформулируем гипотезы:
Н 0: показатель концентрации внимания в выборке 1 не выше показателя концентрации внимания в выборке 2;
Н 1: показатель концентрации внимания в выборке 1 выше показателя концентрации внимания в выборке 2;
4. подсчитаем S 1 - количество значений в выборке 1, которые больше max значения в выборке 2 : S1 = 2 (96 › 94 и 99 > 94). Аналогично подсчитаем S 2 - количество значений в выборке 2, которые меньше минимального значения в выборке 1 : S 2 = 1 (40 < 45).
5. найдем эмпирическое значение Q-критерий Розенбаума:
Q эмп. = S 1 + S 2 = 2 + 1 = 3;
6. по таблице 4 приложения для n 1 = 14 и n 2 = 11 найдем Q кр. (p ≤ 0,05) = 7 и Q кр. (p ≤ 0,01) = 9.
Изобразим ось значимости:
зона значимости зона неопределенности зона не значимости
3 7 9
Q эмп. Q кр. (p ≤ 0,05) Q кр. (p ≤ 0,01)
Так как Q эмп. < Q кр. (p ≤ 0,05) и Q эмп. < Q кр. (p ≤ 0;01), то H 1 отвергается и принимается Н 0, т.е. различия статистически незначимы.
Ответ
Показатель концентрации внимания испытуемых группы В не выше показателя концентрации внимания в группе А.
U – критерий Манна-Уитни
-Уитни
Назначение
Предназначен для оценки различия величин членов двух выборок. Этот критерий основан на подсчете числа инверсий U (перестановок) членов в их общем упорядоченном ряду.
Ограничения
Объемы выборок должны удовлетворять условиям:
1. n 1 ≥ 3, n 2 ≥ 3, но допускается случай n 1 = 2, n 2 ≥ 5;
2. n 1 ≤ 60, n 2 ≤ 60, но на практике, если n 1 ≥ 20 и n 2 ≥ 20, то применение критерия затруднительно.
При больших объемах выборок лучше использовать другие критерии.
Алгоритм использования
1. проверить ограничения критерия;
2. объединить выборки А и В в одну общую выборку A U B, пометив принадлежность каждого индивидуального значения к данной группе (цветом, буквой, шифром). Упорядочить значения признака в объединенной выборке по возрастанию и проранжировать все значения, приписывая меньшему значению меньший ранг, а равным значениям - равный ранг;
3. разделить выборку на две прежние выборки А и В, ориентируясь на пометки. Подсчитать суммы рангов отдельно для каждой из выборок, обозначить их за Т а и Т в. Считать первой ту выборку, в которой значение по предварительной оценке выше, а второй - ту, в которой значения ниже. Пусть n А - объем выборки А, а n B - объем выборки В. Если ранжирование и подсчет произведены верно, то должно выполняться контрольное равенство:
Т а + Т в = (n А + n B) * (n А + n B + 1) : 2.
Результаты занести в таблицу:
Значения A U B |
х 1 |
х 2 |
х 3 |
… |
х n |
Суммы |
Место |
1 |
2 |
3 |
|
N |
… |
Ранг |
r 1 |
r 2 |
r 3 |
… |
r n |
… |
Выборка |
|
|
|
… |
|
… |
Ранги А |
|
|
|
… |
|
Т а = ? |
Ранги В |
|
|
|
… |
|
Т в = ? |
Здесь N = n А + n B - объем объединенной выборки.
4. cформулировать гипотезы:
Н 0: уровень признака в выборке 1 не выше уровня признака в выборке 2;
Н 1: уровень признака в выборке 1 выше уровня признака в выборке 2;
5. вычислить значения U – критерия для каждой из выборок:
U a = n A * n B + n A (n A + 1) – T a
2
U в = n A * n B + n B (n B + 1) – T в
2
Найти U эмп., равное наименьшему из величин U а и U в:
U эмп. = min (U a; U b);
6 по таблице 5 приложения по данным n 1 и n 2 найти U кр. (p ≤ 0,05) и U кр (p ≤ 0,01). Изобразить на оси значимости все найденные значения критерия.
если U эмп. ≤ U кр. на некотором уровне значимости, то H 0 отвергается, а H 1 принимается на этом уровне значимости;
если U эмп. › U кр. на некотором уровне значимости, то Н 0 принимается на том же уровне значимости;
чем меньше U эмпирический, тем более вероятно, что сдвиг в типичном направлении статистически достоверен.
Пример 1
Даны результаты тестирования двух групп испытуемых А и В по некоторому признаку или свойству:
группа А: 25; 14; 18; 16; 23; 22; 18; 19;
группа В: 28; 15; 26; 13; 15; 11; 20; 19; 10; 12;
Можно ли считать, что результаты тестирования в группе В выше, чем в группе А?
Решение
1. проверим ограничения критерия n А = 8, 8 > 3 и n B = 10, 10> 3;
2. объединим значения признака в одну общую выборку, приписывая меньшему значению меньший ранг и равным значениям - равные ранги;
3. полученные данные занесем в таблицу (3 - значение, М - место, В - выборка):
З |
10 |
11 |
12 |
13 |
14 |
15 |
15 |
16 |
18 |
18 |
19 |
19 |
20 |
22 |
23 |
25 |
26 |
28 |
М |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
r n |
1 |
2 |
3 |
4 |
5 |
6,5 |
6,5 |
8 |
9,5 |
9,5 |
11,5 |
11,5 |
13 |
14 |
15 |
16 |
17 |
18 |
B |
В |
В |
В |
В |
А |
В |
В |
А |
А |
А |
А |
В |
В |
А |
А |
А |
В |
В |
T a |
- |
- |
- |
- |
5 |
- |
- |
8 |
9,5 |
9,5 |
11,5 |
- |
- |
14 |
15 |
16 |
- |
- |
T в |
1 |
2 |
3 |
4 |
- |
6,5 |
6,5 |
- |
- |
- |
- |
11,5 |
13 |
- |
- |
- |
17 |
18 |
Подсчитаем сумму рангов в выборке А и в выборке В: T a = 88, T в = 82,5.
Проверим общую расчетную сумму:
(n А + n B) * (n А + n B + 1) : 2 = (8 + 1 0) * (8 + 10 + 1) : 2 = 171;
Т а + Т в = 88,5 + 82,5 = 171.
Будем считать выборкой 1 группу В, а выборкой 2 - группу А;
4. сформулируем гипотезы:
Н 0: результаты тестирования в выборке 1 не выше результатов в выборке 2;
Н 1: результаты тестирования в выборке 1 выше результатов в выборке 2;
5. вычислим значения U a и U в:
U a = n A * n B + n A (n A + 1) – T a = 8 * 10 + 8 * (8 + 1) : 2 – 88,5 = 27,5
2
U в = n A * n B + n B (n B + 1) – T в = 8 * 10 + 10 * (10 + 1) : 2 – 82,5 = 52,5
2
Найдем U эмп. = min (U a; U b) = 27,5;
6. по таблице 5 приложения по данным n 1 = 10 и n 2 = 8 найдем U кр (p ≤ 0,05) и U кр. (p ≤ 0,01).
Изобразим на оси значимости все найденные значения критерия.
зона значимости зона неопределенности зона не значимости
13 20 27,5
U кр. (p ≤ 0,01) U кр. (p ≤ 0,05) U эмп.
Так как U эмп. > U кр. (p ≤ 0,05) и U эмп. > U кр. (p ≤ 0,01), то H 0 принимается с уровнем значимости p ≤ 0,01, а H 1 отвергается.
Значит, результаты тестирования в выборке 1 не выше, чем в выборке 2.
Различия между результатами в выборках статистически не достоверны, то есть случайны.
Ответ
Между результатами групп А и В существенных различий нет. Если даны три и более выборок, на которых измерен один и тот же признак, то можно сравнить результаты попарно, пользуясь вышеизложенными критериями, или использовать специальные критерии (Крускала Уоллиса или Джонкира).
Пример 2
При измерении пространственных порогов тактильной чувствительности (ощущение прикосновения, давления и вибрации) получены следующие величины порогов для женщин и мужчин:
группа А (женщины) - 32, 30, 28, 30, 33, 37, 28, 27 (n А = 8);
группа В (мужчины) - 39, 36, 31, 35, 29, 34, 38 (n B = 7).
Отличаются ли между собой по величине пороги женщин и мужчин?
Решение
1. проверим ограничения критерия n А= 8, 8 > 3 и n B = 7, 7 > 3 ;
2. объединим значения признака в одну общую выборку, упорядочив ее по возрастанию, получим:
27, 28, 28, 29, 30, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39 (n = 15);
3. проранжируем объединенную выборку, приписывая меньшему значению меньший ранг и равным значениям - равные ранги. Полученные данные занесем в таблицу (3 - значение, М - место, В - выборка):
З |
27 |
28 |
28 |
29 |
30 |
30 |
31 |
32 |
33 |
34 |
35 |
36 |
37 |
38 |
39 |
М |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
r n |
1 |
2,5 |
2,5 |
4 |
5,5 |
5,5 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
B |
А |
А |
А |
В |
А |
А |
В |
А |
А |
В |
В |
В |
А |
В |
В |
T a |
1 |
2,5 |
2,5 |
- |
5,5 |
5,5 |
- |
8 |
9 |
- |
- |
- |
13 |
- |
- |
Tв |
- |
- |
- |
4 |
- |
- |
7 |
- |
- |
10 |
11 |
12 |
- |
14 |
15 |
Подсчитаем сумму рангов в выборке А и в выборке В:
Т а = 47, Т в = 73.
Проверим общую расчетную сумму:
(n А + n B) * (n А + n B + 1) : 2 = (8 + 7) * (8 + 7 + 1) : 2 = 120;
Т а + Т в = 120.
Будем считать выборкой 1 группу В, а выборкой 2 - группу А;
4. сформулируем гипотезы:
Н 0: результаты измерения в выборке 1 не выше результатов в выборке 2;
Н 1: результаты измерения в выборке 1 выше результатов в выборке 2.
5. вычислим значения U a и U в:
U a = n A * n B + n A (n A + 1) – T a = 8 * 7 + 8 * (8 + 1) : 2 – 47 = 56 + 72 : 2 – 47 = 45;
2
U в = n A * n B + n B (n B + 1) – T в = 8 * 7 + 7 * (7 + 1) : 2 – 73 = 56 + 56 : 2 – 73 = 11;
2
6. по таблице 5 приложения по n 1 = 8 и n 2 = 7 найдем U кр. (p ≤ 0,05) = 13 и U кр. (p ≤ 0,01) = 7.
Изобразим на оси значимости все найденные значения критерия.
зона значимости зона неопределенности зона не значимости
7 11 13
U кр. (p ≤ 0,01) U эмп. U кр. (p ≤ 0,05)
Ответ
Так как U кр. (p ≤ 0,05) >U эмп. > U кр. (p ≤ 0,01), то можно считать различия величин порогов мужчин и женщин статистически значимыми (p = 0,05).
X² – критерий Фридмена
Назначение
χ² - используется для сравнения частот двух распределений: двух эмпирических или эмпирического и теоретического.
Ограничения
Объем сопоставляемых распределений не менее 20-30 вариантов, а минимальная их частота не менее 5.
Алгоритм использования
1. проверить выполнение ограничений;
2. полученные результаты занести в таблицу:
Объем воспроизведения χ² |
- |
- |
- |
|
Количество испытуемых из 1 – гр. fi |
- |
- |
- |
N = |
Количество испытуемых из 2 – гр. fi |
- |
- |
- |
N = |
3. cформулировать гипотезы:
Н 0: различия между частотами двух групп незначимы;
Н 1: различия между частотами двух групп значимы.
4. вычисления χ² провести в таблице:
χ²
|
ƒi ΄ |
ƒi ΄΄ |
ƒi ΄- ƒi ΄΄ |
(ƒi΄ - ƒi΄΄) ² |
ƒi ΄ + ƒi ΄΄ |
(ƒi΄ - ƒi΄΄) ² ƒi ΄ + ƒi ΄΄
|
|
|
|
|
|
|
|
5. по таблице 5 для χ² найти χ² (p ≤ 0,05).
Если χ² < χ² (p ≤ 0,05), то принимается гипотеза Н 0, если χ² > χ² (p ≤ 0,05), то принимается Н 1.
Пример
Результаты воспроизведения заученных двухзначных чисел (53, 27, 84, 36, 47, 91, 72, 69, 15, 34) в двух группах испытуемых приведены в таблице:
Объем воспроизведения χ² |
2 |
3 |
4 |
5 |
6 |
|
Количество испытуемых из 1 – гр. fi |
5 |
6 |
8 |
10 |
6 |
N = 35 |
Количество испытуемых из 2 – гр. fi |
4 |
9 |
10 |
6 |
6 |
N = 35 |
В первой группе 35 человек и во второй группе 35 человек. Значимо ли различие частот в этих группах?
Решение
1. проверим выполнение ограничений: количество испытуемых в обеих группах - 35 человек (35 > 20);
2. результаты занесены в таблицу. Число составляемых разрядов ƒ = 5;
3. сформулируем гипотезы:
Н 0: различия между частотами двух групп не значимы;
Н 1: различия между частотами двух групп значимы.
4. вычисления χ² проведем в таблице
χ²
|
ƒi ΄ |
ƒi ΄΄ |
ƒi ΄- ƒi ΄΄ |
(ƒi΄ - ƒi΄΄) ² |
ƒi ΄ + ƒi ΄΄ |
(ƒi΄ - ƒi΄΄) ² ƒi ΄ + ƒi ΄΄
|
2 |
5 |
4 |
1 |
1 |
9 |
0,11 |
3 |
6 |
9 |
-3 |
9 |
15 |
0,6 |
4 |
8 |
10 |
-2 |
4 |
18 |
0,22 |
5 |
10 |
6 |
4 |
16 |
16 |
1 |
6 |
6 |
6 |
0 |
0 |
12 |
0 |
|
|
|
|
|
|
∑ = 1,93 χ² = 1,93 |
5. по таблице 6 приложения найдем для к = 4 (к = ƒ - = 5 – 1 = 4) значение χ² (p ≤ 0,05) = 9,49.
Так как 1,93 < 9,49, то принимается гипотеза но: различия между частотами двух групп испытуемых не значимы. Обе эмпирические совокупности можно считать выборками из одной генеральной совокупности.
Н – критерий Крускала-Уоллиса
Назначение критерия «Н»
Критерий предназначен для оценки одновременно между тремя, четырьмя и так далее выборками по уровню какого-либо признака.
Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.
Описание критерия «Н»
Критерий «Н» иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных выборок (Тюрин Ю. Н., 1978 г.). Иногда его называют критерием «суммы рангов» (Нoceнкo И.А., 1981 г.).
Данный критерий является продолжением критерия «U» на большее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой - высокие, а в третьей - средние, то критерий «Н» позволит установить эти различия.
Алгоритм использования
Гипотезы
Н 0: между выборками 1, 2, 3 и т. д. существуют лишь случайные различия по уровню исследуемого признака;
Н 1: между выборками 1, 2, 3 и т. д. существуют неслучайные различия по уровню исследуемого признака.
Графическое представление критерия «Н»
Критерий «Н» оценивает общую сумму перекрещивающихся зон при сопоставлении всех обследованных выборок. Если суммарная область наложения мала (Рис. 1 А), то различия достоверны; если она достигает определенной критической величины и превосходит ее (Рис. 1 Б), то различия между выборками оказываются недостоверными.
1 ряд
2 ряд 1 ряд
2 ряд
3 ряд
3 ряд
Рис. А Рис. Б
Рис.1. Два возможных варианта соотношения рядов значений в трех выборках; отмечены зоны наложения.
Ограничения критерия Н
1. при сопоставлении 3-x выборок допускается, чтобы в одной из них n=3, а двух других n=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (p≤0,05). Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (p≤0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2;
2. критические значения критерия Н и соответствующие им уровни значимости приведены в таблице. Таблица предусмотрена только для трех выборок и {n 1, n 2, n 3} ≤ 5. При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться таблицей критических значении критерия χ², поскольку критерий Крускала-Уоллиса асимптотически приближается к распределению χ ² (Носенко И.А., 1981). Количество степеней свободы при этом определяется по формуле: v=c-1, где с - количество сопоставляемых выборок;
3. при множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказаться стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться ½ * [с * (с-1) ], где с – количество выборок, для таких попарных сопоставлений используется, естественно, критерий для двух выборок, например U или φ.
Пример
В эксперименте по исследованию интеллектуальной настойчивости (Е. В. Сидоренко, 1984) 22 испытуемым предъявлялись сначала разрешимые четырехбуквенные, пятибуквенные и шестибуквенные анаграммы, а затем неразрешимые анаграммы, время работы над которыми не ограничивалось. Эксперимент проводился индивидуально с каждым испытуемым. Использовалось 4 комплекта анаграмм. У исследователя возникло впечатление, что над некоторыми неразрешимыми анаграммами испытуемые продолжали работать дольше, чем над другими, и, возможно, необходимо будет делать поправку на то, какая именно неразрешимая анаграмма предъявлялась тому или иному испытуемому. Показатели длительности попыток в решении неразрешимых анаграмм представлены в табл. 2.5. Все испытуемые были юношами-студентами технического вуза в возрасте от 20 до 22 лет.
Можно ли утверждать, что длительность попыток решения каждой из 4 неразрешимых анаграмм примерно одинакова?
Таблица 1. Показатели длительности попыток решения 4 неразрешимых анаграмм в секундах (N=22)
-
Группа 1: анаграмма ФОЛИТОН (ni=4)
Группа 2: анаграмма КАМУСТО (n2=8)
Группа 3: анаграмма СНЕРАКО (n3=6)
Группа 4: анаграмма ГРУТОСИЛ (n4=4)
1
145
145
128
60
2
194
210
283
2361
3
731
236
469
2416
4
1200
385
482
3600
5
720
1678
6
848
2081
7
905
8
1080
Суммы
2270
4549
5121
8437
Средние
568
566
854
2109
Сформулируем гипотезы:
Н 0 - 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности попыток их решения;
Н 1- 4 группы испытуемых, получившие разные неразрешимые анаграммы, различаются по длительности попыток их решения.
Подсчет критерия «Н»
1. перенести все показатели испытуемых на индивидуальные карточки;
2. пометить карточки испытуемых группы 1 определенным цветом, например красным, карточки испытуемых группы 2 - синим, карточки испытуемых групп 3 и 4 - соответственно, зеленым и желтым цветом и т. д. (можно использовать, естественно, и любые другие обозначения);
3. разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой;
4. проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке;
5. вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения;
6. подсчитать суммы рангов отдельно по каждой группе. Проверить совпадение общей суммы рангов с расчетной;
7. подсчитать значение критерия «Н» по формуле:
Н = ( (12 / N (N + 1)) * ( ∑ * Tj² / n)) - 3 (N+1)
Где:
N - общее количество испытуемых в объединенной выборке;
n - количество испытуемых в каждой группе;
Т - суммы рангов по каждой группе.
8. а. при количестве групп с = 3, n 1, n 2, n 3 ≤ 5, определить критические значения и соответствующий им уровень значимости. Если «Н эмп» равен или превышает критическое значение Н 0,05, НО отвергается.
8. б. при количестве групп с › 3 или количестве испытуемых n 1, n 2, n 3 › 5, определить критические значения . Если «Н эмп» равен или превышает критическое значение, НО отвергается.
G - критерий знаков
Назначение критерия «G»
Критерий знаков* «G» предназначен для установления общего направления сдвига исследуемого признака. Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму: изменяются ли показатели в сторону улучшения, повышения или усиления или, наоборот, в сторону ухудшения, понижения или ослабления.
* Критерий знаков с математической точки зрения является частным случаем биномиального критерия для двух равновероятных альтернатив. При вероятности каждой из альтернатив P=Q=O,50 критерий знаков является зеркальным отражением биномиального критерия). В некоторых руководствах критерий знаков называют критерием Мак-Немара (МсСall R, 1970; Рунион Р., 1982).
Критерий знаков применим и к тем сдвигам, которые можно определить лишь качественно (например, изменение отрицательного отношения к чему-либо на положительное).
Критические значения критерия знаков G для уровней статистической значимости p ≤ 0,05 и p ≤ 0,01.
Преобладание «типичного» сдвига является достоверным, если G эмпирический ниже или равен G 0,05, и тем более достоверным, если G эмпирический ниже или равен G 0,01.
n |
p =0,05 |
p =0,01 |
n |
p =0,05 |
p =0,01 |
n |
p =0,05 |
p =0,01 |
n |
p =0,05 |
p =0,01 |
5 |
0 |
- |
27 |
8 |
7 |
49 |
18 |
15 |
92 |
37 |
34 |
6 |
0 |
- |
28 |
8 |
7 |
50 |
18 |
16 |
94 |
38 |
35 |
7 |
0 |
0 |
29 |
9 |
7 |
52 |
19 |
17 |
96 |
39 |
36 |
8 |
1 |
0 |
30 |
10 |
8 |
54 |
20 |
18 |
98 |
40 |
37 |
9 |
1 |
0 |
31 |
10 |
8 |
56 |
21 |
18 |
100 |
41 |
37 |
10 |
1 |
0 |
32 |
10 |
8 |
58 |
22 |
19 |
110 |
45 |
42 |
11 |
2 |
1 |
33 |
11 |
9 |
60 |
23 |
20 |
120 |
50 |
46 |
12 |
2 |
1 |
34 |
11 |
9 |
62 |
24 |
21 |
130 |
55 |
51 |
13 |
3 |
1 |
35 |
12 |
10 |
64 |
24 |
22 |
140 |
59 |
55 |
14 |
3 |
2 |
36 |
12 |
10 |
66 |
25 |
23 |
150 |
64 |
60 |
15 |
3 |
2 |
37 |
13 |
10 |
68 |
26 |
23 |
160 |
69 |
64 |
16 |
4 |
2 |
38 |
13 |
11 |
70 |
27 |
24 |
170 |
73 |
69 |
17 |
4 |
3 |
39 |
13 |
11 |
72 |
28 |
25 |
180 |
78 |
73 |
18 |
5 |
3 |
40 |
14 |
12 |
74 |
29 |
26 |
190 |
83 |
78 |
19 |
5 |
4 |
41 |
14 |
12 |
76 |
30 |
27 |
200 |
87 |
83 |
20 |
5 |
4 |
42 |
15 |
13 |
78 |
31 |
28 |
220 |
97 |
92 |
21 |
6 |
4 |
43 |
15 |
13 |
80 |
32 |
29 |
240 |
106 |
101 |
22 |
6 |
5 |
44 |
16 |
13 |
82 |
33 |
30 |
260 |
116 |
110 |
23 |
7 |
5 |
45 |
16 |
14 |
84 |
33 |
30 |
280 |
125 |
120 |
24 |
7 |
5 |
46 |
16 |
14 |
86 |
34 |
31 |
300 |
135 |
129 |
25 |
7 |
6 |
47 |
17 |
15 |
88 |
35 |
32 |
|
|
|
26 |
8 |
6 |
48 |
17 |
15 |
90 |
36 |
33 |
|
|
|