Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Сидоренко Е.В. Методы математической обработки в психологии

.pdf
Скачиваний:
1347
Добавлен:
16.03.2016
Размер:
13.25 Mб
Скачать

2J2

I;(x; -х)2

cr=

n-l

где ~ каждое наблюдаемое значение признака;

Х• среднее значение (среднее арифметическое);

пколичество наблюдений.

Вданном случае:

cr =

102·944

= .J6 893 = 2 62

 

16-1

.

.

Показатели асимметрии и эксцесса с их ошибками репрезента­

тивности определяются по следующим формулам:

 

I:(x; -х)3

 

A= ----

 

 

n·cr3

 

тА=И

 

Е=

I:(x; -х)4

3

п ·<r4

 

 

mE =2·!!

где (Х; - Х) центральные отклонения;

cr • стандартное отклонение;

пколичество испытуемых.

Вданном случае:

А= +30,468 =106

 

 

16. 2,623

т

А

= {6 =061

 

'116

'

Е = 1725,467

3 =_0.711

 

 

16. 2,624

 

= {6 =

mE 2 · v16 1,22

ДвсверсвоввЬrв одвофав'l'Орвмв aвllAllll

2JJ

Показатели асимметрии и эксцесса свидетельствуют о достовер·

ном отличии эмпирических распределений от нормального в том случае, если они превышают по абсолютной величине свою ошибку репрезента·

тивности в 3 и более раз:

tA =.11;;::3 mA

t 6 =~;;::3

тв

В данном случае:

IA = 10,1061 = 0,174 0.61

= 1-О.7111 = 0,583

1,22

Мы видим, что оба показателя не превышают в три раза свою

ошибку репрезентативности, из чего мы можем заключить, что распре·

деление данного признака не отличается от нормального.

Теперь произведем проверку по формулам Е.И. Пустыльника.

Рассчитаем критические значения для показателей А и Е:

б·(п-1)

Акр =З· (п+l)·(п+З)

Екр =5·

24·п·(п-2)·(п-З)

 

 

(п+1)2 ·(n+З)·(n+S)

 

 

где п количество наблюдений.

 

 

В данном случае:

 

 

 

А

 

..--------

=3·~90 =158

 

=3·

6·(16-1)

 

 

кр

(16+1)·(16+3)

323 '

 

 

Е

= 5·

24·16·(16-2)·(16-3) = 5·

69888

= 389

 

кр

(16+1)2 ·(16+3)·(16+5)

115311

'

А.мn=О,106

214

Г.11111111 7

А..мп<А..р_

Евмn=-0,711

Евмп<Е..Р.

Итак, оба варианта проверки, по Н.А. Пло:хиискому и по Е.И.

Пустыльиику, дают один и тот же результат: распределение результа­

тивного признака в данном примере не отличается от нормального рас­

пределения.

Можно выбрать любой из двух предложенных вариантов провер­

ки и придерживаться его. При больших объемах выборки, по­ видимому, стоит производить расчет первичных статистик (оценок па­ раметров) на ЭВМ.

4) Преобразование вмпирических даивыz с gел.ю

упрощения расчетов

Н.А. Пло:хинский указывает на возможность следующих преобразований: 1) все наблюдаемые значения можно разделить на одно и то же число k,

например перевести показатели из миллиметров в сантиметры и т.п.;

2)все наблюдаемые значения можно умножить на одно и то же число k,

например для того, чтобы избавиться от дробных значений;

3)от всех наблюдаемых значений можно отнять одно и то же число А,

например наименьшее значение;

4)можно сделать двойное преобразование: из каждого значения вычесть число А, а полученный результат разделить на другое число k.

При всех втих преобразованиях результативного признака пока­

затели соотношения дисперсий получаются точными и не требуют ника­

ких поправок.

Средние величины изменяются, но их можно восстановить, ум­ ножая среднюю величину на число k или деля ее на k (варианты 1 и 21 или прибавляя к средней число А (вариант 3). и т. п. Стандартное от­

клонение изменяется только при введении множителя или деАителя;

полученный результат затем придется либо' разделить на число k, либо

умножить на него (Пло:хииский Н.А.,1964, с.34-36; Плохииский Н.А.,

1970, с.71-72).

В последующих трех параграфах будет рассмотрен метод одно·

факторного анализа в двух вариантах:

1/нсперснонвый одвофаlt7'0рный анамяз

2J5

а) для дисперсионных комплексов, представляющих данные однои

и той же выборки испытуемых, подвергнутой влиянию разных условий (разных градаций фактора);

б) для дисперсионных комплексов, в которых влиянию разных условий (градаций фактора) были подвергнуты разные выбор­

ки испытуемых.

Первый вариант называется однофакторным дисперсионным ана­

J\изом для связанных выборок, второй - для несвязанных выборок.

Все предложенные алгоритмы расчетов предназначены для рав­

номерных комплексов, где в каждой ячейке представлено одинаковое число наблюдений.

7.3. Однофакторнмй дисперснонн111й анализ ААВ несваsав­

вых выборок

Назначение метода Метод одноФакторного дисперсионного анализа применяется в тех

случаях, когда исследуются изменения результативного признака под

влиянием изменяющихся условий и.ли градаций какого-либо фактора. В

данном варианте метода влиянию каждой из градаций фактора подвер­

гаются разные выборки испытуемых. Градаций фактора должно бьnь

не менее трех4

Непараметрическим вариантом этого вида анализа является кри­ терий Н Крускала-Уо.ллиса.

Опвсанне метода

Работу начиНаем с того, что представляем полученные данные в

виде стоАбцов индивидуальных значений. Каждый из столбцов соответ­ ствует тому и.ли иному из изучаемых условий (см. Табл. 7.2).

После этого нам нужно просуммировать индивидуальные значе­

ния по столбцам и суммы возвести в квадрат.

Суть метода состоит в том, чтобы сопоставить сумму втих возве­ денных в квадрат сумм с суммой квадратов всех значений, полученных

во всем вксперименте.

+ ГрадаЦИЙ может бьrrь и две, но в втом случае мы не сможем установить нели­

нейных зависимостей н более разумным представляется использование более про·

стых критериев (см. главы 2 и 3).

2J6

ГАава 7

Гипотезы

Н0: Различия между градациями фактора {разными условиями) ЯВJ\ЯЮТСЯ не

более выраженными. чем случайные различия внуrри каждой группы.

Н1: Различия между градациями фактора {разными условиями) являются

более выражещ1ыми. чем случайные различия внутри каждой группы.

rрафическое представление метода для несвязанных выборок На Рис. 7.2 показана кривая изменения объема воспроизведения

слов при разной скорости их предъявления {см. Пример). Метод дис­

персионного анализа позволяет определить, что перевешивает - тенден­

ция, выраженная этой кривой, или вариативность признака внутри

групп, которая на графике схематически изображена в виде диапазонов

изменения признака от минимального значения к максимальному значе­

нию в каждой группе. Количество

воспроизведенных слов

9

8

7

6

5

4

3

2

2

Увеличение

1

 

 

 

скорости

 

А,

предъявления

 

слов

 

бo.u.wu скорость

 

Рис. 7.2. Криваа измеиен1111 объема воспроизведеНIUI при повышении скорости прцъяв· мния слов; no каждому условию показа11111 АИ811&3ОНЬ1 измененио признака (no А8ИНЫМ

Greene J., D"Olivera М.• 1989)

Оrраничения метода однофакторноrо дисперсионвоrо аналв•

за для несвязанных выборок

1. Однофакторный дисперсионный анализ требует не менее трех· града·

ций фактора и не менее двух испытуемых в каждой градации.

2.Должно соблюдаться правило равенства дисперсий в каждой ячейке

дисперсионного комплекса. Условие равенства дисперсий выполняется

при использовании предлагаемой схемы расчета за счет выравнивания

Днснерснонный однофакrорный ан;инз

237

количества наблюдений в каждом из условий (градаций). Правомер­ ность этого методического приема была обоснована Г.Шеффе (1980).

3.Результативный признак должен бьП'ь нормально распределен в ис­

следуемой выборке.

Правда, обычно не указывается, идет ли речь о распределении

признака во всей обследованной выборке или в той ее части, которая составляет дисперсионный комплекс.

Характерно, что зарубежные руководства, в общем ссылаясь на

необходимость нормального распределения данных для дисперсионного

анализа, при рассмотрении конкретных схем и примеров к этому вопро­

су уже не возвращаются и никаких данных о распределении признака в

выборке в целом или в той ее части, которая составляет дисперсионный

комплекс, не приводят (см. McCall R., 1970; Welkowitz J., Ewen R.B., Cohen J., 1982; Greene J., D'Olivera М., 1989).

Рассмотрим схему дисперсионного одиофакторного ·анализа для не­ связанных выборок, предлагаемую в руководстве J.Greene, M.D'Olivera (1989) с использованием примера этих авторов.

Пример Три различные группы из шести испытуемых получили списки из

десяти слов. Первой группе слова предъявлялись с низкой скоростью

1 слово в 5 секунд, второй группе со средней скоростью • 1 слово в 2

секунды, и третьей группе с большой скоростью • 1 слово в секунду.

Было предсказано, что показатели воспроизведения будут зависеть от скорости предъявления слов. Результаты представлены в Табл. 'J.2.

Таблица 7.2

Количество воспроизведенных слов (по: J.Greene, M.D'Olivera. 1989,р.99)

"llrv---мoro

г--а 1: низко: ско~ ·............... 2: ~-••••я CKOl'VV'"l'IГovnna 3: высока• ско""""'

1

8

7

4

2

7

8

5

3

9

s

3

4

s

4

6

s

6

6

2

6

8

7

4

с-мы

43

37

24

С-·-

7,17

6,17

4,00

n..."•• ~ма

104

 

 

ZJB

Гiаава 7

Поскольку сопоставляются разные группы, любые различия в по­

казателях между разными условиями предъявления слов - это в то же

время различия между группами испытуемых. Однако всякие различия

между испытуемыми внутри каждой группы объясняются какими-то

другими, не относящимися к делу переменными, будь то индивидуаль­

ные различия между отдельными испытуемыми или неконтролируемые

факторы, заставляющие их реагировать различным образом. Критерий F позволяет проверить гипотезы:

Но: Различия в объеме воспроизведения слов между группами являются не

более выраженными, чем случайные различия внутри каждой группы.

Н1: Различия в объ!=ме воспроизведения слов между группами являются

более выраженными, чем случайные различия внутри каждой группы.

Используя экспериментальные значения, представленные в Табл. 7.2, установим некоторые величины, которые будут необходимы для расчета критерия F.

Таблщ.1,а 7.3

Расчет основных величин для однофакторного дисперсионного анализа

Обозначение

т<

t(fZ<)

с

n

N

(tx;)Z

(:rz, )z

N

Х;

t(x;Z)

РасшифровКR обозначения

суммы индивидуальных значений по каждому из условий

сумма кваА/)атuв суммар11ых значений по каждому из у_слов11й

количество условий (rрадаj&ИЙ фактора) количество испытуемых в каждой rpynne (в каждом из условий)

об111ее количество индивидуальных значе· ний

квадрат об~uей суммы индивидуальных

значений

константа, которую нуж110 вычесть из каж-

дой суммы квадратов

каждое индивидуальное значе11ие

сvмма квадратов индивндvалыrых значений

Экспериментальные значения

43; 37; 24

t(ГZ<)=43Z+37Z+z4Z

c=J

n=6

N=18

(tx,)2=1042

11:.r,)z 1042

-N-=18

Отметим разницу между I:(x?). в которой все индивидуальные значения сначала возводятся в квадрат, а потом суммируются, и (I:xi)2,

где индивидуальные значения сначала суммируются для получения об­

щей суммы, а потом уже эта сумма возводится в квадрат.

Последовательность расчетов представлена в Табл. 7.4.

1/нсперснонныii однофакторныii аmинз

2J9

Часто встречающееся в зтой и последующих таблицах обозначе­ ние SS - сокращение от "суммы квадратов" (sum of squares). Это со­

кращение чаще всего используется в переводных источниках (см., на­

пример: Гласе Дж., Стенли Дж., 1976).

ssфакт означает вариативность признака, обусловленную действи­

ем исследуемого фактора; ssoбia - общую вариативность признака; SSCA -

вариативность, обусловленную неучтенными факторами, "случаАную"

или "остаточную" вариативность.

MS - "средний киадрат", или математическое ожидание суммы квадратов, усредненная величина соответствующих SS.

df - число степеней свободы, которое при рассмотрении непара­

метрических критериев мы обозначили греческой буквой v.

Таблщ~а 7.4 Последовательность операций в однофакторном дисперсионном анализе

для несвязанных выборок

On•pa!PI•

Формула расчета

Рас'lет no эксперимеtrrаАьным А8И"

ным

 

 

1. Подсчитать ss""

SS-=1/пI:T2c-

SSфакт=(432+372+242)/6-

 

-1/н·(I:x;)Z

-1042/18=31,44

IZЛодсчиrать SSa&м

SSD6oa=I:x2;·1/ н·(I:х;)2

SS =82

+7Ч9'+5'+6'+8Ч

 

 

+7~82+52+42+62+72+42+

 

 

+52+32+62+22+42-1042/18=

 

 

=63,11

 

3Лодсчитать случайную

ss"=Sso6111.ssфUТ

ss"=63,tt-31,44=31,67

(остаточную) &rЛИЧнну SS'-'

 

 

 

4.011ределить число степеней

df""=c-1

d/-=3-1~2

свободы

d/oбlJl=N-1

dfoб...=18-1=17

 

JJ"=Jfo6iu'JJ.,."

df••=17-2=15

).Разделить каждую SS на

MS-=SSJ:"/d/фUТ

мs....=31,44/2=15.72

соотвеn:твуюrаее число степе-

мs"=SS" JJ"

мs"=31,67;15=2.11

ней свободы

 

 

 

6.Подсчитать значение F....

F_=мs..."1мs"

F..,.12 ш=15,72/2.11'"'7,45

7.Определить критические зна·

ДЛ11 d/г2 J/z==15

 

{3,68 S 0,05)

чения F по Таб.11. XVII При-

 

F

 

-

.11ожения 1

 

•р (l.IS)

- 6,36 S 0,01)

8.Сопоставить ам11иричес:кое и

При F....~F"" Н0 ОТКАо·

F_>Fмр -+ Н0 ОТКJ1оияета1

критические значения F

няется

 

 

Вывод: Но отклоняется. Принимается Н1. Различия в объеме

воспроизведения слов между группами являются более выраженными,

чем случайные различия внутри каждой группы (р<О,01). Итак, ско-

240

рость предъявления слов влияет на объем их воспроизведенияS. Вер­

немся к графику на Рис. 7 .2. Мы видим, что, скорее всего, значимость

различий объясняется тем, что показатель воспроизведения при самой

высокой скорости предъявления слов {условие 3) гораздо ниже соот­

ветствующих показателей при средней и низкой скорости.

7.4. Дисперсионный анализ для связанных выборок

Назначение метода Метод дисперсионного анализа для связанных выборок применяет­

ся в тех случаях, когда исследуется влияние разных градаций фактора или

разных условий на одну и ту же выборку испытуемых.

 

Градацнй фактора должно быть не менее трех.

 

Непараметрический вариант этого вида анализа

критерий

Фридмана xz,.

Описание метода В данном случае различия между испытуемыми - ·возможный са­

мостоятельный источник различий. В схеме однофакторного анализа для

несвязанных выборок различия между условиями в то же время отра­

жали различия между испытуемыми. Теперь различия между условиями

могут проявиться только вопреки различиям меж.о.у испытуемыми.

Фактор индивидуальных различий может оказаться более значи­

мым, чем фактор изменения экспериментальных условий. Поэтому нам

необходимо учитывать еще одну велйчину - сумму квадратов сумм ин­ дивидуальных значений испытуемых.

Графическое представление метода

На Рис. 7.3 представлена кривая изменения времени решения

анаграмм разной длины: четырехбуквенной, ПЯТ1:1буквенной и шестибук­

венной. Однофакторный дисперсионный анализ для связанных выборок

S Г.В. Суходо.111>Ским {1972) предложена формула расчета дисперсионноrо отноше­

ния, которая позволяет получить более строгий результат:

Fемп={п·МSфакт+МSсл)/МSсл

rде п - среднее количество наблюдений в каждой rрадации.

В данном случае F.м0=6,942 {р~О.01). Эта величина действительно ниже, чем в

цитируемом примере. Однако для первоrо знакомства с дисперсионным аиалиэом

исследователям, обрабатывающим свои данные самостоятельно, в практических

целях достаточно испоАЬЭовать приведенный алгоритм расчетов, исnоАЬЭуемый и в

большинстве других руководств {Плохинский Н.А., 1960; Венецкий И.Г., Киль­

дишев Г.С., 1968; Ивантер Э.В., Коросов А.В.; 1992, Kurtz А.К" Мауо S.T, 1979 и 'др.).

1/нсперсноннмй однофавторнмй aнilAll!I

241

позволит определить, что перевешивает - тенденция, выра~енная этой кривой, или индивидуальные различия, диапазон которых представлен на графике в виде вертикальных линий - от минимального до макси­

мального значения.

600

Время, с

04

500

 

 

400

 

 

300

 

248,8

200

 

 

 

100

 

 

10.

Ана~амма

Анаr~мма

Анаrj)амма

К УА

меть

ИНААМШ

Рис. 7.3. Иэмсисиис времени ребоtъl Н1А fi13НЫМИ анаrраммами у 111m1 исnьnусмых;

вертикальн111ми АИНИRМИ отображены диапазоны изменчивости признака в разных )'СА.О·

викх от минимальноrо значснИR (снизу} АО максимальиоrо зиачснн1 (сверху)

Ограничения метода дисперснонноrо анализа для связанных

выборок

1.Дисперсионный анализ для связанных выборок требует не менее

трех градаций фактора и не менее двух испьiтуемых, подвергшихся

воздействию каждой из градаций фактора.

2.Должно соблюдаться правило равенства дисперсий в каждой ячейке комплекса. Это условие косвенно выполняется за счет одинакового

количества наблюдений в каждой ячейке комплекса. Предлагаемая

схема расчета ориентирована только на такие равномерные комплексы.

3.Результативный признак должен бьrrь нормально распределен в ис­ следуемой выборке.

Вприводимом ниже примере показатели асимметрии и эксцесса

составляют:

А=2,18; mл=О,632;

tл=2,18/0,632=3,45;

Е=4,17;

mr1.264;

tr4.17/1,264=3,30.