Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Сидоренко Е.В. Методы математической обработки в психологии

.pdf
Скачиваний:
1352
Добавлен:
16.03.2016
Размер:
13.25 Mб
Скачать

Величина, представляющая собой квадратный корень из несме­ щенной оценки дисперсии (S), называется стандартным отклонением или средним квадратическим отклонением. Для большинства исследова­

телей привычно обозначать эту величину греческой буквой О' {сигма), а

не S. На самом деле, О' - это стандартное отклонение в генеральной совокупности, а S - несмещенная оценка этого параметра в исследован­ ной выборке. Но, поскольку S - лучшая оценка О' (Fisher RA., 1938),

эту оценку ста.11и часто обозначать уже не как S, а как cr:

I(xi - :х)2

и=

п-1

В тех случаях, когда какие-нибудь причины благоприхтствуют

более частому появлению значений, которые выше или, наоборот, ниже

среднего, образуются асимметричные распределения. При левосторон­

ней, или положительной, асимметрии в распределении чаще встречаются более низкие значения признака, а при правосторонней, или отрица­

тельной - более высокие {см. Рис. 1.5).

Показатель асимметрии (А) вычисляется по формуле:

I(xi - :х)з

А=-~-~

п ·и3

Для симметричных распределений А=О.

1

а)

"

1

6)

х

Рис. 1.5. дсимметрu pacnpeдe.AeIOdi а) левu. llOAOЖJIТOAl>И8;

6) npaвu. O'l'pHUIJТOAЬllU

Основн111е DО1111ТВЯ

2J

В тех случаях, когда какие-либо причины способствуют преиму·

11&ественному появлению средних или близких к средним значений, об·

разуется распределение с положительным эксцессом. Ее.ли же в рас·

пределении преобладают крайние значения, причем одновременно и бо·

.11.ее низкие, и более высокие, то такое распределение характеризуется отрицательным эксцессом и в центре распределения может образоваться

впадина, превращающая его в двувершинное (см. Рис. 1.6).

Показатель эксцесса (Е) определяется по формуле:

Е= L(xi -х/ 3 n·u4

/

а)

 

 

 

.//"'

 

 

/

,../··

..•

•.••.•

 

"/·

х

/

х

Рис. 1.6. Экс11есс: а) ПОАОжитеАDНЫА; б) orpиg,a..........

,.A

В распределениях с нормальной выпуклостью Е=О.

Параметры распределения оказываетСя возможным определить

только по отношению к данным, предста.вленным по крайней мере в

интервальной шкале. Как мы убедились ранее, q~иэические шкалы длин,

времени, углов являются интервальными шкалами, и поэтому к ним

применимы способы расчета оценок параметров, по крайней мере, с

фОрмальной точки зрения. Параметры распределения не учитывают

24

Г.11.ава 1

истинной психологической неравномерности секунд, миллиметров и

других физических единиц измерения.

На практике психолог-исследователь может рассчитывать пара­

метры любого распределения, если единицы, которые он использовал

при измерении, признаются разумными в научном сообществе.

1.4. Статистические rнпотез111

Формулирование гипотез систематизирует предположения иссле­

дователя и представляет их в четком и лаконичном виде. Благодаря

гипотезам исследователь не теряет путеводной нити в процессе расчетов

и ему легко понять после 11х окончания, что, собственно, он обнаружил.

Статистические гипотезы подразделяются на нулевые и альтерна­

тивные, направленные и ненаправленные.

Нулевая rнпотеза это гипотеза об отсутствии различий. Она обозначается как Но и называется

нулевой потому, что содержит число О:

Xi-Х2=О, где Х1. Х2 сопоставляемые

значения признаков.

Нулевая гипотеза это то, что мы хо­

тим опровергнуть, если перед нами стоит

задача доказать значимость различий.

Альтернативная rнпотеза это гипотеза о значимости различий. Она обозначается как Н1. Альтернатив­

ная гипотеза - это то, что мы хотим до­

казать, поэтому иногда ее называют

экспериментальной гипотезой.

Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам

нужно убедиться, что разные испытуемые получают хотя и различные,

но уравновешенные по трудности задания, или что экспериментальная и

контрольная выборки не различаются между собой по каким-то значи­

мым характеристикам. Однако чаще нам все-таки требуется доказать

значимость различий, ибо они более информативны для нас в поиске

нового. Нулевая и альтернативная гипотезы могут быть направленными

и ненаправленными.

 

Освоввме 110111iТВ11

2;

 

Направлеввме rвпотеам

 

Но: Х1

не превьпиает Xz

 

Hi: Х1

превышает Xz

 

 

Невапра11Аевв111е rвпотеа111

 

Но: Х1

не отАИЧается от Xz

 

Н1: Х1

отАИЧается от Xz

 

Если вы заметили, что в одной из групп индивидуальные значе­

ния испьrrуемых по какому-либо признаку, например по социальной

смелости, выше, а ·в другой ниже, то для проверки значимости атих различий нам необходимо сформулировать направленные гипотезы.

Если мы хотим доказать, что в группе А под влиянием каких-то

вкспериментальных воздействий произошли более выраженные измене­

ния, чем в группе Б, то нам тоже необходимо сформулировать направ­

ленные гипотезы.

Если же мы хотим доказать, что различаются формы распределения признака в группе А и Б, то формулируются ненаправленные гипотезы.

При описании каждого критерия в руководстве даны формули­

ровки гипотез, которые он помогает нам проверить.

Построим схему - классификацию статистических гипотез.

Статистические rипотезы

~~

Напра&Аенные Ненаправленные

~~~~

Нулевая Альтернативная Нулевая Альтернативная

Проверка гипотез осуществляется с помощью критериев стати­

стической оценки различий.

t.S. Статветическве критерии

Статистический критерий - зто решающее правило, обеспечиваю­

щее надежное поведение, то есть принятие истинной и отклонение ложной

гипотезы с высокой вероятностью (Суходольский Г.В., 1972, с. 291).

Статистические критерии обозначают также метод расчета опре­

деленного числа и само ато число.

26

ГАJ11111 1

Когда мы говорим, что достоверность различий опееделялась по

критерию х.2• то имеем в виду, что использовали метод х2 для расчета

определенного числа.

Когда мы говорим, далее, что х.2=12,676, то имеем в виду опре­ деленное число, рассчитанное по методу х.2• Это число обозначается как

эмпирическое значение критерия.

По соотношению эмпирического и критического значений крите­

рия мы можем судить о том, подтверждается ли или опровергается ну­

левая гипотеза. Например, если х2змп>Х2кр• Но отвергается.

В большинстве случаев для того, чтобы мы признали различия

значимыми, необходимо, чтобы эмпирическое значение критерия пре­

вышало критическое, хотя есть критерии (например, критерий Манна­

Уитни или критерий знаков), в которых мы должны придерживаться

противоположного правила.

Эти правила оговариваются в описании каждого из представлен­

ных в руководстве критериев.

В некоторых случаях расчетная формула критерия включает в се­

бя количество наблюдений в исследуемой выборке, обозначаемое как n.

В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез. По специальной таблице

мы определяем, какому уровню статистической значимости различий

соответствует данная эмпирическая величина. Примером так~го крите­

рия является критерий <р*, вычисляемый на основе углового преобразо­

вания Фишера.

В большинстве случаев, однако, одно и то же эмпирическое зна­

чение критерия может оказаться значимым или неэначимым в зависи­

мости от количества наблюдений в исследуемой выборке (n) или от так

называемого количества степеней свободы, кcrropoe обозначается как v

или как df.

Число степеней свободы v равно числу классов вариационного

ряда минус число условий, при которых он был сформирован (Ивантер

Э.В., Коросов А.В., 1992, с. 56). К числу таких условий относятся

объем выборки (n), средние и дисперсии.

Если мы расклассифицировали наблюдения по классам какой­

либо номинативной шкалы и подсчитали количество наблюдений в каж­ дой ячейке классификации, то мы получаем так называемый частотный

вариационный ряд. Единственное условие, которое соблюдается при его

Освовв111е ВОНЯ7'Н11

27

Формировании объем выборки п. Допустим, у нас 3 класса: "Умеет

работать на компьютере умеет выполнять лишь определенные опера­

ции не умеет работать на компьютере•. Выборка состоит из 50 чело­ век. Если в первый класс отнесены 20 испытуемых, во второй тоже 20, то в третьем классе должны оказаться все остальные 10 испытуе­ мых. Мы ограничены одним условием объемом выборки. Поэтому

даже если мы потеряли данные о том, сколько человек не умеют рабо­

тать на компьютере, мы можем определить зто, зная, что в первом и

втором классах по 20 испытуемых. Мы не свободны в определении количества испытуемых в третье~ разряде, "свобода" простирается

только на первые две ячейки классификации:

v = с-1 = 3 - 1 = 2

Аналогичным образом, если бы у нас была классификация из 10 разрядов, то мы были бы свободны только в 9 из них, если бы у нас

было 100 классов то в 99 из них и т. д.

Способы более сложного подсчета числа степеней свободы при

двухмерных классификациях приведены в разделах, посвященных кри­

терию х.2 и дисперсионному анализу.

Зная п и/или число степеней свободы, мы по специальным таб­

лицам можем определить критические значения критерия и сопоставить

с ними полученное эмпирическое значение. Обычно зто записывается так: "при п=22 критические значения критерия составляют .. ." или "при v=2 критические значения критерия составляют"." и т.п.

Критерии делятся на параметрические и непараметрические.

Параметрические критерии Критерии, включающие в формулу расчета параметры распределения,

то есть средние и дисперсии (#-критерий Стьюдента, критерий F и др.) Непараметрические критерии

Критерии, не включающие в формулу расчета параметров распределе­ ния и основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т Вилкоксона и др.)

И те, и другие критерии имеют свои преимущества и недостатки.

На основании нескольких руководств можно составить таблицу, позво­ ляющую оценить возможности и ограничения тех и других (Рунион Р.,

1982; McCall R., 1970; J.Greene, M.D'Olivera, 1989).

28

Таблииа 1.1 Возможности и ограничения параметрических и непараметрических

 

критериев

ПАРАМЕТРИЧЕСКИЕ

НЕПАРАМЕТРИЧЕСКИЕ

КРИТЕРИИ

КРИТЕРИИ

1. Позволяют пр.ямо оценить разJ1ИЧИJ1 ПозВОJ\ЯЮТ оценить J\1П11Ь средние тенден-

в средних, полученных в двух вы­ ции, например, ответить на вопрос, чаq&е

борках (t - критерий Стьюдента). .11И в выборке А встречаIОТСА более высо­ кие, а в выборке Б - более низкие значе­ НИJI признака (критерии Q, U, q>• и др.).

2. Позволяют прямо оценить раэличИJ1 Позволяют оценить J\ИШЬ раэ.llИЧИJI в.диа­

в дисперсИJ1х (критерий Фишера). пазонах вариативности признака

(критерий q>•).

3. Позволяют ВЫJIВИТЬ тенденции измеПозволяют ВЫJIВИТЬ тенденции изменеНИJJ

неиИJI признака при переходе от успризнака при переходе от условИJ1 к усло-

ловИJ1 к условию (дисперсионный

вию при любом распределении признака

однофакторный анализ), но J\ИШЬ

(критерии тенденций L и S).

при условии нормального распреде­

ленИJ1 признака.

4.Позволяют оценить взаимодействие Эта возможность отсутствует.

двух и более фаКТОров в их В.llИЯнии

на измененИJI признака (двухфак­ торный дисперсионный анализ).

5.Э.кспериментальные данные должны Экспериментальные данные моrут не от­

отвечать двум, а иногда трем, усло­

вечать ни одному из 8ТИХ условий:

виям:

а) значенИJ1 признака моrут быть пред­

а) значенИJI признака измерены по ставлены в любой шкале, начинu от шка­

интервальной шкале;

лы наименований;

б) распределение признака является

б) распределение признака может бъпь

нормальным;

любым и совпадение его с каким-лябо

в) в дисперсионном анаJ\ИЭе должно

теоретическим законом распределеНИJJ

соблюдаться требование равенства

необязательно и не нуждается в проверке;

дисперсий в ячейках комплекса.

в) требование равенства дисперсий отсут­

 

ствует.

6. Математические расчеты довольно

Математические расчеты по болъшей час­

сложны.

ти просты и занимают мало времени (за

 

исключением критериев х2 и Л).

7. Если условИJ1, перечисленные в п.5,

Ес.11И условии, перечисленные в п.5, не

выполняются, параметрические кри-

выполняются, непараметрические критери1

терки оказываются несколько более

оказываются более мощными, чем пара-

мощными, чем непараметрические.

метрические, так как они менее чувстви­

тельны к зас"""НИJIМ".

29

Из Таб.л. 1.1 мы видим, что параметрические критерии могут

оказаТЬСJ1 неско.лько более мощными4, чем непараметрические, но толь­

ко в том с.лучае, ее.ли признак измерен по интервальной шка.ле и нор­

мально распределен. С интервальной шка.лой есть определенные про· б.лемы (см. раздел "Шка.лы измерения"). Лишь с некоторой натяжкой

мы можем считать данные, представ.ленные не в стандартизованных

оценках, как интервальные. Кроме того, проверка распределения "на

нормальность" требует достаточно с.ложных расчетов, реэу.льтат КОТО•

рых заранее неизвестен (см. параграф 7.2). Может оказаться, что рас­

пределение признака отличается от нормального, и нам так и.ли иначе

все равно придется обратиться к непараметрическим критериям.

Непараметрические критерии .лишены всех втих ограничений и не. требуют таких д.лите.льных и с.ложных расчетов. По сравнению с пара·

метрическими критериями они ограничены .лишь в одном с их помо­

щью невозможно оценить взаимодействие двух и.ли бо.лее условий и.ли

факторов, влияющих на изменение признака. Эту задачу может решить

то.лько дисперсионный двухфакторный ана.лиз.

Учитывая sто, в настоящее руководство включены в основном

непараметрические статистические критерии. В сумме они охватывают

бо.льwую часть возможных задач сопоставления данных.

Единственный параметрический метод, включенный в руково­

дство метод дисперсионного ана.лиза, двухфакторный вариант которого

ничем невозможно заменить.

1.6. Уровни статистической значимости

Уровень значимости sто вероятность того, что мы соч.ли раэ.ли­

чия существенными, а они на самом деле с.лучайны.

Когда мы указываем, что различия достоверны на 5%-ом уровне

аначимости, и.ли при p:s;0,05, то· мы имеем виду, что вероятность того, чrо они все-таки недостоверны, составляет 0,05.

Когда мы указываем, что раэ.личия достоверны на 1%-ом уровне

аначимости, и.ли при р~О.01, то мы имеем в виду, что вероятность того, чrо они все-таки недостоверны, составляет 0,01.

"о ПОIUIТИИ МОJIНОС'!'И критерия см. ниже.

.10

Ее.ли перевести все зто на более Формализованный язык, то уро­

вень значимости - зто вероятность отклонения нулевой гипотезы, в то

время как она верна.

Ошибка, сос:товщан в тои, что иы отклоиИАв нулевую rвпотезу,

в то вреив ках она верна, наа111ваетсв ошибкой 1 po,u.

Вероятность такой ошибки обычно обозначается как а. В сущно­

сти, мы дОАЖНЫ бы.ли бы указывать в скобках не pS0,05 или pS0,01, а as:0,05 и.ли aS0,01. В некоторых руководствах так ·И делается (Рунион Р., 1982; Захаров ВЛ., 1985 и др.).

Если вероятность ошибки - зто а, то вероятность правильного

решения: 1-а. Чем меньше а, тем больше вероятность правильного

решения.

Исторически сложилось так, 'П'О в психологии принято считать·

низшим уровнем статистической значимости 5%-ый уровень (pS0,05): достаточным - 1%-ый уровень (pS0,01) и высшим 0,1%-ый уровень

(pS0,001), позтому в таблицах критических значений обычно приводят·

ся значения критериев, соответствующих уровням статистической зна·

чимости pS0,05 и pS0,01, иногда • pS0,001. Для некоторых критериев

в таблицах указан точный уровень значимости их разных эмпирических·

значений. Например, ДJ\JI <р*=1,56 р=О,06.

До тех пор, однако, пока уровень статистической значимости не

достигнет р=О,05, мы еще не имеем права отклон~ нулевую гипотезу. В настоящем руководстве мы, вслед за Р. Рунионом (1982), будем

придерживаться следующего правила отклонения гипотезы об отсутст·

вии различий (Но) и принятия гипотезы о статистической достоверно­

сти различий (Н1).

Правило оnслоневив Но и пpиlUIТllR Н1

Ее.ли змпирическое значение критерия равняется критическому значе­

нию, соответствующему pS0,05 и.ли превышает его, то Но отклоняет­ ся, но мы еще не можем определенно принять Н1.

Если змпирическое значение критерия равняется критическому значе­

нию, соответствующему pS0,01 и.ли превышает его, то Но отклоняется и принимается Н1.

Исключения: критерий знаков С, критерий Т Вилкоксона и критерий

U Манна-Уитни. Для них устанавливаются обратные соотношения.

Основные 001111Т1111

JI

Для об.леrчения процесса принятия решения можно всякий раз вычерчивать "ось значимости".

Зона

неопределенности

Зона

значимости

6

Рис. 1.7. Пример •осн эначнМОСТ11" АА11 критерия Q Рохнбаума

Критические значения критерия обозначены как Qo,o.s и .Qo,Ot• вмпирическое значение критерия как Qaмn· Оно заключено в эллипс.

Вправо от критического значения Qo.ot простирается "зона зна­ чимости" сюда попадают эмпирические значения, превышающие Q0,01

и, с.ледовате.льно, безусловно знцчимые.

В.лево от критического значения Qo.o.s простирается "зона незна­ чимости", сюда попадают эмпирические значения Q, которые ниже

Qo,O.S• и, с.ледовате.льно, безусловно неэначимы.

Мы вИдим, что Qo,o.s=6: Qo,01=9: Q.мп=8.

Эмпирическое значение критерм попадает в область между Qo,o.s и Qo,Ot· Это зона "неопределенности": мы уже можем отклонить гипо· тезу о недостоверности различий (Но). но еще не можем принять rипо· тезы об их достоверности (Н1).

Практически, однако, исс.ледовате.ль может считать достоверными

уже те различия, коrорые не попадают в зону незначимости, заявив, что

они достоверны при pg),05, и.ли указав точный уровень значимости по.лу· ченноrо вмпирическоrо значения критерия, например: р=О,02. С помощью таблиц Приложения 1ато можно сделать по О'Пlоwению к критерИJ1М Н Кру.

ска.ла-Уо.л.лиса, х.2, Фридмана, L Пейджа, <р* Фишера, А. Ко.лмоrорова.

Уровень статистической значимости и.ли критические значения

критериев определяются по-разному при проверке направленных и не·

направленных статистических гипотез.

При направленной статистической гипотезе используется одно­

сторонний критерий, при ненаправленной гипотезе двусторонний кри­

~рий. Двусторонний критерий более строг, поскольку он проверяет

различия в обе стороны, и поэтому то эмпирическое значение критерия,