Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Бодалев А.А. - Общая психодиагностика

.pdf
Скачиваний:
499
Добавлен:
15.09.2017
Размер:
2.58 Mб
Скачать

цедуры возникают при наличии группы испытуемых, тесно общаю-

щихся между собой; тех, которые могут одновременно побывать и ис-

пытуемыми по отношению к тесту, и оценщиками по отношению друг к другу. В отечественной литературе эта процедура получиласо кращенное обозначение ГОЛ - «групповая оценка личности» (Кузьмин Н. В., Семенов В. С., 1977).

Для того чтобы групповая оценка личности была источником действительно валидной информации, оценщики должны согласованно оценивать испытуемых. Если в оценках разных оценщиков нет согла-

сованности, то это означает, что либо оцениваемое свойство не про-

явилось у объекта оценивания, либо оценщики по-разному проинтер-

претировали инструкцию. Для измерения согласованности должна быть составлена таблица с оценками (табл. 6).

Таблица 6

 

 

 

 

 

Оценщики

О1

О2

Оk

å

Испытуе-

 

 

 

 

 

мые

 

 

 

 

 

И1

x11

x12

x1k

C1

И2

x21

x22

 

x2k

C2

 

 

 

 

 

Иn

xn1

xn2

 

xnk

Cn

Методы анализа данных, содержащихся в такой таблице, фор-

мально совершенно эквивалентны тем методам, которые применяются для обработки таблиц «испытуемые - пункты» (см. раздел 3.1), В ча-

стности, суммы по строкам дают суммарные баллы, полученные каж-

дым испытуемым у всех оценщиков. Таким образом, оценщики в дан-

ном случае оказываются формально в роли пунктов теста. Рассчиты-

вая попарные корреляции между различными столбцами этой таблицы,

можно получить коэффициенты согласованности для отдельных пар оценщиков. Глобальной мерой согласованности оценщиков может слу-

жить коэффициент надежности а Кронбаха - см. формулу (3.2.8).

Если же групповая оценка не обнаруживает надежности, то она не может использоваться в качестве критерия валидизации при про-

верке валидности теста.

121

Эмпирическое значение коэффициента валидности рассчитыва-

ется как линейная или ранговая корреляция между двумя рядами зна-

чений: тестовыми баллами и суммарными баллами экспертной оценки.

Это эмпирическое значение при наличии невысокого коэффициента надежности критерия корректируют по формуле

r

=

r

cx

 

 

(3.3.1)

 

 

 

 

tx

 

 

ac

 

 

 

 

 

где rcx - эмпирическая корреляция с критерием;

ас — надежность критерия;

 

rtx

- корреляция с «истинным»

критерием («истинная» валид-

ность теста).

Анализ пунктов по критерию валидности. Валидность всего теста

целиком зависит от валидности входящих в него пунктов. Макси-

мальная валидность достигается за счет отбора таких пунктов из -пи лотажной батареи, которые, обладая значимой корреляцией с крите-

рием, минимально коррелируют между собой. Отбор пунктов именно по критерию валидности обеспечивает максимальную прагматическую эффективность теста. Вручную (на калькуляторе) такой отбор можно

произвести, рассчитав бисериальную корреляцию(или фи-

корреляцию) критерия с каждым пунктом из пилотажной батареи, - см.

формулы (3.2.15) и (3.2.17). Компьютер позволяет использовать более эффективный алгоритм, основанный на анализе частных корреляций между критерием и пунктами и предполагающий построение уравне-

ния множественной регрессии(Аванесов В. С., 1982, с. 153-157). В

результате в таком уравнении каждый пункт получает весовой коэф-

фициент1, количественно выражающий его вклад в критерий, не сво-

димый к вкладу других пунктов, . е. поиск оптимального набора пунктов автоматизируется. X. Гаррет приводит следующую яркую ил-

люстрацию эффективности алгоритма, позволяющего подобрать опти-

мальный набор пунктов. Пусть имеется 20 пунктов, каждый из которых имеет корреляцию с критерием порядка0,30. Оказывается, если эти пункты в среднем коррелируют друг с другом на уровне rij = 0,60, то

1 Этот весовой коэффициент и используется как ключ к данному пункту в новой, скорректированной версии теста.

122

множественная корреляция суммарного тестового показателя с крите-

рием равняется 0,38, если же г = 0,30, множественная корреляция

а

повышается до 0,52. Наконец, при rtj= 0,10

эффективность (валидность) теста достигает весьма высокого

уровня: 0,79. Те же самые проблемы возникают при подборе опти-

мальной батареи тестов, направленных на прогнозирование какого-то одного социально ценного показателя(успеваемость, производитель-

ность труда и т. п.).

Как уже указывалось в разделе3.1, тест, обладающий высокой критериальной валидностью должен давать монотонную зависимость величины критерия от тестового балла (см. рис. 6). Для того чтобы по-

лучить монотонную линию регрессии, психодиагност должен включить в тест X только такие пункты, которые являются валидными по крите-

рию С. В противном случае на кривой неминуемо появятся провалы1.

Крутизну линии регрессии можно существенно повысить за счет наце-

ленного отбора из первоначальной батареи только таких заданий, ко-

торые обладают значимо высокой корреляцией(или регрессионным коэффициентом в уравнении множественной регрессии) с критерием.

После отбора валидных пунктов должна быть произведена пере-

крестная валидизация (см. Анастази А., 1982, с. 197). В чем ее смысл?

Если при анализе корреляций между батареей из200 заданий и ка-

ким-то критерием получают10 заданий, значимо коррелирующих е критерием на уровне ошибки р< 0,05, то это может быть следствием чисто случайного совпадения (сравните 10/200=0,05). Чтобы убедить-

ся в том, что отобранные пункты теста действительно могут различать

(или прогнозировать) критерий, нужно рассмотреть, как коррелируют с критерием эти пункты на другой выборке, которая не использо-

валась при их отборе.

Простой метод реализации принципа перекрестной валидизации состоит в том, что вся выборка делится на две случайные половины и производится раздельный расчет корреляций пунктов с критерием для-. каждой половины выборки. Если выделенные (значимые) пункты совпадают, то перекрестную валидизацию можно считать удачной.

1 Некоторые незначительные локальные провалы при наличии общей высокой регрессии(высокий контраст крайних Р от X) можно устранить, увеличивая интервал равнозначности.

123

Метод критериального тестирования очень трудоемок. .Прак-

тически невозможно построить критериальный тест за счет одной ста-

тистики, сколь бы мощными выборками и батареями заданий мы ни располагали. Необходима работа над содержательной валидностью заданий. Критериальное тестирование имеет ограниченное примене-

ние в задачах построения методик с широкой областью применения.

Следует еще раз подчеркнуть, что анализ валидности отдельных пунктов служит не только прагматическим целям, но может и должен служить целям углубления представлений о содержательно-

теоретическом смысле измеряемого свойства: на основании содержа-

тельного анализа пунктов, отобранных по критерию, психолог уточня-

ет и корректирует свою первоначальную теоретическую схему, свое понимание измеряемого свойства.

Достоверность самоотчета. Рассматривая общую проблемы ва-

лидности целесообразно выделить вопрос об обеспечении валидности процедур стандартизованного самоотчета. Сюда относятся различные техники шкалирования, классифицирования, сравнения и тест-

опросники. Вербальная форма тестового материала порождает у испы-

туемого определенные встречные гипотезы о цели тестирования. Если ситуация диктует испытуемому необходимость фальсификации отве-

тов, то он редко отказывается от этой возможности.

Валидность — характеристика любых измерений, в том числе и физических. Специфические проблемы валидности, связанные с ак-

тивностью человека как объекта психодиагностики, целесообразно обозначить особым образом - проблемы обеспечения достоверности.

Психологические факторы, от которых зависит достоверность самоотчета, условно можно сгруппировать в следующие классы:

1. Факторы знания. У испытуемого может быть более или менее четкое представление о следующем: а) свойственно ли ему в действи-

тельности или нет тестируемое поведенческое проявление(с некото-

рыми ситуациями, имплицитно подразумеваемыми в вопросе тест-оп-

росника, испытуемый мог на практике никогда не встречаться: напри-

мер, утверждение «После выигрыша в спортлото Вы покупаете больше лотерейных билетов» подразумевает, что испытуемый, во-первых, иг-

рает в спортлото ,иво-вторых, выигрывает); б) какое личностное свойство скрывается у психолога за тем или иным конкретным поведе-

124

нием, описанным в суждении; в) как это свойство соотносится с обще-

принятыми моральными нормами и признаками социального успеха.

2. Фактор социальной желательности. Обозначает тенденцию испытуемого давать о себе социально одобряемую информацию. Сила этой тенденции зависит как от общей внеситуативной установки испы-

туемого на морализацию «Я-образа» и социальную успешность, так и от того, насколько эту установку актуализирует сама ситуация тести-

рования. Однако эта тенденция не будет давать систематического ис-

кажения, если испытуемые не смогут разгадать направленность теста-

опросника и связать диагностируемое свойство с тем или иным полю-

сом социальной желательности. Таким образом, действие этого факто-

ра до некоторой степени опосредовано действием факторов знания.

Однако при диагностике личностных свойств, тесно связанных с пси-

хической «нормальностью» или «социальной успешностью», фактор социальной желательности ответа обусловливает очень серьезные ис-

кажения.

3. Факторы индивидуальной тактики. Здесь подразумевается действие «Я-концепции» («Я» для себя) и «Я-образа» («Я» для дру-

гих) на ситуативную тактику испытуемого в момент тестирования. Вы-

полняя тест, испытуемый всегда находится в невольном диалоге с са-

мим собой и в своих ответах на вопросы раскрывает себя не только для других, но и для себя самого. Испытуемый стремится подтвердить

«Я-концепцию» или фальсифицировать определенный «Я-образ» с за-

данными свойствами. Как правило, в ситуациях высокого социального риска «Я-образ» полностью доминирует: например, преступник при экспертизе стремится прежде всего предстать больным или неприспо-

собленным к жизни, хотя в действительности ему было бы приятно ду-

мать о себе как о вполне адаптированном здоровом человеке. Точно так же склонны подчеркивать свои трудности и проблемы клиенты,

обратившиеся за помощью к психологу или психотерапевту (чтобы вы-

звать к себе его повышенное внимание). В менее регламентированных ситуациях, наоборот, может доминировать мотивация самопознания: в

этом случае испытуемый невольно стремится подтвердить с помощью теста свои гипотезы о самом себе.

Заслуживают внимания и особые формы отказа испытуемого от тестирования: позиционный стиль ответа(соглашательство или, на-

125

оборот, отрицание), случайные ответы. Для выявления подобных от-

казов обычно достаточно довольно простых мер: 1) для исключения влияния соглашательства (отрицания) применяются перечни с «пря-

мыми» (ответ «верно» в пользу измеряемого свойства) и «обратными»

(ответ «неверно» в пользу измеряемого свойства) пунктами. Кроме то-

го, производится подсчет баланса подтверждающих и отвергающих от-

ветов: если баланс резко нарушается, то протокол признается брако-

ванным; 2) для выявления случайных ответов в большие перечни вво-

дят вопросы-дубли (синонимические перефразы) или прямые повторы:

если испытуемый слишком часто по-разному отвечает на одинаковые вопросы, значит, он применяет случайную тактику. Вводят также и крайне редкие утверждения, с которыми испытуемые, как правило, со-

глашаются только по ошибке.

Более изощренные методы требуются для борьбы с социальной желательностью. Ниже рассмотрены три наиболее часто используемых варианта.

1. Введение особых «шкал лжи» в диагностический вариант ме-

тодики. Они составляются из вопросов-ловушек: тот или иной ответ на эти вопросы явно предопределен социальной желательностью. Если испытуемый набирает слишком высокий балл по этой шкале, его про-

токол бракуется. Более тонкий вариант — введение «шкал коррекции»

(например, в MMPI): получение определенного балла по этим шкалам вызывает внесение поправок к баллу по другим шкалам, скоррелиро-

ванным со шкалой коррекции. Величина поправок определяется ко-

эффициентом линейной регрессии (измеренным в нормативном экспе-

рименте) между баллами, полученными по шкале коррекции и основ-

ной диагностической шкале (шкале свойства).

2. Устранение или сбалансирование социальной желательности с помощью использования инструкции на преднамеренную фальсифика-

цию результатов. Участникам пилотажных замеров кроме обычной ин-

струкции дается дополнительная (во вторую очередь): «Заполните оп-

росник от лица человека, желающего произвести самое благоприятное впечатление». Затем производится отбор пунктов на основании того,

насколько процент ответов на них отличается от 50 процентов (значе-

ние, ожидаемое для пунктов, являющихся нейтральными с точки зре-

ния социальной желательности).

126

В качестве меры желательности в данном случае можно вос-

пользоваться следующим коэффициентом:

~

 

N (+) - N (-)

 

2N (+) - n

 

S

=

 

=

 

(3.3.2)

N (+) + N (-)

n

 

 

 

 

где N (+) — сумма ответов «верно» на данный пункт при инст-

рукции на фальсификацию;

N (-) - сумма ответов «неверно» в тех же условиях; n - объем выборки.

Значимость коэффициента приближенно оценивается по крите-

рию «хи-квадрат», определенному формулой (3.2.14), которой в пра-

~

вой части вместо φ подставляется S .

Поскольку инструкция на преднамеренную фальсификацию соз-

дает условия, в которых социальная желательность суждений акцен-

тируется, то значимыми следует считать такие высокие по модулю

значения

~

при

2

S

которых xэмп , превышает теоретическое значение

2

для квантиля

 

xгр

 

р < 0,001. Из таблицы для распределения «хи-квадрат» находим xгр2 =10,83. Таким образом, при наличии выборки объемом 50 человек

~

S гр = 10,83 / 50 = 0,45 . Это означает следующее: если

на i-й пункт более чем 36 испытуемых из 50 ответили «верно»,

то его нужно отнести к положительному полюсу шкалы социальной желательности, если менее чем 14 ответили «верно» — к отрицатель-

ному. Такие пункты должны быть либо полностью исключены из оп-

росника (что редко удается), либо количество положительных и отри-

цательных пунктов должно быть уравновешено.

Таким образом могут быть отобраны и пункты для шкалы лжи.

Суммарный балл по этой шкале распределяется так, как показано на рис. 12. В качестве критерия разделения испытуемых выбирается кри-

тическая точка, которая позволяет минимизировать ошибки типа «про-

пуск» (зачисление лживых испытуемых в число правдивых) и ошибки типа «ложная тревога» (зачисление правдивых в число лживых). По-

127

ложение критической точки на шкале можно менять в зависимости от баланса цены двух типов ошибок: в некоторых случаях «пропуск» го-

раздо опаснее, чем «ложная тревога».

Рис. 12. Смещение распределения тестовых баллов по

«шкале лжи» к полюсу высоких значений X при инструкции на выполнение теста-опросника с позиции «идеального» чело-

века

Фальсифицирующая инструкция используется также и для -ис

следования степени «скрытности-открытости» формулировок вопро-

сов. Например, испытуемым дается инструкция на симуляцию высокой тревожности по опроснику MAS Ж. Тейлор. В этом случае, как это уже было показано, ответы на многие пункты значимо изменяются. Такие пункты являются слишком открытыми — они информируют испытуемо-

го об измеряемом свойстве и позволяют ему вносить тенденциозные искажения в результаты в своих интересах.

3. С распространением факторного анализа чаще стала приме-

няться стратегия «балансирования социальной желательности». При

этом исследователь-психометрист задается целью обеспечить дискри-

минативную валидность своего теста относительно шкалы«соци-

альной желательности». Это достигается с помощью факторного ана-

лиза корреляций между пунктами. Факторный анализ в применении к одномерному тесту-опроснику, как правило, выделяет два фактора:

относящийся к самому измеряемому свойству и относящийся к соци-

альной желательности. На рис. 13 схематически представлено фак-

торное пространство для опросника «Склонность к риску».

128

Рис. 13. Иллюстрация рассеяния векторов (., изображаю-

щих пункты теста-опросника в пространстве двух факторов:

релевантного и иррелевантного. Выше и ниже штриховых ли-

ний - области низкой достоверности

Каждый вопрос представлен вектором, задаваемым проекцией на релевантный фактор - Склонность к риску и иррелевантные «Соци-

альное одобрение» и «Социальное порицание». Требование конвер-

гентной валидности по отношению к измеряемому свойству формули-

руется как требование к пунктамиметь высокую проекцию (нагруз-

ку) на горизонтальную ось. Дискриминативная валидность по отноше-

нию к социальной желательности - это требование иметь пренебрежи-

мо малую нагрузку на вертикальную ось. Очевидно, имеются два спо-

соба устранить эффект социальной желательности: либо выкинуть все пункты, нагруженные фактором социальной желательности (выше или ниже штриховых линий, либо уравновесить их количество на полюсах социальной желательности.

Понятно, что при таком способе освобождения от социальной желательности диагностическая шкала всегда оказывается так назы-

ваемой «ß-шкалой», в отличие от «а-шкал», у которых максимум же-

лательности достигается на одном из полюсов, у «ß-шкал» максимум желательности достигается в «золотой середине», т. е. линия регрес-

сии желательности по«бетта-шкале» оказывается криволинейной

(рис. 14). Если применить такой метод к построению опросника

«Склонность к риску - Осторожность», то в результате диагностиче-

ский конструкт автоматически становится«бета-шкалой»: и слишком высокая склонность к риску, и излишняя осторожностьодинаково

129

нежелательны, тогда как оптимум лежит посередине между крайно-

стями.

Рис. 14. Схематическая иллюстрация «-шкалы, связанной с фактором социальной желательности монотонной зависимо-

стью, и ß-шкалы, связанной с этим фактором криволинейно – с

максимумом в области «золотой середины»

Из трех перечисленных выше методов первый относится к отсе-

ву испытуемых и требует введения в перечень вопросов для шкалы

«лжи». Второй и третий методы позволяют отобрать только такие пункты, которые обеспечивают устранение социальной желательности.

Но они, как правило, трансформируют сам конструкт, который обяза-

тельно становятся ортогональным к социальной желательности. При необходимости диагностирования свойств, обязательно коррелирован-

ных с желательностью, единственный метод состоит в применении шкал коррекции и корректирующих поправок, но и этот метод нельзя считать вполне надежным. Так что диагностика свойств, сопряженных с социальной желательностью, в ситуациях экспертизы всегда риско-

ванна.

С другой стороны, в ситуации, когда сам испытуемый заинтере-

сован в точных результатах («ситуация клиента»), психодиагност мо-

жет пользоваться тестами-опросниками, не опасаясь артефакта соци-

альной желательности.

Обычно в ходе практической проверки достоверности опросника психологу при обработке результатов пилотажного исследования при-

ходится иметь дело с матрицей данных, подобной таблице, представ-

ленной на рис.15.

Ключ по шкале лжи L изображен на рис. 15 в виде второго

130