Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Diagnost_prozed_Devyatko

.pdf
Скачиваний:
5
Добавлен:
30.05.2015
Размер:
2.05 Mб
Скачать

группе индивидов), по существу показывает, что модель Кегле была недостаточно детерминистской, т.е., говоря современным языком, Кегле не специфицировал все причины, влияющие на интересовавшую его теоретическую переменную и ее поведенческий индикатор. В результате Лазарсфельд от "вероятностной" модели измерения и критики детерминизма в социологическом измерении переходит к каузальному анализу, как только возникает необходимость объяснить, в чем на самом деле заключалась "проблема Кегле". Он указывает, что так как измерение криминальной тенденции является "внутренней" процедурой и внешний критерий валидации используемого поведенческого индикатора отсутствует, то уже на стадии концептуализации нам придется искать разные индикаторы помимо уровня преступности (проявления неуважения к закону, агрессивность). И кроме того, если мы включим в их число долю действительно совершенных преступлений, мы уже не сможем узнать, каково эмпирическое отношение между криминальными тенденциями, измеренными независимо, и частотой преступлений, совершенных в разных группах и при различных социальных обстоятельствах [165. Р.308]. Лазарсфельд отмечает, что Кегле проводит разграни-

чение между общей криминальной тенденцией, умением осуществить преступление определенного типа и возможностью его осуществить при определенных обстоятельствах. Однако уверен-

ность Кегле в том, что в его сравнительных оценках уже учтены (поддерживаются на постоянном уровне) умение, возможность и вероятность обнаружения, помешала ему осознать необходимость найти меру криминальной тенденции, независимую от самого преступного акта. Таким образом, ПЛазарсфельд, поначалу обосновывающий в рассматриваемой статье вероятностную природу косвенного измерения (как соотнесения гипотетического конструкта теории и измеряемого индикатора), вынужден постоянно эксплицировать предположения о причинных связях "реального мира", включенных в конкретную ситуацию косвенного измерения. Т.е. то, что он считал излишним "в принципе", оказывается неизбежным практически. Отличительная же особенность подхода, развиваемого Х.Блейлоком, - постоянное подчеркивание необходимости заранее, основываясь на имеющихся теоретических представлениях, строить причинную теорию, связывающую постулируемые свойства с какими-то индикаторами, которые мы можем наблюдать относительно непосредственно.

Рассмотрим "проблему Кегле" с точки зрения такого подхода (заведомо ограничившись лишь теми трудностями, о которых говорит в своей статье ПЛазарсфельд и которые в значительной мере осознавал сам А.Кетле). В некоторой простейшей ситуации можно считать, что единственной причиной определенного индикатора (который мы обозначим как эффект-индикатор, в отличие от индика- тора-причины) является переменная, которая и представляет теоретический интерес для исследователя. Т.е., применительно к рассматриваемому нами случаю, криминальная тенденция X является единственной причиной уровня преступности Xv не считая каких-то

100

случайных факторов (не скоррелированных с X возмущений, разброс которых будет уменьшаться по закону больших чисел с ростом числа исследуемых случаев). Эта ситуация изображена на рис. 8 (для большей наглядности кружком здесь и далее обведены неизмеряемые переменные, а квадратом - измеряемые). Однако, если мы хотим далее сравнить значения Х1 в разных группах (или разных субкультурах) , нам нужно 1) решить, как составить полный список альтернативных форм преступного поведения, т.е. всех возможных видов преступлений, и выбрать критерий их включения или исключения (скажем, обращение жертвы в полицию и официальная регистрация факта преступления) , 2) найти способ их агрегирования, т.е. подсчета, заранее решив, что для получения сводного показателя альтернативные виды преступного поведения должны суммироваться или, скажем, перемножаться. Допустим, мы имеем полные списки видов преступлений для двух групп, например низкоквалифицированных фабричных рабочих и представителей "свободных профессий" с высоким доходом. Предположим также (не очень реалистически), что мы располагаем полными данными для двух выборок из этих групп о частоте совершения ими каждого вида преступлений из наших списков. Вполне возможно, однако, что в списке для второй группы намного меньше видов преступлений, чем в списке для первой группы (скажем, в нем отсутствуют убийства в пьяных драках и мелкие кражи). Мы, вероятно, захотим предположить, что возможно какое-то "замещение" одного типа преступного поведения другим (джентльмен, скажем, не убьет свою жену, но с помощью хитроумного мошенничества серьезно заденет ее финансовые интересы). Как мы можем получить сравнимые численные показатели для двух этих групп (если "криминальные тенденции", относительно которых мы могли бы "взвесить" преступления из двух списков, попрежнему остаются прямо не измеряемыми)?

Вернемся, однако, к предположениям, сделанным для простейшей ситуации, изображенной на рис. 8. Не обсуждая проблем межгрупповой сопоставимости индикаторов, т.е. считая их каким-то образом решенными, введем определенное усложнение в нашу модель. Допустим, что навыки, необходимые для свершения какого-то вида преступления (У), и возможности его совершить (P), зависящие от конкретной ситуации и вероятности быть уличенным, также влияют на наш эффект-индикатор, т.е. имеет место ситуация, изображенная на рис. 9.

Очевидно, в этой ситуации нам нужно скорректировать нашу меру преступной тенденции, статистически проконтролировав Y и P, что возможно лишь если У и P достаточно хорошо измерены. Последнее требование еще более важно, если мы предположим наличие между независимыми переменными существенной корреляции: даже чисто случайная, но существенная ошибка измерения в одной из этих независимых переменных не только сдвинет к нулю "ее" коэффициент в уравнении множественной регрессии, но и в случае высокой скоррелированности этой независимой переменной с другой будет приводить к завышенной оценке влияния этой второй

101

переменной. Однако Кегле не располагал возможностью измерить У и P, да и сейчас едва ли возможно это сделать, не вводя для них каких-то косвенных индикаторов, которые еще больше усложнят эту модель (если мы захотели использовать, скажем, экспертные оценки для навыков совершения преступлений определенного вида, нужно было бы ввести ряд допущений, касающихся разброса суждений, сходства критериев, используемых экспертами и т.п.). Поэтому Лазарсфельд и предложил найти независимую меру X, т.е. Х2 -некий индикатор преступной тенденции, отличный от самого преступления и не зависящий от Y и P. Если бы такой индикатор Х2 можно было бы найти, возникла бы уже теоретическая проблема обоснования его конструктной валидности (скажем, таким индикаторомоказаласьбычастотаповеденческихпроявленийнеуважения

к старшим).

Введем еще одно усложнение в ситуацию, представленную на рис. 9. Допустим, прежний уровень криминальной тенденции X (в более ранний момент времени) влиял на различия в преступных навыках Y между двумя нашими группами (рабочих и представителей "свободных" профессий), а различие в навыках, в свою очередь, влияло на возможность совершения преступления. Кроме того, прежнее значениеуровняпреступности Х1 можетчерезмеханизмобратнойсвязивлиятьнапоследующеезначениекриминальной тенденции X (такое предположение вполне правдоподобно, если допустить, чтокриминальноеповедениевопределенноймереявляется"социальновыученным"). Упрощеннаясхема дляэтогослучая представлена нарис. 10. Ещеболеесложной будет ситуация, когда различиевзначенияхпеременнойP (возможностей, случаев, благоприятных для совершения преступления) для двух наших групп в момент времени t - I каким-то образом, через различия в приобретенном опыте, навыках илив практике социализации представителей двух этих групп, влияет на "криминальную тенденцию" в момент t. Как мы можем измерить "криминальную тенденцию" в этихдвухситуациях? Конечно, существуютспособы, позволяющие приопределенныхусловияхидопущенияхсправитьсясмультикаузальностьюинерекурсивностьюв причинных моделях косвенного измерения. Ноеслиотношенияиндикаторовктеоретическимконструктам заранее не определены в теоретической системе, т.е. "вспомогательнаятеорияизмерения" неопределенастольжеотчетливо, какисодержательныетеоретическиегипотезы, исследователь, идеализирующий ситуациюизмерения, не сможет отделитьотклонения полученных результатов, вызванные неадекватностью этой идеализации, отошибоктеоретическогопрогноза.

В обсуждавшейся выше статье 1968 г. Х.Блейлок замечает, что меньшая, в целом, острота проблем измерения в естественных науках отчасти связана с замечательной константностью фундаментальных физических величин. В науках социальных, напротив, постоянно следует считаться с вариативностью эмпирических соотношений. Наряду с проблемами мультикаузальности, наличия механизмов обратной связи между индикатором и неизмеряемой пере-

102

Рис.8

Рис. 8. Модель с одним индикатором для " проблемы Кетле".

Рис.9. Модель с двумя измеряемыми и одной неизмеряемой переменной.

Рис. 10. Усложненная модель с обратной связью.

менной, в причинных моделях измерения должны делаться и некоторые предположения, касаю-

щиеся вариативности (или константности) этой связи. Поэтому еще одной темой, изначально включенной вобсуждаемый кругидей, является обоснованность принятия

«предположенияогомогенности». Эта темалегко можетбыть проиллюстрирована на примере сравнительных исследований или измерения опосредующих переменных. Пока же, лишь очерчивая ее общие контуры, вернемся крассмотренному примеру. Вэтом преступлений в группе - это эффект-индикатор Преступной тенденции. Но предположим, что мы сочли излишним понятие "криминальной тенденции" и хотим сравнить лишь сами уровни преступности34. Пусть Х1 - наблюдаемая частота преступлений, являющаяся какой-то частью истинного уровня преступности, т. е. истинной частоты X. Истинное значение X соответствует полному но не измеряемом уровню преступности, а Х1 - числу преступлений, зарегистрированныхофициально(покоторымбыло возбужденоуголовное дело). В таком случае мы можем считать, что Х1 равноистиннойвеличинеX, умноженнойнакакую-тоВели- чинуU. Можемлимысчитатьэтупоследнюювеличинуконстантой? Лишьвоченьограниченномчислеслучаевприсоблюдениицелого рядаусловий.

Вобщемже, U - этопеременная, значениякоторойбудутизменятся от ситуации к ситуации, от одного типа преступлений к другому(достаточносравнитьквартирныекражиивымогательство) и в зависимости от социальных характеристик обвиняемого или осужденного. Так, значения U могут быть намного меньше "беловоротничковой" преступности в сравнении с преступностью уличной. Поэтому попытка представить отношения X и Х1 в виде уравнения:

Х1 = a1+ b1X

103

34 Этот пример рассматривается Х.Блейлоком в работе [84. Р.89]

и считать U константой будет вести к заблуждениям. Конечно, в ситуации, когда истинное значение X неизвестно, можно использовать многоиндикаторный подход, но и в этом случае следует сделать определенные теоретические предположения о всех U., соединяющих X и X. -и индикатор, и постараться получить на этой основе ка- кие-то прямые измерения этих U. Можно использовать для этого специальное методическое исследование, посвященное сравнительному анализу статистики преступлений, зарегистрированных в результате обращения их жертв, добровольных явок с повинной, числа осужденных за различные виды преступлений среди представителей различных социальных групп и т.п. В ином случае, когда имеет место некритическое принятие "предположения о гомогенности", это обесценивает результат самого масштабного и интересного по замыслу исследования35.

Как пишет Х.Блейлок в другой своей книге [90. Р.128-138], существующая терпимость социологов к глобальным обобщениям, построенным на весьма ненадежных и чаще всего "выносимых за скобки" предположениях о содержательной стороне осуществленных ими измерительных процедур, может объясняться лишь недостатками сложившейся в эмпирической социологии интеллектуальной культуры.

2. Взаимозависимость концептуализации и измерения: случай использования категориальных переменных в социологическом анализе

Тезис о тесной связи теоретических и специально-методических проблем социологического исследования, о невозможности даже кумулятивного накопления чисто эмпирических результатов без существенного прояснения теоретических понятий в социологии можно считать своего рода "общим местом". Новизна подхода Х.Блейлока - в систематическом анализе того, как можно прояснить природу этой связи, строя "вспомогательные теории измерения".

Осуществляемый Х.Блейлоком разбор проблем концептуализации, возникающий при использовании категориальных переменных [89.' Р.109-145], интересен как образец такого систематического анализа, направленного на чрезвычайно распространенные и часто воспринимаемые как самоочевидные процедуры анализа данных и интерпретации.

Интерес социологов к категориальным данным и классификациям можно объяснить целым рядом причин: и преимущественно дескриптивной ориентацией, связанной с отсутствием достаточно общих теорий; и неразработанностью фундаментальных проблем измерения; и заинтересованностью в интерпретации исторических событий и "жгучих" проблем современности; и не слишком обязывающим и легкосогласуемым создравымсмысломхарактеромпредположений,

104

35Истории осознания этой проблемы в социологии много внимания уделяет, например, Э.Мокжицкив [153] (особенно гл.7,8).

принимаемых при использовании номинальных шкал и соответствующих методов анализа данных. Проблемы же, возникающие при использовании номинальных шкал и категориальных данных (даже столь простых, как "пол", "партийность" или "вероисповедание") и связанные прежде всего с многомерностью этих категорий, часто остаются вне области интересов исследователей и немногим реже - вне сколь-нибудь ясного осознания.

Оценка размерности для номинальных переменных является довольно редкой процедурой в конкретных социологических исследованиях. Поэтому социологи нередко предпочитают использование неупорядоченных "именных" категорий попыткам выделить какой-либо критерий, позволяющий упорядочить используемые категории I на одномерном континууме и достигнуть ординального уровня измерения. Такая стратегия, однако, делает невозможным обоснование сравнимости показателей, например в повторных исследованиях. Скажем, такие номинальные категории, как "протестант" или "квалифицированный профессионал", часто включаются в теоретическое объяснение в качестве биографических, экзогенных факторов, каким-то образом связанных с переменными жизненного опыта, влияющими на поведение или установки индивидов. Допустим, исследователь предположил, что конгрегационалисты, баптисты и квакеры могут быть объединены как "протестанты", чьи политические ориентации, в силу какой-то специфики жизненного опыта, могут быть сопоставлены с политическими ориентациями католиков или мусульман. Если он сравнивает результаты своего исследования с результатами идентичного по методике исследования, проведенного 10 или 30 лет назад, то может ли он считать их сравнимыми лишь на том основании, что словесные "ярлыки" его номинальных категорий не изменились? В большинстве случаев ответ будет отрицательным, так как неявно предполагаемая и скрытая за номинальной ; "религиозной" группировкой переменная жизненного опыта скорее всего не обладает стабильностью в таких временных интервалах. Аналогичная проблема возникает и в кросс-культурных исследованиях, когда предполагается, например, что "профессионалы", независимо от конкретного рода занятий или государственных границ, имеют сходные ролевые ожидания, и "профессионализм" используется как объясняющая переменная для построения общей теоретической модели.

Если исследователь прибегнет к другой стратегии и попытается упорядочить номинальные группировки по какому-то одному измерению, то возникает другая опасность - смешивания с другими ; "закоррелированными" измерениями, предполагающими совершенно иную теоретическую интерпретацию. Например, упорядочение религиозных деноминаций по степени "фундаментализма" может быть сильно связано с их ранжированием по престижности. Или упорядочение профессий по престижности окажется очень сходным с их упорядочением по среднему уровню образования. Если исследователь далее обозначит свою объясняющую переменную как религиозный фундаментализм или профессиональный престиж, то

105

полученная в результате теоретическая интерпретация будет совершенно отлична от интерпретации в терминах религиозного престижа или среднего уровня образования [89. Р. 113-114].

В большинстве случаев, отмечает Х.Блейлок, самой целесообразной стратегией оказывается введение серии промежуточных переменных (даже если они не могут быть непосредственно измерены) и формулировка теоретических гипотез в терминах этих промежуточных переменных, а не самих по себе номинальных "социально-де- мографических факторов". Тогда религиозная принадлежность или род занятий индивида будут включены во вспомогательную теорию измерения как причинные индикаторы определенной переменной жизненного опыта или знаний, получающей определенный балл в соответствии с вероисповеданием или профессией. В результате, например, протестант получит высокий балл по одному измерению, промежуточный - по другому и низкий - по третьему. Сходным образом профессиональная принадлежность получит численные оценки по нескольким измерениям, зависящим от рода занятий (экономическая власть, социальный престиж и так далее). При проведении сравнительных исследований теоретически определенные переменные будут сохранять свою тождественность, хотя система численных оценок вполне может изменяться. Например, профессии будут иначе ранжированы по "надежности дохода", а определенное вероисповедание окажется более "фундаменталистским" в одном обществе, чем в другом.

Разумеется, такой подход требует проведения специальных методических исследований, позволяющих получить численные оценки "проекций" биографических номинальных переменных на каждое из релевантных измерений опыта [89. Р.134-135]. Располагая результатами таких исследований, социолог, проводящий конкретный опрос, действительно мог бы ограничиться простыми вопросами, касающимися рода занятий или вероисповедания, так как ответы на эти вопросы могли бы далее получить некоторые числовые оценки, основанные на уже имеющейся информации. Тогда словесные "ярлыки", включающие прилагательные "профессиональный" или "религиозный", могли бы использоваться как сокращенные обозначения конкретных измерений, таких, как профессиональный престиж или религиозный фундаментализм36. Таким образом, "одна и та же" номинальная шкала могла бы использоваться при получении ординальных оценок для нескольких достаточно общих теоретических переменных, хотя такое использование категориальных переменных потребовало бы специальных мер предосторожности, направленных против потенциального смешения идентифицированных в модели переменных с неучтенными и неизмеряемыми факторами37. Здесь, по мнению Х.Блейлока, мы сталкиваемся с фундаментальной дилеммой, сходной с поставленной К.Кумбсом [110]: знаем ли мы то, что хотим, или хотим знать? Чем выше наши "амбиции" в измерении,

106

36В качестве примера такого подхода Х.Блейлок приводит социально-экономический индекс престижа профессий О.Дункана [119].

37Более детально эта проблема рассматривается в [87; 89, ch.6].

тем сильнее принимаемые нами предположения и допущения и выше вероятность желаемого результата, но в то же время - тем вероятнее ошибки интерпретации [89. Р.135].

Какой может быть общая стратегия концептуализации и построения "вспомогательной теории измерения" при использовании типичных для социологического исследования объясняющих переменных? Пожалуй, самым распространенным в эмпирических исследованиях типом объяснения (определяющим, соответственно, "набор" измеряемых переменных) является связывание "фоновых" биографических факторов либо с установками, ценностями и другими - " внутренними" переменными, либо с наблюдаемым поведением.

Преимущества такого подхода, с точки зрения измерения, очевидны, так как и зависимая, и объясняющая переменные в этом случае обычно имеют несколько индикаторов, а для обоснования и оценки эмпирической валидности и надежности существуют сравнительно простые и достаточно разработанные методы. Однако многочисленные эмпирические исследования, основанные на схеме "со- циально-демографическая переменная - установки/поведение", привели не только к созданию общей теории "социально-бытийной детерминации сознания или поведения, но и к накоплению сколь- ко-нибудь непротиворечивых и сопоставимых фактов, касающихся конкретных форм поведения и установок.

С точки зрения Х.Блейлока, недостаток таких исследований - имплицитность, неразвернутость теоретических представлений о природе связи этих двух типов измеряемых переменных. Обычно, связывая, например, социально-экономический статус или место жительства с политическим консерватизмом/либерализмом, исследователь предполагает, что существует какая-то переменная жизненного опыта, опосредующая эту связь. Однако эти переменные опыта, определяющие способ влияния биографических факторов на установки или поведение индивида, очень редко концептуализируются заранее, появляясь, в лучшем случае, при интерпретации результатов. Например, "различия в установках черных и белых американцев по отношению к реформе образования могут быть связаны с различиями в условиях социализации в родительской семье либо с различиями в экономических ресурсах этих групп, создающими стартовое неравенство при переходе к новой системе образования..." (наш пример вымышлен, однако найти реальные не составляет труда). Если бы эти переменные опыта были заранее концептуализированы и, если это возможно, измерены, то основания для связывания непосредственно наблюдаемых типов поведения или установок с "паспортными" данными были бы значительно прочнее. Более того, даже если переменные опыта, введенные во вспомогательную теорию измерения, сами не могут быть измерены с удовлетворительной точностью, становится возможным сформулировать серию теоретических предположений, которые вместе с допущениями о характере связи "опытных" и биографических переменных будут вести к верифицируемым гипотезам, косвенно подтверждаю-

107

щим или опровергающим теоретическую концепцию исследования [89. Р.142-144 ]. Следовательно, необходим некоторый список достаточно общих размерностей или факторов опыта, которые в каждом конкретном случае могли бы быть соотнесены и с биографическими переменными, и с интересующими исследователя типами поведения или установками. Эти общие размерности опыта должны быть достаточно неспецифическими и "бессодержательными", чтобы допускать в разных ситуациях конкретизацию и использование в качестве объясняющих переменных для самых многообразных форм

поведения.

Помимо такого списка измерений опыта, проводящий конкретное исследование социолог должен будет учесть степень значимости или релевантности каждой биографической переменной для каждого измерения опыта в данной ситуации. Например, "пол" может быть релевантным в ситуации А и иррелевантным в ситуации В. Т.е. степень релевантности какого-либо социально-демографического фактора также должна быть эксплицитно включена в модель измерения. Х.Блейлок осуществил первую попытку составить такой общий перечень измерений опыта, которые могут быть использованы во вспомогательных теориях измерения [89. Р.135-142 ]. Рассмотрим основные типы таких переменных опыта.

1) Уважение или статус, предоставляемые референтными группами. Это достаточно общий для самых разнообразных ситуаций тип переменных опыта, связанный со степенью получаемого субъектом статуса или уважения (независимо от конкретных форм его выражения) . По сути он задает некоторую ординальную позицию субъекта на континууме престижа по отношению к совокупности других субъектов. В некоторых случаях такие переменные статуса имеют специфическую метрику (например, размер денежного вознаграждения), но чаще всего подразумевают какое-либо ранжирование. Конкретные ситуации А и В могут, однако, отличаться дифференцированностью рангов, степенью явной заданности критериев ранжирования, выраженностью конкуренции в борьбе за статус и так далее. При этом перечисленные факторы будут выступать в качестве отдельных измерений данной переменной опыта, оказывающих различное влияние на представителей разных социально-демографиче- ских групп.

2) Согласованность экспектаций, связанных с поведением. Можно выделить несколько измерений, связанных с этой общей переменной (безотносительно к специфическому содержанию этих экспектаций): наличие (или отсутствие) различных групп, имеющих несовместимые ожидания по поводу поведения личности; ограниченность ресурсов, делающая невозможным одновременное следование согласованным экспектациям; предсказуемое и контролируемое либо случайное и находящееся вне контроля индивидуального деятеля изменение социальных экспектаций во времени. Примером теорий, связывающих несогласованные или несовместимые социальные экспектаций с социально-демографическими переменными и поведением является теория "рассогласованности статусов".

108

3)Мера наличия у деятелей существенных ресурсов. Вне зависимости от природы и сути адресованных индивидам экспектаций, статус или уважение получают те, кто способны им соответствовать. Какая бы "фоновая" переменная не служила источником этих ресурсов (биологическая наследственность, обучение, интериоризация форм поведения из микросоциального контекста или какая-то другая), тедеятели, которые необладают этими ресурсами, окажутся

вситуации дефицитарности. Однако (и здесь проявляется ограниченность упрощенной схемы "происхождение - успешность в деятельности") собственноевосприятиесубъектомсвоихресурсовбудет взаимодействовать с реальным уровнем успешности, влияя на уровень притязаний, "Я-концепцию", которые, в свою очередь, будут оказывать обратное воздействие на успешность деятельности.

4)Мера, в которой субъект подвергался трудностям, конфликтам, угрозам. Очевидно, чтонезависимоотконкретныхособенностей изучаемой ситуации, некоторые группы испытали меньше угрожающих иликонфликтных переживаний, чем другие - включая открытые конфликты, абсолютную либо относительную депривацию и так далее. Например, некоторые возрастные когорты испытали последствия трудностей военного времени или экологического кризиса, которых не испытали другие. Такие комулятивные переживания (а не сам по себе биологический возраст) будут проявляться в установках и поведении, особенно в ситуациях, имеющих смысловую соотнесенность с этими переживаниями.

Кроме описанных, Х.Блейлок выделяет и другие потенциально релевантные измерения опыта, связанные с биографическими переменными и влияющие на установки или поведение: гомогенность поведения индивидов, имеющих общую групповую принадлежность; степень зависимости статуса от успешности; "проницаемость" референтных групп; степень совместимости ожиданий с опытом социализации и раннего научения; возможность "ухода" из группы (иногда можно сменить этническую группу и практически никогда - расовую идентичность); количество предоставляемой субъекту эмоциональной поддержки; наличие драматических или плавных изменений в "истории жизни".

Разумеется, этот список неполон, однако он очень важен для очерчивания сферы переменных опыта, соответствующих многообразию ситуаций и типов поведения, которые представляют интерес для социолога. Спецификация этих переменных опытаj во вспомогательной теории измерения позволяет осуществить по крайней мере приближенное ранжирование вдоль "опытного" континуума субъектов, имеющих различные значения релевантных биографических переменных (даже в том случае, когда исследователь лишен возможности прямо или косвенно измерить переменную опыта).

Этот подход, однако, сталкивается с трудностями в тех случаях, когда существует много релевантных измерений опыта, часть которых взаимодействует друг с другом, и сравнительно малое число категорий биографической переменной. Х.Блейлок приводит следующийпример: если чернокожие американцы одновременно испыты-

109

вают ситуации, в которых не имеют достаточного доступа к ресурсам, в которых социальные ожидания рассогласованы, в которых они постоянно получают низкий статус, и если они имеют в среднем значительно больший "трудный" опыт, то на уровне интерпретации становится крайне трудно решить, какой из этих взаимодействующих механизмов оказывает первичное влияние на их установки и поведение. В этой ситуации исследователь должен найти подгруппу, "нагруженную" лишь по некоторым измерениям опыта (и оценить чистый эффект остальных). Полезным приемом является и декомпозиция укрупненных номинальных категорий: скажем, переход от пяти-шести объединенных категорий "рода занятий" х детализированному списку 50-60 профессий, которые можно будет дифференцировать по нескольким измерениям опыта согласно усредненным значениям соответствующих "опытов" их представителей.

Таким образом, даже если прямое измерение переменных опыта оказывается практически невозможным, они могут и должны быть сохранены в теоретической гипотезе и интерпретации при соблюдении некоторых условий: достаточно большого числа категорий биографической переменной (относительно гомогенных по релевантным измерениям опыта); возможности дать усредненную оценку опыта каждой категории (если не на индивидуальном, то на групповом уровне); наличия достаточно четких теоретических гипотез, соотносящих выделенные переменные опыта с общими типами поведения или установок. Следовательно, эта стратегия улучшения социологического измерения требует и хороших субстантивных теорий, и эксплицитных вспомогательных теорий измерения, связывающих переменные опыта с биографическими и поведенческими измеряемыми переменными.

3. Некоторые аспекты сравнимости измерений

Поскольку процесс измерения предполагает создание операционального языка, делающего объекты измерения сравнимыми в терминах этого языка, утверждения о несопоставимости измерений для различных групп, культур или ситуаций являются весьма веским аргументом, часто используемым критиками эмпирической социологии (см., например: [183]). Однако эти утверждения часто бывают столь общими и неспецифицированными, что исключают возможность конструктивного диалога. Примером такого рода утверждений может служить обобщенная аксиома "семантической неэквивалентности" стимулов или поведения в разных культурах или среди представителей различных субкультурных групп [183 ]. Однако, как бы ни формулировались такие соображения, они не лишены оснований и требуют некоторой общей стратегии в решении проблем сопоставимости.

Если в "соседней" психологии вопросы сравнимости измерений стали систематически разрабатываться еще в 40-е - 50-е годы (в дифференциальной психологии, теории тестов, экспериментальной

110

психосемантике), то в социологии эта проблема стала предметом специальных исследований к концу 60-х - началу 70-х годов (например, в работах Г.Костнера, Р.Хаузера и А.Гольдберга и др., проводившихся преимущественно в рамках многоиндикаторного подхода, рассмотренного в предыдущей главе).

Здесь мы затронем лишь проблему сравнимости измерений, хотя утверждения о несопоставимости часто относятся либо к неэквивалентности "личностных смыслов", т.е. коннотативных компонентов значения, либо к несопоставимости, возникающей в процессе обобщения в результате действия неконтролируемых переменных. Последние два типа аргументов обычно вполне обоснованны и служат предметом анализа в психосемантике, изучающей индивидуальные системы значений (см., например: [58]), и в работах, посвященных планированию квазиэкспериментальных исследований [31 ]. Принято считать, что проблема сравнимости измерений возникает в ситуации, когда измерение носит косвенный, непрямой характер (т.е. отношение между теоретическим концептом и наблюдаемой переменной явно опосредовано теоретически специфицированным эмпирическим конструктом), а вспомогательные теории измерения могут варьировать в зависимости от условий или контекста. Вопрос становится еще сложнее в случаях, когда вспомогательная теория измерения включает те же переменные, которые, уже в качестве теоретических концептов, включены в основную содержательную теорию, что приводит к смешиванию теоретических и "измерительных" проблем. Например, какой-либо из биографических факторов (пол или социаль- но-экономический статус) может приводить к систематической ошибке измерения и в то же самое время быть причиной или следствием тех переменных, которые исследователь стремится измерить. В этом случае, чем менее отчетливо определена вспомогательная теория измерения и чем сложнее основная теория, тем невозможнее атрибутировать различия, возникающие при сравнении измерений (между условиями, временными периодами или индивидами). Т.е. однозначно приписать эти различия к истинным содержательным или вызванным артефактами измерениям.

Проблема сравнимости измерений имеет целый ряд аспектов: использование общих индикаторов в многоиндикаторном анализе и его ограничения [89. Р.76-85; 200]; нелинейные отношения между конструктом и индикатором, вариабельность коэффициентов в структурных уравнениях (как в примере с "беловоротничковой" преступностью на с. 101) и другие. Мы ограничимся рассмотрением двух примеров, не требующих введения громоздкого формального аппарата.

Первый из этих примеров связан с нелинейностью отношения между теоретически определяемой переменной и индикатором. Рассмотрим пример приборного измерения, приводимый в работе [30 ]

111

иобсуждаемый авторами в том же, по сути, контексте роли содержательных теоретических соображений в непрямом социологическом измерении. Пусть теоретическая переменная - это уровень удовлетворенности трудом для некоторой совокупности, зависящая (при контроле многочисленных прочих факторов) от каждого приращения зарплаты (измеряемого, например, в рублях). Эта зависимость, как

исвязь "морального" и "физического" богатства у Я.Бернулли (см.: [99]), вероятно, будет подвержена насыщению, так что функциональная форма отношения между удовлетворенностью и доходом будет выглядеть как на рис. 11.

Допустим, что в теоретической модели исследования предполагается наличие связи между удовлетворенностью трудом (или, уже, материальным вознаграждением за труд), т.е. внутренним состоянием, и каким-то поведением P. Последнее может относиться к качеству труда, досуговой активности или чему-либо еще. В отсутствие удовлетворительного способа измерения субъективного состояния У исследователь может обратиться к причинному индикатору - зарплате, т.е. прибегнуть к приборному измерению. Если поведение P и удовлетворенность У связаны линейно, то, согласно модели насыщения, связь между индикатором У и переменной P будет нелинейной (кривая, изображенная на рис.11, может в конкретном случае оказаться логарифмической функцией, сегментом параболы или степенной функцией с положительным показателем, меньшим 1).

Мысленный эксперимент, предложенный Х.Блейлоком и близкий к экспериментальным схемам психофизики, заключается в следующем предположении. Пусть для условия Л (относящегося ко времени, характеристикам популяции или к ситуации) основное число случаев попадет в левую часть кривой, а для аналогичного условия В - в правую, верхнюю часть. Тогда коэффициент уравнения, линейно связывающего P и Yl , для условия А окажется " круче", больше, чем для условия В. Конечно, если мы имеем прямую меру для У и эксплицитную вспомогательную теорию измерения, предсказывающую данный эффект, это предположение легко проверяемо. Но если удовлетворенность У прямо не измеряется, то нельзя будет отличить предсказания модели, изображенной на рис. 11, от модели, где отношения У и У - линейны, а нелинейна связь между У (удовлетворенностью) и P (поведением). В этом случае нужны несколько показателей для У — У1 , У2 и т.д., а также явные теоретические предсказания о форме связи каждого Уj с У. Этого рода проблемы часто оказываются вне поля зрения исследователя, использующего факторный анализ или путевой анализ и некритически принимающего допущения о линейности функциональных связей между "скрытыми" конструктами и индикаторами без проверки пределов его применимости к конкретной ситуации38 . Х.Блейлок особенно предостере-

гает от " слепого" использования программ типа LISREL,

112

38 Если такое допущение неприемлемо, то можно попытаться разбить выборку на подвыборки, соответствующие областям значений Аи В на континууме У^, и провести грубую оценку теоретической модели.

так как ошибки спецификации переменных будут распространяться по всей каузальной системе J89. Р.87-88 ]. По его мнению, особенно типичны нелинейные отношения между социально-демографически- ми, и вообще биографическими переменными, и переменными "внутренних состояний" (например.между формальной длительностью образования, измеренной как число лет обучения, и квалификацией).

Второй пример относится к проблемам сравнимости, возникающим из-за различий в сложности ситуаций, а именно - к последствиям дифференциальной сложности в случае использования эффектиндикаторов для косвенного измерения в ситуации мультикаузальности.

При использовании эффект-индикаторов, часто принимается допущение, что, кроме небольших случайных возмущений, единственной причиной эффект-индикатора является неизмеряемая переменная, представляющая в данном случае интерес для теоретической модели. Однако индикатор (обозначим его как X. ) может подвергаться воздействию не только переменной X, которую предполагается измерить, но и других переменных, например V или P . Кроме того, эти переменные V и P сами могут быть связаны с переменной X в некоторых ситуациях. Тогда обоснованность использования индикатора X. или совокупности индикаторов будет варьировать от ситуации к ситуации. Уже в статье 1968 г. [82] Х.Блейлок использует иллюстративный пример с измерением расовой дискриминации, к которому он неоднократно обращается и в более поздних работах. Пусть, скажем, некоторая мера неравенства, типа различия в доходе, служит для измерения расовой дискриминации. В некоторой ситуации А вполне обоснованным кажется предположение, что единственной причиной неравенства X , помимо случайных возмущений, является дискриминация со стороны работодателя. Однако предположим, что в более сложной ситуации В, помимо дискриминации со стороны работодателя, может оказаться существенным влияние различий в уровне образования, способностей или опыта работы (обозначим соответственно как F, P, и У). Если эти переменные будут измерены, то существует возможность получения чистого эффекта X (см. рис.12). Однако ситуации А и В, в силу своей простоты, включают лишь очень ограниченное число факторов. Более сложная ситуация потребует разработки более сложной модели. В некоторых случаях, если исследование охватывает достаточно большой промежуток времени, разумно предположить, что показатель различий в образовании зависит не только от "образовательной" дискриминации как ограничения доступа к равным возможностям обучения, но и от поселенческой сегрегации. Если предположить, что поселенческая сегрегация, "накопленная" к моменту t, влияет и на доступность тех или иных профессий (помимо прямой профессиональной дискриминации), то можно ли сравнивать показатели неравенства в доходах (Х1 ) или в образовании в этой ситуации с " теми же" показателями в более простых ситуациях А и В.

Важным преимуществом причинного анализа и построения диаграмм здесь является возможность визуализировать модель измере-

8 И.Ф.Девятко

113

ния и сделать очевидной границу, когда неизвестных становится "слишком много" и получить единственное решение невозможно, т.е. возникает необходимость в априорных предположениях (например, различия в уровне образования зависят только от дискриминации в сфере образования). Последнее обстоятельство очень существенно для повышения культуры не только измерения, но и теоретизирования: ведь в ситуации, когда отсутствуют ограничения на сложность теоретической модели и для каждого "случая" вводятся новые объясняющие факторы, всегда можно, образно говоря, "объяснить 100% дисперсии". "Можно показать, что при допущении возможности, когда все влияет на все с неопределенными параметрами, будет существовать бесконечное число наборов оценок параметров, абсолютно согласованных с одним и тем же множеством данных" [86. Р.282]39. При этом теоретики могут до бесконечности спорить, чей набор объясняющих переменных "лучше" без всяких шансов разрешить этот спор эмпирическими средствами.

Анализ влияния дифференциальной сложности ситуаций и соответствующих им теоретических моделей на сравнимость показателей позволяет затронуть еще одну существенную проблему - проблему валидности. Как мы показали во второй главе нашей книги, разработка моделей измерения привела к пониманию ограниченности, присущей концепции валидности и традиционным подходам к валидизации, которые в конце50-х - начале 60-х годов активно

114

39 Интересно отметить, что анализируя с этой точки зрения недостатки исторического метода в книге [90], Х.Блейлок приходит к выводу, что тактика введения новых объясняющих переменных для каждого нового наблюдения превращает социолога или политолога в "эрудированного обывателя", суждения которого всегда согласованы со здравым смыслом (часто содержащим логически несовместимые посылки) и в то же время богаты неизвестными" человеку-с-улицы" деталями и специально подобранными подтверждающими примерами.

Профессиональная

дискриминация

П

Неизмеряемые

переменные

дискриминации

Измеряемые показатели

Профессиональное

неравенство

Различиявголосованиинавыборах

*

Рис. 13. Схема связи переменных дискриминации с измеряемыми показателями .

* В данной модели опущены многие переменные блока " Поведение меньшинства" - агрессия, избегание контактов с доминирующим большинством и т.п., рассматриваемые Х.Блейлоком.

заимствовались социологами из психометрики. В тех ситуациях, когда невозможно связать концепты и индикаторы по принципу "один к одному", но наличие нескольких показателей для каждой ненаблюдаемой переменной делает измерение возможным, понятие "валидности" может вводить в заблуждение, подталкивая исследователя к поиску несуществующего "идеального" валидного показателя. Правильным путем здесь чаще всего будет разработка вспомогательной теории, связывающей несколько неизмеряемых переменных с несколькими индикаторами (о чем и шла речь в предыдущей главе). Вернувшись к примеру с дискриминацией, мы можем заметить, что понятие дискриминирующего поведения довольно далеко отстоит от обычно используемых мер дискриминации, относящихся к физической сегрегации либо к какого-то рода неравенству. В самой простой ситуации различия в социально-профессиональной структуре доминирующего большинства и меньшинства могут быть использованы как показатель профессиональной дискриминации, различия в образовании - как показатель дискриминации в получении образования, а поселенческая сегрегация - как индикатор поселенческой изоляции40. Однако в более сложной и близкой к реальности ситу-

115

40 Хотядаже такое сравнительнопростоепонятие, какпоселенческая сегрегация, создает серьезные трудности при попытке измерения. См. [120].

ации любые меры неравенства являются результатом не только дискриминирующего поведения большинства, но и поведения самого меньшинства, что должно быть отражено во вспомогательной теории измерения.

Кроме того, переменные-индикаторы могут быть функциями не только тех переменных дискриминации, которые включены в основную теорию и являются основной целью измерения. Приведем одну из возможных моделей примера с дискриминацией, рассматриваемую Х.Блейлоком в статье [86. Р.296] (см. рис. 13).

Вполне очевидно, что традиционная концепция валидности в ситуации, сходной с изображенной на рис. 13, имеет весьма ограниченное применение. Очевидны и последствия для сравнимости показателей. Например, "экономическое неравенство" в ситуации, изображенной на рис. 13, будет зависеть от всех неизмеряемых переменных и, в свою очередь, влиять по крайней мере на поселенческую и социальную изоляцию. Следовательно, нет никаких оснований считать этот индикатор эквивалентным "экономическому неравенству" в ситуации взаимооднозначного соответствия.

Глава четвертая

НОВЫЕ ПРИЛОЖЕНИЯ И ПЕРСПЕКТИВЫ МОДЕЛИРУЮЩЕГО ПОДХОДА

1. Обобщение моделей структурных уравнений с латентной переменной и "общеизвестные истины" измерения

В недавней фундаментальной работе К.Боллена [96 ] представления о самостоятельном значении теоретически обоснованных моделей измерения были использованы для успешной попытки синтеза и обобщения подходов и методов, применяемых в психометрике, эконометрике и социальных науках при описании и анализе отношений между теоретическими и эмпирическими переменными. К моделям структурных уравнений (structural equation models, т.е.. моделям,

состоящим из структурных уравнений) относятся и регрессионные,

иэконометрические, и факторно-аналитические процедуры. Таким образом, и модели со множественными индикаторами, и модели путевого анализа, и факторные модели с латентными переменными могут быть включены в общий класс структурных моделей с латентными (или ненаблюдаемыми) переменными. Система структурных уравнений, задающих модель, в этом общем случае состоит из двух подсистем: модели латентных переменных, описывающей отношения ненаблюдаемых (неизмеряемых) одномерных конструктов, и модели измерения [96. Р. 11]. Таким образом, предложенное обобщение понятия структурной модели в явной, эксплицитной форме включает модель измерения в проверяемую теоретическую модель. Полная теоретическая модель описывает отношения между зависимыми и независимыми переменными и допускает наличие ошибок измерения

ив первых, и во вторых.

Демонстрацией продуктивности этого подхода стал систематический критический пересмотр ряда "общеизвестных истин" классической теории тестов, результаты которого изложены, в частности, в работе К.Боллена и Р.Леннокса [97 ]. Так как к теме эффективности моделирующего подхода к измерению для пересмотра ряда некритически принимаемых положений традиционной психометрики мы уже неоднократно обращались (например, при описании многоиндикаторного подхода к конструктной валидности), мы ограничимся лишь описанием некоторых новых результатов, полученных Болленом и Ленноксом. Эти результаты интересны для нас, прежде всего, как еще одна иллюстрация тех радикальных изменений, которые были инициированы возникновением моделирующего подхода к измерению. Боллен и Леннокс поставили своей целью проверить, насколько обоснованны обычные рекомендации, касающиеся отбора индикаторов (чаще всего - тестов или анкетных вопросов) и используемые исследователями в повседневной практике. Эту проверку они осуществили для двух общих моделей измерения. Первая из них - классическая модель теории тестов и факторного анализа, где индикаторы

117

(пункты теста, вопросы) зависят от латентной переменной. Эту модель, вслед за Х.Блейлоком, часто называют моделью измерения с эффект-индикаторами, т.е. индикаторами-следствиями латентной переменной. Для этой модели принимаются все обычные предположения теории тестов, в том числе и предположение о том, что истинные значения латентной переменной определяют значения ее индикаторов. Так как латентная переменная - это чаще всего некоторый теоретический конструкт, то примерами этой общей модели могут служить и многочисленные "черты личности" (от тревожности до макиавеллизма), и способности (например, невербальный интеллект), и диспозиции (политическая активность).

Вторая рассматривавшаяся Болленом и Ленноксом общая модель

- это модель с причинными индикаторами. Мы уже обращались к примерам причинных индикаторов латентных переменных. В качестве причинных индикаторов используются, например, многие категориальные переменные, описывающие "жизненный путь" респондентов, например, образование или доход родителей (другие примеры можно найти на с.104-110 данной работы). Разумеется, причинными индикаторами они становятся лишь в том случае, если исследователь предполагает, что эти переменные детерминируют значение латентной переменной. Например, социолог может считать, что продолжительность обучения и доход определяют социальный статус (не вкладывая при этом в понятия "определяют" или "служит причиной" буквального физического смысла). Другими примерами могут служить "лишение пищи" как причинный индикатор "голода", "психологическая травма" как причинный индикатор "стресса" и т.п. Не входя в технические подробности (многие из которых, к тому же, обсуждались нами раньше), отметим, что даже простейшая модель латентной переменной с несколькими причинными индикаторами (последние еще называют "формативными") будет очевидным образом отличаться от предыдущей. Например, возрастание значения латентной переменной не обязательно будет сопряжено с возрастанием значений всех ее индикаторов.

Одним из фундаментальных понятий теории тестов является понятие внутренней согласованности пунктов теста или батареи вопросов, предназначенных для измерения одной латентной переменной. Это понятие составляет основу для оценки надежностисогласованности, или одномоментной надежности (см., в частности, с.61-64 данной работы), и для применения факторного анализа. Внутренняя согласованность подразумевает положительную корреляцию индикаторов одной переменной (разумеется, при условии, что все пункты-индикаторы сформулированы в одном направлении). Обычно рекомендуется исключать индикаторы, имеющие нулевую или отрицательную корреляцию с остальными. Обоснованность критерия внутренней согласованности для первой модели - с эффектиндикаторами латентной переменной - не вызывает никаких сомнений. При условии стандартизации латентной и наблюдаемых переменных, корреляция между индикаторами будет равна произведению их корреляций с истинным баллом. Если корреляция индика-

118

торов с истинным баллом положительна, то и их корреляции друг с другом также должны быть положительны.

Совсем иной будет ситуация для второй модели с причинными индикаторами латентной переменной, так как сама модель не налагает никаких ограничений на попарные корреляции между индикаторами: они могут быть положительными, отрицательными или нулевыми. Скажем, связь между образованием и доходом как индикаторами статуса в некоторых обществах может быть нулевой или отрицательной. Столь же трудно определить заранее направление и величину связи между различными причинными индикаторами стресса, например, потерей работы, смертью супруга и болезнью. Исследователь, использующий рутинные процедуры поиска максимальных значений в матрице корреляций, рискует пропустить самые информативные индикаторы. Таким образом, некритичное использование критерия внутренней согласованности может вести к совершенно ошибочным выводам.

Другим распространенным методологическим "рецептом" (не всегда, кстати, согласующимся с критерием внутренней согласован-

ности) является оптимальная корреляция индикаторов. Аргумен-

том в этом случае обычно является необходимость обеспечить генерализуемость и валидность выводов, что невозможно для чрезмерно, специфичногоиузкогонаборавысококоррелированныхиндикаторов.

Однако анализ двух вышеописанных элементарных моделей ставит под сомнение и эту рекомендацию. Для модели с эффект-инди- каторами латентной переменной предпочтительной все же является высокая корреляция индикаторов. Если же у исследователя есть основания предположить наличие скоррелированных ошибок измерения между индикаторами, то он не имеет никаких оснований предпочитать индикаторы с умеренной корреляцией, так как единственный способ справиться с этой проблемой - это специфицировать предполагаемую модель измерения и внести следующие из нее поправки в процедуру отбора индикаторов.

В случае же модели с причинными индикаторами, как уже говорилось, величины корреляций между индикаторами никак не ограничиваются самой моделью и определяются лежащими вне модели (экзогенными) факторами. Конечно, высокие корреляции между причинными индикаторами затрудняют оценку воздействия каждого из них на латентную переменную (проблема мультиколлинеарности), и в этой ситуации низкие корреляции предпочтительнее. Однако никаких общих рекомендаций для причинных индикаторов сделать нельзя, так как оптимальное значение корреляций между индикаторами будет определяться лишь конкретной моделью измерения.

При выборе индикаторов одномерного теоретического конструкта часто рекомендуется выбирать индикаторы, представляющие все аспекты ("фасеты") этого конструкта, т.е. латентной переменной (ср. с.37). Боллен и Леннокс, рассмотрев две описанные элементарные модели, пришли к следующему выводу: "В общем итоге, рекомендация делать выборку индикаторов для всех граней конструкта

119

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]