- •Москва "наука" 1993
- •Глава первая
- •1. Становление основных подходов к измерению установок (1920-е - 1930-е годы)
- •3. Психологическая ориентация: ф.Олпорт, л.Л.Терстоун, р.Ликерт
- •4. Традиция Гутмана-Лазарсфельда
- •2. Надежность и валидность эмпирическх моделей
- •3. Множественные индикаторы в оценке качества измерения
- •1. Концептуализация и косвенное измерение
- •2. Взаимозависимость концептуализации и измерения:
- •1. Обобщение моделей структурных уравнений с латентной переменной и "общеизвестные истины" измерения
- •2. Г£гяао-методология и процедуры автоматического поиска моделей
- •4. Реалистская стратегия измерения
- •Вместо заключения: о радикальной критике "количественных" процедур в социологии 1
- •Литература
2. Взаимозависимость концептуализации и измерения:
случай использования категориальных переменных
в социологическом анализе
Тезис о тесной связи теоретических и специально-методических проблем социологического исследования, о невозможности даже кумулятивного накопления чисто эмпирических результатов без существенного прояснения теоретических понятий в социологии можно считать своего рода "общим местом". Новизна подхода Х.Блейлока - в систематическом анализе того, как можно прояснить природу этой связи, строя "вспомогательные теории измерения".
Осуществляемый Х.Блейлоком разбор проблем концептуализации, возникающий при использовании категориальных переменных [89.' Р.109-145], интересен как образец такого систематического анализа, направленного на чрезвычайно распространенные и часто воспринимаемые как самоочевидные процедуры анализа данных и интерпретации.
Интерес социологов к категориальным данным и классификациям можно объяснить целым рядом причин: и преимущественно дескриптивной ориентацией, связанной с отсутствием достаточно общих теорий; и неразработанностью фундаментальных проблем измерения; и заинтересованностью в интерпретации исторических событий и "жгучих" проблем современности; и не слишком обязывающим и легко согласуемым со здравым смыслом характером предположений,
104
принимаемых при использовании номинальных шкал и соответствующих методов анализа данных. Проблемы же, возникающие при использовании номинальных шкал и категориальных данных (даже столь простых, как "пол", "партийность" или "вероисповедание") и связанные прежде всего с многомерностью этих категорий, часто остаются вне области интересов исследователей и немногим реже - вне сколь-нибудь ясного осознания.
Оценка размерности для номинальных переменных является довольно редкой процедурой в конкретных социологических исследованиях. Поэтому социологи нередко предпочитают использование неупорядоченных "именных" категорий попыткам выделить какой-либо критерий, позволяющий упорядочить используемые категории I на одномерном континууме и достигнуть ординального уровня измерения. Такая стратегия, однако, делает невозможным обоснование сравнимости показателей, например в повторных исследованиях. Скажем, такие номинальные категории, как "протестант" или "квалифицированный профессионал", часто включаются в теоретическое объяснение в качестве биографических, экзогенных факторов, каким-то образом связанных с переменными жизненного опыта, влияющими на поведение или установки индивидов. Допустим, исследователь предположил, что конгрегационалисты, баптисты и квакеры могут быть объединены как "протестанты", чьи политические ориентации, в силу какой-то специфики жизненного опыта, могут быть сопоставлены с политическими ориентациями католиков или мусульман. Если он сравнивает результаты своего исследования с результатами идентичного по методике исследования, проведенного 10 или 30 лет назад, то может ли он считать их сравнимыми лишь на том основании, что словесные "ярлыки" его номинальных категорий не изменились? В большинстве случаев ответ будет отрицательным, так как неявно предполагаемая и скрытая за номинальной ; "религиозной" группировкой переменная жизненного опыта скорее всего не обладает стабильностью в таких временных интервалах. Аналогичная проблема возникает и в кросс-культурных исследованиях, когда предполагается, например, что "профессионалы", независимо от конкретного рода занятий или государственных границ, имеют сходные ролевые ожидания, и "профессионализм" используется как объясняющая переменная для построения общей теоретической модели.
Если исследователь прибегнет к другой стратегии и попытается упорядочить номинальные группировки по какому-то одному измерению, то возникает другая опасность - смешивания с другими ; "закоррелированными" измерениями, предполагающими совершенно иную теоретическую интерпретацию. Например, упорядочение религиозных деноминаций по степени "фундаментализма" может быть сильно связано с их ранжированием по престижности. Или упорядочение профессий по престижности окажется очень сходным с их упорядочением по среднему уровню образования. Если исследователь далее обозначит свою объясняющую переменную как религиозный фундаментализм или профессиональный престиж, то
105
полученная в результате теоретическая интерпретация будет совершенно отлична от интерпретации в терминах религиозного престижа или среднего уровня образования [89. Р. 113-114].
В большинстве случаев, отмечает Х.Блейлок, самой целесообразной стратегией оказывается введение серии промежуточных переменных (даже если они не могут быть непосредственно измерены) и формулировка теоретических гипотез в терминах этих промежуточных переменных, а не самих по себе номинальных "социально-демографических факторов". Тогда религиозная принадлежность или род занятий индивида будут включены во вспомогательную теорию измерения как причинные индикаторы определенной переменной жизненного опыта или знаний, получающей определенный балл в соответствии с вероисповеданием или профессией. В результате, например, протестант получит высокий балл по одному измерению, промежуточный - по другому и низкий - по третьему. Сходным образом профессиональная принадлежность получит численные оценки по нескольким измерениям, зависящим от рода занятий (экономическая власть, социальный престиж и так далее). При проведении сравнительных исследований теоретически определенные переменные будут сохранять свою тождественность, хотя система численных оценок вполне может изменяться. Например, профессии будут иначе ранжированы по "надежности дохода", а определенное вероисповедание окажется более "фундаменталистским" в одном обществе, чем в другом.
Разумеется, такой подход требует проведения специальных методических исследований, позволяющих получить численные оценки "проекций" биографических номинальных переменных на каждое из релевантных измерений опыта [89. Р.134-135]. Располагая результатами таких исследований, социолог, проводящий конкретный опрос, действительно мог бы ограничиться простыми вопросами, касающимися рода занятий или вероисповедания, так как ответы на эти вопросы могли бы далее получить некоторые числовые оценки, основанные на уже имеющейся информации. Тогда словесные "ярлыки", включающие прилагательные "профессиональный" или "религиозный", могли бы использоваться как сокращенные обозначения конкретных измерений, таких, как профессиональный престиж или религиозный фундаментализм36. Таким образом, "одна и та же" номинальная шкала могла бы использоваться при получении ординальных оценок для нескольких достаточно общих теоретических переменных, хотя такое использование категориальных переменных потребовало бы специальных мер предосторожности, направленных против потенциального смешения идентифицированных в модели переменных с неучтенными и неизмеряемыми факторами37. Здесь, по мнению Х.Блейлока, мы сталкиваемся с фундаментальной дилеммой, сходной с поставленной К.Кумбсом [110]: знаем ли мы то, что хотим, или хотим знать? Чем выше наши "амбиции" в измерении,
106
тем сильнее принимаемые нами предположения и допущения и выше вероятность желаемого результата, но в то же время - тем вероятнее ошибки интерпретации [89. Р.135].
Какой может быть общая стратегия концептуализации и построения "вспомогательной теории измерения" при использовании типичных для социологического исследования объясняющих переменных? Пожалуй, самым распространенным в эмпирических исследованиях типом объяснения (определяющим, соответственно, "набор" измеряемых переменных) является связывание "фоновых" биографических факторов либо с установками, ценностями и другими - " внутренними" переменными, либо с наблюдаемым поведением.
Преимущества такого подхода, с точки зрения измерения, очевидны, так как и зависимая, и объясняющая переменные в этом случае обычно имеют несколько индикаторов, а для обоснования и оценки эмпирической валидности и надежности существуют сравнительно простые и достаточно разработанные методы. Однако много-численные эмпирические исследования, основанные на схеме "социально-демографическая переменная - установки/поведение", привели не только к созданию общей теории "социально-бытийной детерминации сознания или поведения, но и к накоплению сколько-нибудь непротиворечивых и сопоставимых фактов, касающихся конкретных форм поведения и установок.
С точки зрения Х.Блейлока, недостаток таких исследований -имплицитность, неразвернутость теоретических представлений о природе связи этих двух типов измеряемых переменных. Обычно, связывая, например, социально-экономический статус или место жительства с политическим консерватизмом/либерализмом, исследователь предполагает, что существует какая-то переменная жизненного опыта, опосредующая эту связь. Однако эти переменные опыта, определяющие способ влияния биографических факторов на установки или поведение индивида, очень редко концептуализируются заранее, появляясь, в лучшем случае, при интерпретации результатов. Например, "различия в установках черных и белых американцев по отношению к реформе образования могут быть связаны с различиями в условиях социализации в родительской семье либо с различиями в экономических ресурсах этих групп, создающими стартовое неравенство при переходе к новой системе образования..." (наш пример вымышлен, однако найти реальные не составляет труда). Если бы эти переменные опыта были заранее концептуализированы и, если это возможно, измерены, то основания для связывания непосредственно наблюдаемых типов поведения или установок с "паспортными" данными были бы значительно прочнее. Более того, даже если переменные опыта, введенные во вспомогательную теорию измерения, сами не могут быть измерены с удовлетворительной точностью, становится возможным сформулировать серию теоретических предположений, которые вместе с допущениями о характере связи "опытных" и биографических переменных будут вести к верифицируемым гипотезам, косвенно подтверждаю- 107
щим или опровергающим теоретическую концепцию исследования [89. Р.142-144 ]. Следовательно, необходим некоторый список достаточно общих размерностей или факторов опыта, которые в каждом конкретном случае могли бы быть соотнесены и с биографическими переменными, и с интересующими исследователя типами поведения или установками. Эти общие размерности опыта должны быть достаточно неспецифическими и "бессодержательными", чтобы допускать в разных ситуациях конкретизацию и использование в качестве объясняющих переменных для самых многообразных форм
поведения.
Помимо такого списка измерений опыта, проводящий конкретное исследование социолог должен будет учесть степень значимости или релевантности каждой биографической переменной для каждого измерения опыта в данной ситуации. Например, "пол" может быть релевантным в ситуации А и иррелевантным в ситуации В. Т.е. степень релевантности какого-либо социально-демографического фактора также должна быть эксплицитно включена в модель измерения. Х.Блейлок осуществил первую попытку составить такой общий перечень измерений опыта, которые могут быть использованы во вспомогательных теориях измерения [89. Р.135-142 ]. Рассмотрим основные типы таких переменных опыта.
1) Уважение или статус, предоставляемые референтными группами. Это достаточно общий для самых разнообразных ситуаций тип переменных опыта, связанный со степенью получаемого субъектом статуса или уважения (независимо от конкретных форм его выражения) . По сути он задает некоторую ординальную позицию субъекта на континууме престижа по отношению к совокупности других субъектов. В некоторых случаях такие переменные статуса имеют специфическую метрику (например, размер денежного вознаграждения), но чаще всего подразумевают какое-либо ранжирование. Конкретные ситуации А и В могут, однако, отличаться дифферен-цированностью рангов, степенью явной заданности критериев ранжирования, выраженностью конкуренции в борьбе за статус и так далее. При этом перечисленные факторы будут выступать в качестве отдельных измерений данной переменной опыта, оказывающих различное влияние на представителей разных социально-демографических групп.
2) Согласованность экспектаций, связанных с поведением. Можно выделить несколько измерений, связанных с этой общей переменной (безотносительно к специфическому содержанию этих экспектаций): наличие (или отсутствие) различных групп, имеющих несовместимые ожидания по поводу поведения личности; ограниченность ресурсов, делающая невозможным одновременное следование согласованным экспектациям; предсказуемое и контролируемое либо случайное и находящееся вне контроля индивидуального деятеля изменение социальных экспектаций во времени. Примером теорий, связывающих несогласованные или несовместимые социальные экспектаций с социально-демографическими переменными и поведением является теория "рассогласованности статусов".
108
Мера наличия у деятелей существенных ресурсов. Вне зависимости от природы и сути адресованных индивидам экспектаций, статус или уважение получают те, кто способны им соответствовать. Какая бы "фоновая" переменная не служила источником этих ресурсов (биологическая наследственность, обучение, интериориза- ция форм поведения из микросоциального контекста или какая-то другая), те деятели, которые не обладают этими ресурсами, окажутся в ситуации дефицитарности. Однако (и здесь проявляется ограниченность упрощенной схемы "происхождение - успешность в деятельности") собственное восприятие субъектом своих ресурсов будет взаимодействовать с реальным уровнем успешности, влияя на уровень притязаний, "Я-концепцию", которые, в свою очередь, будут оказывать обратное воздействие на успешность деятельности.
Мера, в которой субъект подвергался трудностям, конфликтам, угрозам. Очевидно, что независимо от конкретных особенностей изучаемой ситуации, некоторые группы испытали меньше угрожающих или конфликтных переживаний, чем другие - включая открытые конфликты, абсолютную либо относительную депривацию и так далее. Например, некоторые возрастные когорты испытали последствия трудностей военного времени или экологического кризиса, которых не испытали другие. Такие комулятивные переживания (а не сам по себе биологический возраст) будут проявляться в установках и поведении, особенно в ситуациях, имеющих смысловую соотнесенность с этими переживаниями.
Кроме описанных, Х.Блейлок выделяет и другие потенциально релевантные измерения опыта, связанные с биографическими переменными и влияющие на установки или поведение: гомогенность поведения индивидов, имеющих общую групповую принадлежность; степень зависимости статуса от успешности; "проницаемость" референтных групп; степень совместимости ожиданий с опытом социализации и раннего научения; возможность "ухода" из группы (иногда можно сменить этническую группу и практически никогда - расовую идентичность); количество предоставляемой субъекту эмоциональной поддержки; наличие драматических или плавных изменений в "истории жизни".
Разумеется, этот список неполон, однако он очень важен для очерчивания сферы переменных опыта, соответствующих многообразию ситуаций и типов поведения, которые представляют интерес для социолога. Спецификация этих переменных опытаj во вспомогательной теории измерения позволяет осуществить по крайней мере приближенное ранжирование вдоль "опытного" континуума субъектов, имеющих различные значения релевантных биографических переменных (даже в том случае, когда исследователь лишен возможности прямо или косвенно измерить переменную опыта).
Этот подход, однако, сталкивается с трудностями в тех случаях, когда существует много релевантных измерений опыта, часть которых взаимодействует друг с другом, и сравнительно малое число категорий биографической переменной. Х.Блейлок приводит следующий пример: если чернокожие американцы одновременно испыты-
109
вают ситуации, в которых не имеют достаточного доступа к ресурсам, в которых социальные ожидания рассогласованы, в которых они постоянно получают низкий статус, и если они имеют в среднем значительно больший "трудный" опыт, то на уровне интерпретации становится крайне трудно решить, какой из этих взаимодействующих механизмов оказывает первичное влияние на их установки и поведение. В этой ситуации исследователь должен найти подгруппу, "нагруженную" лишь по некоторым измерениям опыта (и оценить чистый эффект остальных). Полезным приемом является и декомпозиция укрупненных номинальных категорий: скажем, переход от пяти-шести объединенных категорий "рода занятий" х детализированному списку 50-60 профессий, которые можно будет дифференцировать по нескольким измерениям опыта согласно усредненным значениям соответствующих "опытов" их представителей.
Таким образом, даже если прямое измерение переменных опыта оказывается практически невозможным, они могут и должны быть сохранены в теоретической гипотезе и интерпретации при соблюдении некоторых условий: достаточно большого числа категорий биографической переменной (относительно гомогенных по релевантным измерениям опыта); возможности дать усредненную оценку опыта каждой категории (если не на индивидуальном, то на групповом уровне); наличия достаточно четких теоретических гипотез, соотносящих выделенные переменные опыта с общими типами поведения или установок. Следовательно, эта стратегия улучшения социологического измерения требует и хороших субстантивных теорий, и эксплицитных вспомогательных теорий измерения, связывающих переменные опыта с биографическими и поведенческими измеряемыми переменными.
3. Некоторые аспекты сравнимости измерений
Поскольку процесс измерения предполагает создание операционального языка, делающего объекты измерения сравнимыми в терминах этого языка, утверждения о несопоставимости измерений для различных групп, культур или ситуаций являются весьма веским аргументом, часто используемым критиками эмпирической социологии (см., например: [183]). Однако эти утверждения часто бывают столь общими и неспецифицированными, что исключают возможность конструктивного диалога. Примером такого рода утверждений может служить обобщенная аксиома "семантической неэквивалентности" стимулов или поведения в разных культурах или среди представителей различных субкультурных групп [183 ]. Однако, как бы ни формулировались такие соображения, они не лишены оснований и требуют некоторой общей стратегии в решении проблем сопоставимости.
Если в "соседней" психологии вопросы сравнимости измерений стали систематически разрабатываться еще в 40-е - 50-е годы (в дифференциальной психологии, теории тестов, экспериментальной
психосемантике), то в социологии эта проблема стала предметом специальных исследований к концу 60-х - началу 70-х годов (например, в работах Г.Костнера, Р.Хаузера и А.Гольдберга и др., проводившихся преимущественно в рамках многоиндикаторного подхода, рассмотренного в предыдущей главе).
Здесь мы затронем лишь проблему сравнимости измерений, хотя утверждения о несопоставимости часто относятся либо к неэквивалентности "личностных смыслов", т.е. коннотативных компонентов значения, либо к несопоставимости, возникающей в процессе обобщения в результате действия неконтролируемых переменных. Последние два типа аргументов обычно вполне обоснованны и служат предметом анализа в психосемантике, изучающей индивидуальные системы значений (см., например: [58]), и в работах, посвященных планированию квазиэкспериментальных исследований [31 ]. Принято считать, что проблема сравнимости измерений возникает в ситуации, когда измерение носит косвенный, непрямой характер (т.е. отношение между теоретическим концептом и наблюдаемой переменной явно опосредовано теоретически специфицированным эмпирическим конструктом), а вспомогательные теории измерения могут варьировать в зависимости от условий или контекста. Вопрос становится еще сложнее в случаях, когда вспомогательная теория измерения включает те же переменные, которые, уже в качестве теоре-тических концептов, включены в основную содержательную теорию, что приводит к смешиванию теоретических и "измерительных" проблем. Например, какой-либо из биографических факторов (пол или социально-экономический статус) может приводить к систематической ошибке измерения и в то же самое время быть причиной или следствием тех переменных, которые исследователь стремится измерить. В этом случае, чем менее отчетливо определена вспомогательная теория измерения и чем сложнее основная теория, тем невозможнее атрибутировать различия, возникающие при сравнении измерений (между условиями, временными периодами или индивидами). Т.е. однозначно приписать эти различия к истинным содержательным или вызванным артефактами измерениям.
Проблема сравнимости измерений имеет целый ряд аспектов: использование общих индикаторов в многоиндикаторном анализе и его ограничения [89. Р.76-85; 200]; нелинейные отношения между конструктом и индикатором, вариабельность коэффициентов в структурных уравнениях (как в примере с "беловоротничковой" преступностью на с. 101) и другие. Мы ограничимся рассмотрением двух примеров, не требующих введения громоздкого формального аппарата.
Первый из этих примеров связан с нелинейностью отношения между теоретически определяемой переменной и индикатором. Рассмотрим пример приборного измерения, приводимый в работе [30 ]
110
111
и обсуждаемый авторами в том же, по сути, контексте роли содержательных теоретических соображений в непрямом социологическом измерении. Пусть теоретическая переменная - это уровень удовлетворенности трудом для некоторой совокупности, зависящая (при контроле многочисленных прочих факторов) от каждого приращения зарплаты (измеряемого, например, в рублях). Эта зависимость, как и связь "морального" и "физического" богатства у Я.Бернулли (см.: [99]), вероятно, будет подвержена насыщению, так что функциональная форма отношения между удовлетворенностью и доходом будет выглядеть как на рис. 11.
Допустим, что в теоретической модели исследования предполагается наличие связи между удовлетворенностью трудом (или, уже, материальным вознаграждением за труд), т.е. внутренним состоянием, и каким-то поведением P. Последнее может относиться к качеству труда, досуговой активности или чему-либо еще. В отсутствие удовлетворительного способа измерения субъективного состояния У исследователь может обратиться к причинному индикатору - зарплате, т.е. прибегнуть к приборному измерению. Если поведение P и удовлетворенность У связаны линейно, то, согласно модели насыщения, связь между индикатором У и переменной P будет нелинейной (кривая, изображенная на рис.11, может в конкретном случае оказаться логарифмической функцией, сегментом параболы или степенной функцией с положительным показателем, меньшим 1).
Мысленный эксперимент, предложенный Х.Блейлоком и близкий к экспериментальным схемам психофизики, заключается в следующем предположении. Пусть для условия Л (относящегося ко времени, характеристикам популяции или к ситуации) основное число случаев попадет в левую часть кривой, а для аналогичного условия В - в правую, верхнюю часть. Тогда коэффициент уравнения, линейно связывающего P и Yl , для условия А окажется " круче", больше, чем для условия В. Конечно, если мы имеем прямую меру для У и эксплицитную вспомогательную теорию измерения, предсказывающую данный эффект, это предположение легко проверяемо. Но если удовлетворенность У прямо не измеряется, то нельзя будет отличить предсказания модели, изображенной на рис. 11, от модели, где отношения У и У - линейны, а нелинейна связь между У (удовлетворенностью) и P (поведением). В этом случае нужны несколько показателей для У — У1 , У2 и т.д., а также явные теоретические предсказания о форме связи каждого Уj с У. Этого рода проблемы часто оказываются вне поля зрения исследователя, использующего факторный анализ или путевой анализ и некритически принимающего допущения о линейности функциональных связей между "скрытыми" конструктами и индикаторами без проверки пределов его применимости к конкретной ситуации38 . Х.Блейлок особенно предостерегает от " слепого" использования программ типа LISREL, 112
так как ошибки спецификации переменных будут распространяться по всей каузальной системе J89. Р.87-88 ]. По его мнению, особенно типичны нелинейные отношения между социально-демографическими, и вообще биографическими переменными, и переменными "внутренних состояний" (например.между формальной длительностью образования, измеренной как число лет обучения, и квалификацией).
Второй пример относится к проблемам сравнимости, возникающим из-за различий в сложности ситуаций, а именно - к последствиям дифференциальной сложности в случае использования эффект-индикаторов для косвенного измерения в ситуации мультикаузаль-ности.
При использовании эффект-индикаторов, часто принимается допущение, что, кроме небольших случайных возмущений, единственной причиной эффект-индикатора является неизмеряемая переменная, представляющая в данном случае интерес для теоретической модели. Однако индикатор (обозначим его как X. ) может подвергаться воздействию не только переменной X, которую предполагается измерить, но и других переменных, например V или P . Кроме того, эти переменные V и P сами могут быть связаны с переменной X в некоторых ситуациях. Тогда обоснованность использования индикатора X. или совокупности индикаторов будет варьировать от ситуации к ситуации. Уже в статье 1968 г. [82] Х.Блейлок использует иллюстративный пример с измерением расовой дискриминации, к которому он неоднократно обращается и в более поздних работах. Пусть, скажем, некоторая мера неравенства, типа различия в доходе, служит для измерения расовой дискриминации. В некоторой ситуации А вполне обоснованным кажется предположение, что единственной причиной неравенства X , помимо случайных возмущений, является дискриминация со стороны работодателя. Однако предположим, что в более сложной ситуации В, помимо дискриминации со стороны работодателя, может оказаться существенным влияние различий в уровне образования, способностей или опыта работы (обозначим соответственно как F, P, и У). Если эти переменные будут измерены, то существует возможность получения чистого эффекта X (см. рис.12). Однако ситуации А и В, в силу своей простоты, включают лишь очень ограниченное число факторов. Более сложная ситуация потребует разработки более сложной модели. В некоторых случаях, если исследование охватывает достаточно большой промежуток времени, разумно предположить, что показатель различий в образовании зависит не только от "образовательной" дискриминации как ограничения доступа к равным возможностям обучения, но и от поселенческой сегрегации. Если предположить, что поселенческая сегрегация, "накопленная" к моменту t, влияет и на доступность тех или иных профессий (помимо прямой профессиональной дискриминации), то можно ли сравнивать показатели неравенства в доходах (Х1 ) или в образовании в этой ситуации с " теми же" показателями в более простых ситуациях А и В.
Важным преимуществом причинного анализа и построения диаграмм здесь является возможность визуализировать модель измере-
8 И.Ф.Девятко 113
Профессиональная
дискриминация
ПР
Неизмеряемые
переменные
дискриминации
Измеряемые
показатели
Профессиональное
неравенство
Различия
в голосовании
на выборах
ния и сделать очевидной границу, когда неизвестных становится "слишком много" и получить единственное решение невозможно, т.е. возникает необходимость в априорных предположениях (например, различия в уровне образования зависят только от дискриминации в сфере образования). Последнее обстоятельство очень существенно для повышения культуры не только измерения, но и теоретизирования: ведь в ситуации, когда отсутствуют ограничения на сложность теоретической модели и для каждого "случая" вводятся новые объясняющие факторы, всегда можно, образно говоря, "объяснить 100% дисперсии". "Можно показать, что при допущении возможности, когда все влияет на все с неопределенными параметрами, будет существовать бесконечное число наборов оценок параметров, абсолютно согласованных с одним и тем же множеством данных" [86. Р.282]39. При этом теоретики могут до бесконечности спорить, чей набор объясняющих переменных "лучше" без всяких шансов разрешить этот спор эмпирическими средствами.
Анализ влияния дифференциальной сложности ситуаций и соответствующих им теоретических моделей на сравнимость показателей позволяет затронуть еще одну существенную проблему - проблему валидности. Как мы показали во второй главе нашей книги, разработка моделей измерения привела к пониманию ограниченности, присущей концепции валидности и традиционным подходам к валидизации, которые в конце 50-х - начале 60-х годов активно
114
*
Рис. 13. Схема связи переменных дискриминации с измеряемыми показателями .
* В данной модели опущены многие переменные блока " Поведение меньшинства" -агрессия, избегание контактов с доминирующим большинством и т.п., рассматриваемые Х.Блейлоком.
заимствовались социологами из психометрики. В тех ситуациях, когда невозможно связать концепты и индикаторы по принципу "один к одному", но наличие нескольких показателей для каждой ненаблюдаемой переменной делает измерение возможным, понятие "валидности" может вводить в заблуждение, подталкивая исследователя к поиску несуществующего "идеального" валидного показателя. Правильным путем здесь чаще всего будет разработка вспомогательной теории, связывающей несколько неизмеряемых переменных с несколькими индикаторами (о чем и шла речь в предыдущей главе). Вернувшись к примеру с дискриминацией, мы можем заметить, что понятие дискриминирующего поведения довольно далеко отстоит от обычно используемых мер дискриминации, относящихся к физической сегрегации либо к какого-то рода неравенству. В самой простой ситуации различия в социально-профессиональной структуре доминирующего большинства и меньшинства могут быть использованы как показатель профессиональной дискриминации, различия в образовании - как показатель дискриминации в получении образования, а поселенческая сегрегация - как индикатор поселенческой изоляции40. Однако в более сложной и близкой к реальности ситу-
115
ации любые меры неравенства являются результатом не только дискриминирующего поведения большинства, но и поведения самого меньшинства, что должно быть отражено во вспомогательной теории измерения.
Кроме того, переменные-индикаторы могут быть функциями не только тех переменных дискриминации, которые включены в основную теорию и являются основной целью измерения. Приведем одну из возможных моделей примера с дискриминацией, рассматриваемую Х.Блейлоком в статье [86. Р.296] (см. рис. 13).
Вполне очевидно, что традиционная концепция валидности в ситуации, сходной с изображенной на рис. 13, имеет весьма ограниченное применение. Очевидны и последствия для сравнимости показателей. Например, "экономическое неравенство" в ситуации, изображенной на рис. 13, будет зависеть от всех неизмеряемых переменных и, в свою очередь, влиять по крайней мере на поселенческую и социальную изоляцию. Следовательно, нет никаких оснований считать этот индикатор эквивалентным "экономическому неравенству" в ситуации взаимооднозначного соответствия.
Глава четвертая
НОВЫЕ ПРИЛОЖЕНИЯ И ПЕРСПЕКТИВЫ МОДЕЛИРУЮЩЕГО ПОДХОДА