Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
МЯГКОВ А.И. - Статистические стратегии сенситив...doc
Скачиваний:
3
Добавлен:
13.08.2019
Размер:
172.03 Кб
Скачать

А.И. МЯГКОВ

СТАТИСТИЧЕСКИЕ СТРАТЕГИИ СЕНСИТИВНЫХ ИЗМЕРЕНИЙ

МЯГКОВ Александр Юрьевич - кандидат философских наук, доцент, заведующий кафедрой социологии Ивановского государственного энергетического университета.

Постановка проблемы

В последние годы заметно возросла степень остроты и деликатности проблем, предлагаемых респондентам для обсуждения в опросных исследованиях. Так называемые «сенситивные» вопросы часто приходится формулировать при изучении образа жизни и различных аспектов деятельности современных политических элит, оценке масштабов распространения криминального бизнеса, коррупции и наркомании, в исследованиях различных форм контрнормативного и нравственно осуждаемого поведения. Но даже в обычных опросах общественного мнения, традиционно ориентированных на изучение того, «что люди говорят, делают и думают в их повседневной жизни» [1, p.9], мы редко можем обойтись без постановки вопросов, затрагивающих эмоциональную сферу опрашиваемых.

В одном из наших недавних исследований, посвященных анализу факторов, влияющих на уровень искренности ответов респондентов1, мы попытались выяснить, как люди воспринимают и оценивают различные по тематическому содержанию вопросы социологических анкет. В результате оказалось, что даже вопросы социально-демографического блока, обычно считающиеся эмоционально–нейтральными, воспринимаются многими респондентами как индивидуально острые и вызывают чувство неловкости и смущения. Так, более четверти опрошенных ответили, что неприятные ощущения связаны у них с вопросами об уровне образования (26,3%) и состоянии в браке (28,6%). Около трети респондентов «смущающими» назвали вопросы о возрасте и роде профессиональной деятельности (33,0% и 31,3%, соответственно). Крайне деликатным для того, чтобы их можно было обсуждать с интервьюером, участники опроса считают такие темы, как употребление алкоголя (57,3% всех ответов) и наркотиков (57,6%), размер и источники доходов (67,7%), денежные накопления (73,2%), супружескую измену (77,6%) и сексуальные отношения (78,5%).

Поскольку, как показывают специальные исследования [2, p. 50, 69-70], имеется прямая связь между остротой восприятия темы и уровнем искренности ответов респондентов, то есть все основания признать правомерными утверждения ряда ученых о том, что любой, даже самый «безобидный» вопрос может стать источником неконтролируемых смещений в итоговых данных [3,4]. При проведении опросов по «сенситивной» проблематике вероятность появления «ошибок сообщения», связанных с необеспеченной анонимностью, многократно возрастает.

В связи с этим многие специалисты сегодня говорят о настоятельной необходимости разработки и применения таких методов, которые позволили бы, с одной стороны, надежно защитить респондентов от угрозы разглашения сообщаемой ими в ходе опросов конфиденциальной (и небезопасной для них самих) информации, а с другой, снизить риск получения недостоверных сведений [5,6,7]. В отечественной методологической литературе эта проблема, несмотря на ее очевидную актуальность, почти не обсуждалась, в то время как в западной она имеет уже свою историю.

Краткий экскурс в историю проблемы

Начиная с 1940-50-х годов, поиск средств стимулирования субъективной анонимности в западной социологии осуществлялся по четырем основным направлениям [8]. 1). Экспериментирование с вопросной техникой (с преамбулой, формой и формулировкой вопроса), предусматривающее при обсуждении «трудных» тем замену прямых вопросов косвенными, открытых - закрытыми, личных – безличными, ситуативных – проективными и т.д. Предполагалось, в частности, что применение приемов проекции «сенситивного» поведения на «других (всех) людей» и его рутинизации, т.е. подчеркивания «типичности», «нормальности» тех или иных социально неодобряемых поступков, смягчает остроту предъявляемых вопросов и обеспечивает психологическое «самораскрытие» респондентов. 2). Выяснение роли устных и письменных напоминаний опрашиваемым об анонимности проводимого исследования. 3). Поиск наиболее конфиденциального метода, наилучшим образом обеспечивающего получение искренних ответов респондентов. 4). Разработка специальных невопросных техник, способствующих установлению более доверительных отношений между участниками коммуникативного процесса (респондентом и интервьюером) посредством ряда процедурных инноваций.

Однако последующие методические исследования показали, что манипулирование формой и формулировкой вопроса далеко не всегда способствует большей искренности и открытости опрашиваемых, так как не гарантирует им полной уверенности в конфиденциальности их ответов. Намеки на типичность и обыденность социально несанкционированных форм поведения (типа «все люди воруют…»), легко разгадываются респондентами и не производят ожидаемого эффекта.

Не оправдались надежды социологов и на организационно-технические средства обеспечения анонимности (в форме специальных заверений в неразглашении ответов), когда-то казавшиеся вполне надежными и эффективными. Декларации об анонимности, как выяснилось в ряде экспериментальных исследований, не только не стимулируют повышения уровня искренности, но и ведут иногда к заметному ухудшению результата [9, p.269]. Они производят эффект, повышающий чувствительность респондентов, и предупреждают их о необходимости быть осторожными в своих ответах на вопросы исследователя.

Что касается проблемы наиболее адекватного метода для сбора «сенситивных» данных, то к середине 80-х годов социологи, ранее с переменным успехом отдававшие пальму первенства то одним, то другим разновидностям опроса, окончательно остановили свой выбор на персональном интервью, «королевский» статус которого сегодня почти ни у кого уже не вызывает сомнений.

Осознание ограниченности арсенала и недостаточной эффективности традиционных методов обеспечения субъективной анонимности послужило импульсом для активизации дальнейших усилий по разработке новых, более изощренных технических приемов и процедур, способствующих стимулированию у респондентов ощущения гарантированности того, что их ответы на острые, лично значимые вопросы действительно останутся неизвестными даже интервьюеру, проводящему опрос «с глазу на глаз».

Модель с. Уорнера и ее модификации

Одним из методов преодоления трудностей, возникающих в процессе убеждения респондентов в конфиденциальности опроса и уменьшения числа ошибок, вызываемых неправдивыми ответами, стал RRT-метод («randomized response technique»), впервые предложенный американским статистиком и социологом С. Уорнером в 1965 г.

В нашей стране данный метод и особенно его поздние версии почти неизвестны широкому кругу исследователей. В отечественной литературе имеются лишь единичные и весьма фрагментарные их описания [10-13]. Методологическая экспертиза RRT у нас не проводилась, степень эффективности не тестировалась. Возможно, поэтому в нашей исследовательской практике уорнеровский метод никогда не применялся.

Процедура сбора и последующего анализа данных в рамках этой опросной стратегии заключается в следующем. Респондентам предлагается ответить на один из двух взаимоисключающих вопросов-суждений (типа: «Я принадлежу к группе «А»; «Я не принадлежу к группе «А»), имеющих прямое отношение к сенситивной теме. Испытуемый, используя заданный способ рандомизации, (например, вращая волчок, поверхность которого разбита на два сектора), случайным образом выбирает тот вопрос, на который ему предстоит дать ответ, не сообщая о выпавшем жребии интервьюеру. При этом он должен ответить либо положительно, либо отрицательно («да» – «нет»), иные ответы, раскрывающие содержание вопроса, исключаются. Интервьюер, в свою очередь, лишь бесстрастно регистрирует формальный ответ, не подозревая, к какому из двух суждений он относится. Зная вероятность выбора респондентом того или иного вопроса, объем выборки и общее число ответов «да», можно оценить истинную долю лиц, принадлежащих к группе «А» [14]. Формула, отвечающая модели С. Уорнера, имеет следующий вид:

(1)

где - оценка доли лиц, принадлежащих к интересующей нас группе;

P - вероятность выпадения «сенситивного» вопроса;

N1 - общее количество ответов «да», полученных в ходе опроса;

N - число опрошенных.

Данный метод действительно способствует повышению анонимности благодаря рандомизации вопросов (и ответов) и формализации, обезличиванию опросного общения. Однако в своей изначальной версии он позволял получать информацию лишь по одному единственному деликатному вопросу, имеющему к тому же очень простую (дихотомическую) логическую структуру.

В 1967 году эта уорнеровская модель была существенно модифицирована американскими исследователями А. Абуль-Эла, Б. Гринбергом и Д. Горвицем. Они разработали усложненный вариант RRT, который давал возможность собирать сведения одновременно по нескольким (трем и более) вопросам, как минимум один из которых имел несенситивную природу [15].

В 1969 году Б. Гринберг с соавторами предложили неизвестную прежде технику «несвязанных вопросов» [16]. Согласно этой версии RRT, респондентам предлагалось ответить на один из двух вопросов: либо на сенситивный, либо на нейтральный (например: «Вы родились в апреле?»), в зависимости от выпавшего случая. Зная распределение нейтрального признака в генеральной совокупности, по формуле (2) можно найти статистическую оценку выборочного значения «сенситивной» характеристики [17, p.403]:

, (2)

где - оценочное значение доли лиц, имеющих «сенситивный» признак s;

Р - вероятность выпадения респонденту «сенситивного» вопроса;

1–Р - вероятность выпадения нейтрального вопроса с признаком n;

πn - доля лиц, имеющих признак n;

λ - общая доля ответов «да» на оба вопроса.

При использовании оценочных данных о доле респондентов с нейтральной характеристикой, полученных в прежних исследованиях, отклонение оценки πs может быть рассчитано следующим образом [17, p.403]:

V( ) (3)

где n – объем выборки в эталонном исследовании.

Важное преимущество техники, основанной на предъявлении «независимого» вопроса, не связанного по смыслу c основным, состояло в ее мягкости и психологичности. Она обеспечивала больше возможностей для установления доверительных отношений между респондентами и интервьюером. Испытуемые, как отмечают специалисты, более склонны давать честные ответы в тех случаях, когда хотя бы одно из предлагаемых суждений не является сенситивным. Респондент в этих условиях может легко избежать «самооговора», поскольку интервьюер не знает, к какому из двух вопросов относится полученный ответ [17, p.402].

Кроме того, данная модель, в отличие от предыдущих, была специально предназначена для получения количественных данных. В исследовании, проведенном среди жительниц штата Северная Каролина, Б. Гринберг с соавторами изучали проблему абортов. Респондентам задавались два вопроса: «Сколько абортов Вы вынуждены были сделать за свою жизнь?» (сенситивный) и «Как Вы считаете, сколько детей должна иметь работающая женщина?» (эмоционально-нейтральный).

В результате исследования авторы пришли к выводу, что вероятность выпадения сенситивного признака должна как можно больше отличаться от 0,5, чтобы не вызывать подозрений у испытуемых и не провоцировать неискренних ответов. При этом наилучшие результаты могут быть достигнуты при p1, лежащей в интервале от 0,7 до 0,8 и p2 = 1- p1. Но это, в свою очередь, требует отказа от использования прежних средств рандомизации (например, монеты) и замены их новыми.

Вместе с тем гринберговская модель имела один весьма существенный недостаток. Она могла эффективно работать лишь в тех случаях, когда доля людей, обладающих несенситивной характеристикой, известна по критериальным данным или может быть рассчитана на основании прежних исследований.

В 1971 г. Дж. Мурс предложил способ, позволяющий оценить распределение нейтрального признака по результатам параллельного выборочного исследования. Он дополнил технику «несвязанного» вопроса процедурой «расщепления выборки». В результате появилась возможность получить нужную информацию, не вызывая излишней тревоги и опасений у респондентов [18].

Когда доля ответов «да» (или ее статистическая оценка) на «безобидный» вопрос (n) неизвестна, выборка должна быть разделена на две независимые, непересекающиеся подвыборки объемом n1 и n2, где n=n1+n2. В этом случае для каждой из них нужно решить уравнение с двумя неизвестными - s и n:

1 = p1 ·s + (1- p1) · n, (4)

2 = p2 · s + (1- p2) · n.

Решая второе уравнение для n, находим:

n .

Подставляя n в первое уравнение, получаем:

1 = p1 ·s + (2 - p2 ·s) · k , где k = (1- p1) / (1- p2).

Полученное уравнение может быть переписано следующим образом:

1 – k ·2 = p1 ·s - p2 · k ·s.

Решая его для s, находим:

. (5)

Отклонение s можно рассчитать по формуле (6), предложенной Дж. Мурсом [18]:

V( ) = . (6)

Р. Фолсом, Б. Гринберг, Д. Горвиц и Дж. Абернати в 1973 г. еще более усовершенствовали уорнеровский метод, разработав новую процедуру получения (оценки) данных о распределении сенситивной характеристики. Она опиралась на предложенную Дж. Мурсом идею «расщепленной» выборки, принцип использования рандомизирующих устройств и формулирования двух нейтральных и одного сенситивного вопроса. При этом один из «несвязанных» вопросов может быть выбран респондентами случайным путем, а второй предъявляется каждому из них в обязательном порядке. В зависимости от подвыборки содержание последнего меняется. Процедура предъявления вопросов представлена в таблице 1.

После проведения опроса доли лиц, обладающих сенситивным признаком, для каждой из подвыборок в отдельности рассчитываются по формуле (7), а затем усредняются.

i = 1,2, (7)

где - оценочная доля лиц, обладающих сенситивной характеристикой s;

- вероятность получения положительного ответа на случайно выбранный (рандомизированный) вопрос в соответствующей подвыборке;

- вероятность получения положительного ответа на обязательный (директивный) вопрос в соответствующей подвыборке;

Р - вероятность ответа на сенситивный вопрос, выбранный с помощью рандомизирующего устройства.

В 1975 г. американские маркетологи Дж. Рейнмут и М. Герц предложили «двухфазную» модель RRT, которая, с одной стороны, базировалась на технике «несвязанных» вопросов, а с другой, предполагала использование двух разных, независимых выборок. Этот вариант, по замыслу авторов, был предназначен для сбора сенситивных сведений как количественного, так и качественного характера и учитывал, таким образом, вариативность решаемых в исследованиях задач [17].

В предпринятом эксперименте Дж. Рейнмут и М. Герц изучали проблему рецидивного «шоплифтинга» (мелкого воровства) среди покупателей в одном из крупнейших супермаркетов Гонолулу. При этом их интересовал не только сам факт кражи тем или иным респондентом товаров из магазина, но и частота (и регулярность) совершения подобных действий. В исследовании использовались две случайные непересекающиеся выборки покупателей численностью 184 чел. и 158 чел. ( n=342 ), каждая из которых, в свою очередь, была распределена, в соответствии с рекомендацией Б. Гринберга и его коллег, на две части в пропорции 3:1. Респондентам, составившим первую выборку, предлагалось ответить на один из двух вопросов: 1). «Совершали ли Вы кражи из торгового центра Ала Моана в течение последних 12 месяцев?» (сенситивный) и 2). «Делали ли Вы покупки в Ала Моана за последнюю неделю?» (нейтральный). В выборке, предназначенной для изучения количественных параметров «шоплифтинга», нейтральный вопрос касался числа произведенных за месяц покупок, а сенситивный звучал следующим образом: «Сколько раз Вы совершали кражи из магазина за последние 12 месяцев?».

В качестве рандомизатора использовался набор из 100 пластиковых шаров черного и белого цвета (в численном соотношении 75:25), сложенных в простую спортивную сумку. В ходе исследования респондентов из первой подвыборки просили ответить на сенситивный вопрос, если жребий приходился на черный шар. Во второй подвыборке закрепление цветов за вопросами менялось. В результате в обеих выборках вероятности выпадения деликатного вопроса составляли, соответственно, p1=0,75 и p2=0,25.

После сбора данных оценочная доля положительных ответов на качественный сенситивный вопрос ( ) определялась по формуле (5). Для количественного признака ( ) искомое значение рассчитывалось иначе [17, p.404] :

= , (8)

где - среднее оценочное значение ответов о числе краж из магазина;

и - наблюдаемые средневзвешенные значения ответов (по сумме двух вопросов) в разных подвыборках (n1 и n2);

p1 и p2 – вероятности выпадения сенситивных вопросов в разных подвыборках.

Расчеты, произведенные Дж. Рейнмутом и М. Герцем, показали, что около 20% всех опрошенных имели опыт «шоплифтинга». В среднем на одного покупателя супермаркета, как выяснилось, приходится по 1,7 кражи в год, а на каждого признавшегося в их совершении – почти по 8 подобных преступлений [17, p.405-406]. Кроме того, по сообщению авторов, лишь трое респондентов в ходе исследования отказались ответить на сенситивные вопросы интервьюеров. «Техника рандомизированного ответа, - пишут Дж. Рейнмунт и М. Герц, - по видимому, элиминирует смещения, связанные с неответами, вызываемыми чувствительностью субъектов» [17, p.406].

RRT: оценка эффективности

Техника рандомизации, как уже отмечалось, была специально предназначена для получения максимально правдивой информации в тех случаях, когда бессильны методы изучения общественного мнения, основанные на предъявлении прямых вопросов о сенситивном поведении. Первые исследования по апробации RRT и ее сравнению с обычными опросными процедурами дали весьма обнадеживающие результаты. Валидационный эксперимент, проведенный С. Здепом и И. Роудес, показал, что при использовании данного метода респонденты намного чаще признавали факты намеренно жестокого обращения с детьми, чем тогда, когда опрос проводился в режиме самозаполнения. В случае применения RRT удельный вес утвердительных ответов на деликатный вопрос составил 15%, в то время как в анкетной версии исследования – лишь 3-4% в зависимости от того, передавался ли вопросник лично в руки интервьюеру или высылался по почте в адрес исследовательской организации. В этой связи авторы отмечают, что результаты полученные при анкетировании, не отличались значимо от нуля, а следовательно, если бы данный вопрос, несущий на себе печать социальной стигматизации, задавался респондентам напрямую, «глаза в глаза», то ни один из испытуемых, скорее всего, не ответил бы на него утвердительно.

Кроме того, как считают С. Здеп и И. Роудес, использование RRT способствует усилению кооперативных установок опрашиваемых. Если при самозаполнении 25,2% респондентов не вернули свои анкеты и 12,1% отказались от участия в исследовании, то в рандомизированной версии опроса таких случаев было всего 1,3% [20, p.535].

Результаты другого, более позднего эксперимента этих авторов, организованного совместно с Р. Шварцем и М. Килкенни [21], в целом подтвердили их прежний вывод о том, что техника рандомизации превосходит традиционные опросные методы с точки зрения достоверности получаемых ответов. В качестве сенситивного в этом исследовании использовался вопрос об употреблении марихуаны. Сравнение данных, полученных посредством RRT и персонального интервью, проводившегося на параллельной выборке приблизительно в одно и то же время, свидетельствовало в пользу метода рандомизации. Однако на этот раз в целом по массиву различия в ответах оказались менее внушительными, чем в предыдущем исследовании (табл.2).

Вместе с тем результаты эксперимента показали, что RRT неодинаково воздействует на разные социальные группы населения. Данный метод позволяет достигать большего эффекта при проведении опросов в женских аудиториях, а также среди респондентов среднего, старшего и пожилого возраста. Мужчины и особенно представители молодежных групп менее чувствительны к условиям «рандомизирующего» опроса по данной проблематике.

На основе накопленного опыта исследователями была разработана целая серия рекомендаций, способствующих стандартизированному применению RRT. В работах ряда авторов было показано, что данный метод обеспечивает надежные результаты, если соблюдаются следующие параметры стандартизации.

Во-первых, при использовании модели с «несвязанными» вопросами выборка n должна быть разделена на две независимые непересекающиеся подвыборки, находящиеся в численном соотношении n1/n2=p1/p2. В этом случае, согласно данным исследований Б. Гринберга и его соавторов, дисперсии оценок и минимизируются [16].

Во-вторых, при конструировании «безобидного» вопроса важно, чтобы распределение ответов на него было близко к тому, которое ожидается по сенситивному вопросу. Если средние значения и (или доли s и n) варьируют в очень широком диапазоне, то это может вызвать подозрение и тревогу у респондентов, что противоречит изначальному методическому замыслу. Настороженность может возникнуть и в том случае, когда сильно различаются дисперсии ответов на оба вопроса [17, p. 404].

В-третьих, Т. Даулинг и Р. Шахтман показали, что модель с независимыми суждениями работает лучше, когда вероятности выпадения сенситивного и/или несенситивного вопроса превышают 1/3. При этом главное условие состоит в том, чтобы p1 и p2 не были эквивалентны [22].

В-четвертых, по мнению С. Здепа и И. Роудес, RRT достигает большей эффективности, если нейтральный вопрос задается относительно социально одобряемых форм поведения. Суждения, вызывающие позитивные эмоции, способствуют повышению кооперации; они помогают респондентам преодолеть стигматизацию, связанную с утвердительными ответами на вопрос, выбираемый с помощью рандомизирующего устройства [20, p.533].

В-пятых, как показали многочисленные претесты, успешность метода в значительной степени зависит от его понимания респондентами. Поэтому необходимо заранее ознакомить испытуемых с содержанием тех вопросов, на которые им предстоит отвечать, а также подробно объяснить им смысл и преимущества рандомизации. Метод, отмечают С. Здеп и И. Роудес, будет вызывать тревогу и опасения до тех пор, пока опрашиваемые не удостоверятся, что предлагаемая им «игра» является честной [20, p.533-534].

Если респондент после ознакомления с процедурой все же колеблется или вовсе отказывается от участия в исследовании, интервьюер должен убедить его в отсутствии каких-либо подвохов1.

Вместе с тем в специальной социологической литературе имеются и иные, не столь оптимистичные оценки метода рандомизации. Судя по данным аналитического обзора, представленного Дж. Фоксом и П. Трейси, RRT- метод был успешным лишь в пяти из девяти известных случаев его применения и в одном из четырех тестов на валидность [23, p.17].

Смешанные, неоднозначные результаты были получены, в частности, в исследовании Н. Брэдберна и С. Садмана. С одной стороны, считают авторы, метод хорошо воспринимается участниками исследования, не вызывает отторжения, респонденты демонстрируют высокие субъективные оценки: лишь 5% испытуемых оценили процедуру рандомизированного ответа как глупую, бесполезную или вызывающую смущение, но 92,2% опрошенных высказали уверенность в том, что она действительно гарантирует конфиденциальность их ответов [2, p.11-12].

Кроме того, по числу завершенных опросов (70,0%) RRT оказался на уровне персонального интервью (69,8%), превзошел анкетирование (64,1%), но заметно уступил телефонному интервью (81,1%) [2, p.7]. С другой стороны, метод рандомизации продемонстрировал самую низкую надежность при решении задач, связанных с профилактикой социальной лояльности. Около половины всех респондентов, проходивших испытание с применением этой процедуры (48,0%), сказали, что они участвовали в первичных выборах, однако их сообщения не нашли подтверждения по данным официальных источников [2, p.8]. И хотя RRT лучше, чем все другие тестированные методы, стимулировал признания респондентов в социально неодобряемых видах поведения, тем не менее полученный результат вряд ли можно считать убедительным: 35% испытуемых, ранее задерживавшихся дорожной полицией за управление автомобилем в нетрезвом состоянии, не сообщили об этом в опросе с применением данной техники [2, p.8,13,76].

Оценивая метод рандомизации в целом, Н. Брэдберн и С. Садман отмечают, что он обеспечивает «улучшенные, но не идеальные оценки» и не может полностью элиминировать все возникающие ошибки и искажения [2, p.10,76]. Издержки данного метода, заключают авторы эксперимента, «не компенсируются скромным сокращением смещений в ответах» [2, p.13]. На «относительную эффективность» RRT указывают и другие исследователи [22].