- •Курс лекций Назарова в.М. По исэпп
- •Раздел II. Методы исэпп
- •Тема 4. Социологические методы исэпп
- •4.1. Социологические исследования: основные направления и
- •4.2. Структура социологического исследования
- •4.3. Метод социологического наблюдения
- •4.4. Методы анализа документальных источников
- •Типичный кодировальный бланк для проведения структурного контент-анализа
- •4.5. Опросные методы сбора эмпирической информации
- •4.6. Преобразование, обобщение и анализ эмпирических данных
- •Фрагмент линейного распределения
- •4.7. Социометрический метод
- •Литература:
4.6. Преобразование, обобщение и анализ эмпирических данных
Полевой этап исследований, проводимых в рамках так называемой «количественной» социологии, завершается сбором одного или нескольких массивов достаточно больших по численности (от нескольких сотен до нескольких тысяч) первичных документов. В них зафиксированы конкретные значения переменных (ответов на вопросы анкеты, величины единиц счета в бланках контент-анализа и т.д.) каждой единицы наблюдения (респондента, фрагмента канала СМИ при проведении контент-анализа и т. д.), включенной в выборочную совокупность.
Для того чтобы извлечь содержательную информацию из этой эмпирической фактуры, все конкретные значения переменных необходимо представить в обобщенной форме, т. е. провести ее своеобразное «сжатие». Эта процедура называется обработкой эмпирической информации.
Она представляет собой комплекс последовательных операций, в результате которых исследователь получает различные количественные меры значений переменных, с помощью которых можно выявить картину состояния предмета исследования, взаимосвязи и взаимозависимости между переменными и/или их группировками. Выполняются они с помощью компьютерной техники и состоят в следующем.
-
Подготовка эмпирической информации к обработке.
-
Содержательный контроль полноты и правильности первичных документов.
-
Сквозная нумерация всех документов, прошедших содержательный контроль и включенных в обработку.
-
Подготовка электронного макета для введения эмпирической фактуры в память компьютера и перевода ее из физической формы в электронную.
-
Ввод (набивка) всей эмпирической фактуры с полевых документов (анкет, бланков и т.п.) в память компьютера (на жесткие и/или мягкие магнитные диски) и образование файлов данных.
-
Получение линейных распределений частот значений всех переменных, включенных в полевой документ, а также необходимых или заданных таблиц сопряженности между ними.
-
Использование (при возможности) стандартных или специализированных пакетов прикладных компьютерных программ в индивидуальном (диалоговом) режиме для проведения оригинальных математических или статистических преобразований эмпирической информации и представления получаемых результатов в удобной (табличной, графической, диаграммной и т.п.) форме на экране монитора и/или (через принтер) на бумаге.
8. Содержательный анализ выходных форм.
Рассмотрим последовательно содержание каждого из названных этапов.
Подготовка эмпирической информации к обработке начинается уже на стадии разработки формы полевого документа, т. е. на стадии его формализации. С точки зрения последующей компьютерной обработки наиболее важными элементами формализации являются выбор и обоснование типа кодирования, а также графическое оформление полевого документа (анкеты, бланка и т.п.).
Выбор типа кодирования определяется техническими требованиями имеющихся пакетов прикладных компьютерных программ. Наблюдается тенденция преимущественного использования позиционной системы кодирования. Его смысл состоит в том, что все переменные (вопросы анкеты, пункты бланка контент-анализа) кодируются цифрами, начиная с 1 до п — номера последней переменной.
В свою очередь, значения каждой переменной также кодируются цифрами, начиная с 1 до к — номера последнего значения шкалы соответствующей переменной. В реальной анкете это выглядит следующим образом:
1. Давно ли Вы живете в нашем городе? (первая переменная)
-
— всю жизнь 3 — 5 -15 лет (значения первой
-
— больше 15 лет 4 — менее 15 лет переменной)
2. Оцените, пожалуйста, свой жизненный уровень (вторая переменная)
-
— живу очень хорошо 4 — живу плохо (значения
-
— живу хорошо 5 — живу очень плохо второй
-
— живу средне 6 — не могу оценить переменной)
Главное требование, которое необходимо учитывать при проведении процедуры кодирования, — каждому значению шкалы, имеющему самостоятельную содержательную ценность, должно соответствовать собственное — единственное — кодовое обозначение.
Принцип, которым следует руководствоваться, состоит в том, что правила логики высказываний, реализованные в компьютерных программах, позволяют соединять с помощью операций дизъюнкции и конъюнкции любые содержательные понятия, имеющие собственные кодовые обозначения.
(Например, если в анкете факты наличия у респондента телевизора и видеокамеры имеют соответствующие коды, то в ходе содержательного анализа можно легко образовать группу имеющих телевизор или видеокамеру (дизъюнкция), или группу имеющих то и другое одновременно (конъюнкция). Но если в документе наличие TV или VK обозначается одним кодом, то никакие уловки не помогут, если возникнет необходимость изучать, например, исключительно тех, кто имеет только TV).
Основное требование к графике полевого документа с точки зрения кодирования состоит в минимизации возможности появления ошибок при его заполнении. Кодовые обозначения необходимо располагать таким образом, чтобы не возникало никаких сомнений, какому значению шкалы соответствует код.
Содержательный контроль. Цель этой операции — обеспечить содержательную чистоту эмпирической базы исследования, не допустить включения в нее некачественных документов (анкет, бланков и т. п.). Таких, например, в которых отсутствует или не полностью заполнена «паспортичка», подчеркнуты взаимоисключающие или противоречивые значения, нет ответов на большинство вопросов и т. д.
На этом же этапе выполняется операция «закрытия открытых вопросов» анкет. Ее смысл состоит в том, чтобы для открытых или открытой части полузакрытых вопросов разработать закрытые шкалы, включающие в обобщенном виде все встретившиеся содержательные ответы респондентов. Для этого необходимо выписать все ответы по каждому вопросу и разработать к каждому из них соответствующую номинальную шкалу значений, включающую все встретившиеся в массиве.
Сквозная нумерация. Эта операция нужна для того, чтобы, во-первых, знать общий объем эмпирического массива, во-вторых, она нужна для проведения дальнейших операций, таких, например, как контроль правильности набивки. Номер документа фактически играет роль идентификатора. Если он вводится вместе с документом в память компьютера, то при обнаружении ошибок набивки правильные значения можно установить, обратившись к оригиналу.
Компьютерный макет полевого документа (с точки зрения пользователя) представляет собой отображение на экране монитора его формальной структуры. Его форма и правила работы с ним определяются техническими требованиями и возможностями конкретной компьютерной системы. Однако в любом случае компьютерный макет включает перечень всех переменных (вопросов анкеты) полевого документа и кодов всех возможных значений каждой из них или полей для фиксации их конкретных значений.
Разрабатывается компьютерный макет с помощью программы ввода либо самим социологом, хорошо владеющим соответствующими программными средствами, либо инженером-программистом. Помимо своего прямого назначения — обеспечения ввода первичных данных — компьютерный макет выполняет еще чрезвычайно важную функцию: осуществляет некоторые виды контроля правильности ввода и логического контроля содержания первичной информации.
Самый радикальный и надежный способ обеспечения качества исходной информации (который, надо заметить, одновременно и самый трудоемкий и дорогой) — так называемая «набивка в две руки», когда весь массив исходных документов вводится двумя операторами независимо друг от друга, а затем программно производится сравнение идентичности двух полученных таким образом массивов информации. Обнаруженные различия сверяются с оригиналами и устраняются.
Цель предварительного контроля - исключить из обработки и последующего содержательного анализа документы, не удовлетворяющие определенным, задаваемым исследователем критериям качества.
Ввод эмпирической фактуры в память компьютера. Эта операция представляет собой перенос эмпирической фактуры с полевого документа в память компьютера с помощью электронного макета полевого документа. Осуществляется она либо самим социологом (что предпочтительнее, так как он одновременно может контролировать качество заполнения документа и устранять логические неясности и противоречия), либо оператором путем визуального просмотра документов и переноса эмпирической фактуры в электронный макет непосредственно с клавиатуры персонального компьютера. Предполагается, что к моменту выполнения этой операции уже проведены процедуры закрытия открытых вопросов и отбраковки не прошедших контроль документов.
Линейные распределения и таблицы сопряженности. Основная цель любых преобразований эмпирической информации — представить ее в компактном, «сжатом» виде для удобства ее содержательного анализа. Получение линейных распределений частот значений переменных эмпирического массива документов — самый простой и неизбежно обязательный способ решения этой задачи.
Линейное распределение эмпирической информации получается с помощью процедуры счета: подсчитывается количество реально зафиксированных значений всех переменных во всех документах эмпирического массива. Результаты подсчета представляются в абсолютных и относительных величинах. (Например, после проведения всех предварительных операций, рассмотренных выше, на обработку поступили 1000 ед. документа, фрагмент которого показан в табл. 4.1. Линейное распределение частот ответов на вопросы этой анкеты может быть оформлено в табличном виде (см. табл. 4.1).
Таблица 4.1