4.6. Преобразование, обобщение и анализ эмпирических данных

Полевой этап исследований, проводимых в рамках так называемой «количественной» социологии, завершается сбором одного или нескольких массивов достаточно больших по численности (от нескольких сотен до нескольких тысяч) первичных документов. В них зафиксированы конкретные значения переменных (ответов на вопросы анкеты, величины единиц счета в бланках контент-анализа и т.д.) каждой единицы наблюдения (респондента, фрагмента канала СМИ при проведении контент-анализа и т. д.), включенной в выборочную совокупность.

Для того чтобы извлечь содержательную информацию из этой эмпирической фактуры, все конкретные значения переменных необходимо представить в обобщенной форме, т. е. провести ее своеобразное «сжатие». Эта процедура называется обработкой эмпирической информации.

Она представляет собой комплекс последовательных операций, в результате которых исследователь получает различные количественные меры значений переменных, с помощью которых можно выявить картину состояния предмета исследования, взаимосвязи и взаимозависимости между переменными и/или их группировками. Выполняются они с помощью компьютерной техники и состоят в следующем.

Подготовка эмпирической информации к обработке.
Содержательный контроль полноты и правильности первичных документов.
Сквозная нумерация всех документов, прошедших содержательный контроль и включенных в обработку.
Подготовка электронного макета для введения эмпирической фактуры в память компьютера и перевода ее из физической формы в электронную.
Ввод (набивка) всей эмпирической фактуры с полевых документов (анкет, бланков и т.п.) в память компьютера (на жесткие и/или мягкие магнитные диски) и образование файлов данных.
Получение линейных распределений частот значений всех переменных, включенных в полевой документ, а также необходимых или заданных таблиц сопряженности между ними.
Использование (при возможности) стандартных или специализированных пакетов прикладных компьютерных программ в индивидуальном (диалоговом) режиме для проведения оригинальных математических или статистических преобразований эмпирической информации и представления получаемых результатов в удобной (табличной, графической, диаграммной и т.п.) форме на экране монитора и/или (через принтер) на бумаге.

8. Содержательный анализ выходных форм.

Рассмотрим последовательно содержание каждого из названных этапов.

Подготовка эмпирической информации к обработке начинается уже на стадии разработки формы полевого документа, т. е. на стадии его формализации. С точки зрения последующей компьютерной обработки наиболее важными элементами формализации являются выбор и обоснование типа кодирования, а также графическое оформление полевого документа (анкеты, бланка и т.п.).

Выбор типа кодирования определяется техническими требованиями имеющихся пакетов прикладных компьютерных программ. Наблюдается тенденция преимущественного использования позиционной системы кодирования. Его смысл состоит в том, что все переменные (вопросы анкеты, пункты бланка контент-анализа) кодируются цифрами, начиная с 1 до п — номера последней переменной.

В свою очередь, значения каждой переменной также кодируются цифрами, начиная с 1 до к — номера последнего значения шкалы соответствующей переменной. В реальной анкете это выглядит следующим образом:

1. Давно ли Вы живете в нашем городе? (первая переменная)

— всю жизнь 3 — 5 -15 лет (значения первой
— больше 15 лет 4 — менее 15 лет переменной)

2. Оцените, пожалуйста, свой жизненный уровень (вторая переменная)

— живу очень хорошо 4 — живу плохо (значения
— живу хорошо 5 — живу очень плохо второй
— живу средне 6 — не могу оценить переменной)

Главное требование, которое необходимо учитывать при проведении процедуры кодирования, — каждому значению шкалы, имеющему самостоятельную содержательную ценность, должно соответствовать собственное — единственное — кодовое обозначение.

Принцип, которым следует руководствоваться, состоит в том, что правила логики высказываний, реализованные в компьютерных программах, позволяют соединять с помощью операций дизъюнкции и конъюнкции любые содержательные понятия, имеющие собственные кодовые обозначения.

(Например, если в анкете факты наличия у респондента телевизора и видеокамеры имеют соответствующие коды, то в ходе содержательного анализа можно легко образовать группу имеющих телевизор или видеокамеру (дизъюнкция), или группу имеющих то и другое одновременно (конъюнкция). Но если в документе наличие TV или VK обозначается одним кодом, то никакие уловки не помогут, если возникнет необходимость изучать, например, исключительно тех, кто имеет только TV).

Основное требование к графике полевого документа с точки зрения кодирования состоит в минимизации возможности появления ошибок при его заполнении. Кодовые обозначения необходимо располагать таким образом, чтобы не возникало никаких сомнений, какому значению шкалы соответствует код.

Содержательный контроль. Цель этой операции — обеспечить содержательную чистоту эмпирической базы исследования, не допустить включения в нее некачественных документов (анкет, бланков и т. п.). Таких, например, в которых отсутствует или не полностью заполнена «паспортичка», подчеркнуты взаимоисключающие или противоречивые значения, нет ответов на большинство вопросов и т. д.

На этом же этапе выполняется операция «закрытия открытых вопросов» анкет. Ее смысл состоит в том, чтобы для открытых или открытой части полузакрытых вопросов разработать закрытые шкалы, включающие в обобщенном виде все встретившиеся содержательные ответы респондентов. Для этого необходимо выписать все ответы по каждому вопросу и разработать к каждому из них соответствующую номинальную шкалу значений, включающую все встретившиеся в массиве.

Сквозная нумерация. Эта операция нужна для того, чтобы, во-первых, знать общий объем эмпирического массива, во-вторых, она нужна для проведения дальнейших операций, таких, например, как контроль правильности набивки. Номер документа фактически играет роль идентификатора. Если он вводится вместе с документом в память компьютера, то при обнаружении ошибок набивки правильные значения можно установить, обратившись к оригиналу.

Компьютерный макет полевого документа (с точки зрения пользователя) представляет собой отображение на экране монитора его формальной структуры. Его форма и правила работы с ним определяются техническими требованиями и возможностями конкретной компьютерной системы. Однако в любом случае компьютерный макет включает перечень всех переменных (вопросов анкеты) полевого документа и кодов всех возможных значений каждой из них или полей для фиксации их конкретных значений.

Разрабатывается компьютерный макет с помощью программы ввода либо самим социологом, хорошо владеющим соответствующими программными средствами, либо инженером-программистом. Помимо своего прямого назначения — обеспечения ввода первичных данных — компьютерный макет выполняет еще чрезвычайно важную функцию: осуществляет некоторые виды контроля правильности ввода и логического контроля содержания первичной информации.

Самый радикальный и надежный способ обеспечения качества исходной информации (который, надо заметить, одновременно и самый трудоемкий и дорогой) — так называемая «набивка в две руки», когда весь массив исходных документов вводится двумя операторами независимо друг от друга, а затем программно производится сравнение идентичности двух полученных таким образом массивов информации. Обнаруженные различия сверяются с оригиналами и устраняются.

Цель предварительного контроля - исключить из обработки и последующего содержательного анализа документы, не удовлетворяющие определенным, задаваемым исследователем критериям качества.

Ввод эмпирической фактуры в память компьютера. Эта операция представляет собой перенос эмпирической фактуры с полевого документа в память компьютера с помощью электронного макета полевого документа. Осуществляется она либо самим социологом (что предпочтительнее, так как он одновременно может контролировать качество заполнения документа и устранять логические неясности и противоречия), либо оператором путем визуального просмотра документов и переноса эмпирической фактуры в электронный макет непосредственно с клавиатуры персонального компьютера. Предполагается, что к моменту выполнения этой операции уже проведены процедуры закрытия открытых вопросов и отбраковки не прошедших контроль документов.

Линейные распределения и таблицы сопряженности. Основная цель любых преобразований эмпирической информации — представить ее в компактном, «сжатом» виде для удобства ее содержательного анализа. Получение линейных распределений частот значений переменных эмпирического массива документов — самый простой и неизбежно обязательный способ решения этой задачи.

Линейное распределение эмпирической информации получается с помощью процедуры счета: подсчитывается количество реально зафиксированных значений всех переменных во всех документах эмпирического массива. Результаты подсчета представляются в абсолютных и относительных величинах. (Например, после проведения всех предварительных операций, рассмотренных выше, на обработку поступили 1000 ед. документа, фрагмент которого показан в табл. 4.1. Линейное распределение частот ответов на вопросы этой анкеты может быть оформлено в табличном виде (см. табл. 4.1).

Таблица 4.1

<<< < Предыдущая 1 2 3 4 5 67 / 107 8 9 10 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
13.08.2019864.77 Кб35ИСУ Курс лекций Назарова В.М.Лекция 5..doc
#
01.05.2015108.76 Кб19ИСЭПП 2 к. бак. 2013.docx
#
09.11.2018812.54 Кб73ИСЭПП Лекция 1.doc
#
09.11.2018297.47 Кб62ИСЭПП Лекция 2.doc
#
09.11.2018274.94 Кб50ИСЭПП Лекция 3.doc
#
09.11.2018504.32 Кб26ИСЭПП Лекция 4.doc
#
09.11.2018194.05 Кб14ИСЭПП Лекция 5.doc
#
09.11.2018538.11 Кб11ИСЭПП Лекция 6.doc
#
09.11.2018268.8 Кб15ИСЭПП Лекция 7.doc
#
09.11.2018715.26 Кб17ИСЭПП Лекция 8.doc
#
28.08.201990.11 Кб6К ГОСам ТОН.doc