Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Рабочая книга социолога.doc
Скачиваний:
6
Добавлен:
03.11.2018
Размер:
5.22 Mб
Скачать

1. Подготовка данных к анализу на эвм

Главная задача заключительного этапа социологического иссле­дования — анализ и интерпретация полученных данных, обобщение выводов и выдача рекомендаций по совершенствованию или изме­нению работы изучаемого социального механизма.

Данные, полученные в социологическом исследовании на стадии сбора эмпирического материала, как правило, обрабатываются на ЭВМ. Современная технология обработки включает целый ряд эта­пов, основные из которых будут кратко описаны ниже. Поскольку каждый метод сбора информации порождает более или менее специ­фические процедуры ее обработки, для большей конкретности будем вести изложение применительно к данным анкетных опросов.

Выделяют следующие этапы: редактирование данных, кодирова­ние данных, контроль данных и исправление ошибок, построение переменных (индексов), анализ данных.

Редактирование. Цель этого этапа — подготовка информации, за­ключенной в вопроснике, для перевода па машинный носитель.

Анкеты, полученные в результате опроса, могут содержать мно­жество ошибок, неточностей и всякого рода погрешностей. Необхо­димо по возможности .избегать их. Для этого непосредственно в процессе исследования, после его окончания или даже после вво­да информации в машину проводят контроль каждого вопросника и его редактирование. Наиболее типичные ошибки, подлежащие исправлению, можно сгруппировать следующим образом.

1. Нарушение полевых процедур опроса: использована не та форма вопросника (при наличии нескольких);

опрошен не тот респондент (например, сын вместо отца);

отсутствуют шифры, идентифицирующие вопросник (например, шифр предприятия,

города и т. д.).

2. Неполнота заполнения вопросника:

отсутствуют ответы на отдельные вопросы или их группы;

неясно заполнены вопросники (бланки интервью).

3. Противоречивость ответов:

логические противоречия (например, неработающий отвечает на блок вопросов

«Только для работающих»);

несуществующие коды ответов;

неверная интерпретация вопросов респондентом или интервьюером.

Часть из этих ошибок, если они замечены на стадии сбора данных, может быть исправлена в результате беседы с интервьюером, часть — путем повторного обращения к респонденту. Если этого сделать нельзя, зачастую приходится принимать решение об исключении данной анкеты из дальнейшей обработки.

Отсутствие ответов па вопросы (или, как иногда говорят, — про­пущенные данные) доставляет исследователю при статистическом анализе много неприятностей (причем в эту категорию следует от­нести ответ типа Не знаю и отсутствие ответа как такового). Если возможно, пропуски оставляют незаполненными. В противном случае приходится прибегать к косвенным методам, например использовать таблицы случайных чисел, данные из прошлых исследований, распределения данной переменной в связи с другими и т. д..

Процесс редактирования данных в одних исследованиях (какую правило, больших) может, быть очень длительным, сложным и многоэтапным, в других — сведен к простому просмотру анкет. Однако в любом случае должен быть в явной форме разработан документ — инструкция по редактированию, который бы указывал, на какого рода возможные ошибки следует обратить внимание и что с ними делать в случае обнаружения. Исправления и пометки, вносимые редактором в анкету, должны делаться чернилами другого цвета, нежели применяемые для заполнения респондентами.

Кодирование. Цель этого этапа — преобразование собранной информации в числовую форму, которая в свою очередь предназначена для запоминания в ЭВМ в машиночитаемой форме.

Для запоминания информации в ЭВМ используют перфокарты, перфоленты, магнитные ленты и магнитные диски.

Перфокарта — наиболее распространенный сейчас носитель ма­шиночитаемой информации — представляет собой прямоугольную карточку, обычно из тонкого гибкого картона, на которую инфор­мация записывается пробивкой отверстий.

Перфокарта разделена графически на 80 вертикальных колонок, которые пронумерованы слева направо. Каждая вертикальная ко­лонка разделена на 12 частей; 10 из них пронумерованы: 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Выше 0 имеются две непронумерованные позиции. Числовые данные на перфокарте запоминаются пробивкой отверстий па специальном устройстве — перфораторе — в каждой колонке на месте соответствующей цифры. Для того чтобы информация из ан­кет могла быть перенесена на перфокарты, соответствующие еди­ницы информации необходимо обозначить цифрами, т.е. закоди­ровать.

В большинстве случаев анкеты кодируются на стадии их создания, и респондент непосредственно отмечает тот код, который соот­ветствует его ответу. Однако и в таких анкетах возможна и откры­тая форма вопросов, требующих последующего кодирования. Бланки интервью могут полностью состоять из открытых вопросов и требовать специального кодирования после проведения опроса.

Часто процесс кодирования совмещается с редактированием. Существует много способов кодирования информации в .анкетах. Выбор того или иного из них предопределяется главным образом спецификой той программы для ЭВМ, которой располагает исследо­ватель при анализе данных.

Наиболее употребительны следующие два способа.

1. Кодирование с помощью номера вопроса и номера альтернативы. В этом случае подряд нумеруются все вопросы. Внутри каж­дого вопроса нумеруются все альтернативы.

Пример. 003. Пол респондента

мужской ...... 1

женский ...... 2

При переносе кода ответа на перфокарту на ней перфорируется, например, альтернатива женский в виде числа 0032.

2. Позиционное кодирование. В анкете достаточно пронумеровать лишь альтернативы в каждом из вопросов. При этом предполагается, что за каждым вопросом на перфокарте закреплено определенное место — позиция (колонка или группа колонок).

Такой способ кодирования обладает рядом преимуществ, поэтому рассмотрим его более подробно.

Общая структура кодов на перфокарте, применяемых при коди­ровании данных анкеты позиционным способом, выглядит следую­щим образом:

Номер колонки на перфокарте

Описание содержания

1 – 3

4 – 7

8 – 9

10 – 80

Номер исследования

Номер анкеты или интервью

Номер перфокарты

Данные ответов на вопросы

В первые колонки заносятся номер исследования, затем — помер кодируемой анкеты, номер перфокарты, поскольку обычно для ко­дирования одной анкеты необходимо несколько перфокарт (может быть несколько десятков), и, наконец, коды альтернатив соответ­ствующих вопросов.

Как правило, перед кодированием анкеты составляется специаль­ная инструкция, которая содержит полное описание значений кодов, применяемых для фиксации информации анкеты и их расположения па перфокартах.

Пример такой инструкции приведен ниже.

Здесь продемонстрированы лишь две части инструкции по коди­рованию вопросника. В такой инструкции выписываются последова­тельно все вопросы, указывается, какими кодами кодируется каж­дая альтернатива, вводятся специальные коды для фиксации ситуа­ции — когда респондент не ответил на вопрос (обычно кодируется 0), вопрос в соответствии с логической структурой анкеты к респонденту не относится (код 9), предусматриваются другие возможные ситуации. Для открытых вопросов разрабатывается классификация ответов и вводятся соответствующие коды.

Процесс кодирования — весьма ответственный этап во всей про­цедуре сбора социологических данных. От его качества во многом зависит и качество получаемых данных в целом.

Контроль данных и исправление ошибок. Дальнейший процесс преобразования информации из документа сбора состоит в перенесении кодов на машинный носитель — перфокарты — и ввод данных в память ЭВМ.

Важной составной частью подготовки данных к анализу явля­ется всесторонний контроль данных и исправление найденных оши­бок. Источники ошибок кроются во всех предыдущих этапах иссле­дования от сбора информации до её ввода в ЭВМ.

Практически очень трудно исправить все ошибки в данных, осо­бенно если это исследование достаточно обширно. Исследователь должен решить, какого рода проверки и исправления наиболее важны для него, а какими ошибками можно пренебречь.

Процедура исправления данных состоит из трех этапов: выявле­ния ошибок, нахождения истинных величии данных или кодов в исходных документах — анкетах, бланках, исправления данных.

Среди множества ошибок, требующих к себе соответствующего внимания, назовем две. Появление кодов, отсутствующих в инструк­ции по кодированию анкеты. Например, для оценки удовлетворенности работой была использована шкала с градациями 1, 2, 3, 4, 5, 6, 7 и дополнительно коды — 0 (отсутствие ответа), 9 (респондент не работает и вопрос к нему не относится). Тогда числа 8, 10, 11 и т.д. будут ложными кодами, которые необходимо исправить.

Другая ошибка — появление кодов, выходящих за рамки логиче­ской структуры вопросника. Например, для вышеприведенного при­мера ясно, что на вопрос должны отвечать, лишь работающие, и этот факт должен быть проверен при контроле данных. Иногда этот тип контроля называют проверкой данных на логическую согласован­ность.

После корректировки данных полезно подсчитать частотные распределения для всех переменных в исследовании. Это позволит выявить не только ложные коды, но и получить первые сведения о выборке.

Построение новых переменных. Перед анализом данных и в про­цессе их анализа часть вопросов анкеты (переменные, признаки в терминологии этапа работы с данными) в исходной формулировке подвергается преобразованиям. Тип этих преобразований определяется гипотезами .исследования, программой анализа полученной ин­формации и конкретными свойствами эмпирических данных, полу­чаемых в результате их сбора.

Преобразования переменных могут быть очень простыми, когда например, для открытого вопроса о возрасте вводят определенную группировку возрастов или шкалу с семью градациями свертывают в трехбалльную, и очень сложными, когда на нескольких переменных строится новая — индекс (например, на основе вопросов о различных статьях денежных доходов семьи и ее составе подсчитыва­ется индекс — средний доход, приходящийся на одного члена это семьи).

Для построения индексов могут применяться всевозможные статистические методы — факторный анализ, кластерный, регрессион­ный и т.д., различные логически и теоретически обоснованные эв­ристические процедуры преобразования.

Подготовка эмпирических данных, полученных в ходе социологического исследования, к анализу — достаточно трудоемкий и дли­тельный процесс. Следующий этап работы с данными — собственно их анализ.

Инструкция по кодированию фрагмента вопросника Всесоюзного исследования образа жизни советских людей (ИСИ АН СССР)

Перфокарта 1

Номер переменной

Номер колонки

Описание содержания кодов

1

2

3

1 – 5

6 – 9

10 – 11

12

13 – 14

15

Номер исследования ……………………..82007

Номер анкеты (4 цифры) …...……………..0228

Номер перфокарты …………………..............01

В. 3. Пол респондента

1 – мужской

2 – женский

В. 4. Возраст ___________лет

Занести реальный возраст в годах ...от 18 до 97

Возраст 98 и более …………………………...98

Нет ответа …………………………………….00

В. 5. Образование

0 – нет ответа

1 – нет начального

2 – начальное

3 – неполное среднее

4 – общее среднее

5 – среднее специальное

6 – незаконченное высшее

7 – высшее

Перфокарта 2

Номер переменной

Номер колонки

Описание содержания кодов

25

26

27

1 – 5

6 – 9

10 – 11

1

Поставить 9 в колонках 13 - 75

2

13 – 14

15

Номер исследования ……………………………..82007

Номер анкеты …………..…...……………………..0228

Номер перфокарты …………………..........................02

В. 45. В настоящее время Вы:

1 – работаете в народном хозяйстве

– 2 – находитесь на пенсии и не работаете

– 3 – учащийся, студент очного учебного заведения

– 4 – не работаете в народном хозяйстве

В. 46. В какой отрасли народного хозяйства относится предприятие, учреждение, в котором Вы работаете?

00 – нет ответа

01 – промышленность

02 – строительство

……………………………………………………………

11 – кредитование и др.

12 – к другой отрасли

99 – вопрос к респонденту не относится

В. 47. Вы работаете:

0 – нет ответа

1 – на заводе, фабрике

2 – в колхозе

3 – в совхозе

4 – в учреждении

5 – в другой организации

9 – вопрос к респонденту не относится