Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
3. ММСИ.doc
Скачиваний:
79
Добавлен:
28.05.2015
Размер:
347.65 Кб
Скачать

23. Статистические методы анализа социологический информации.

Традиционно выделяют три основные функции статистики -описание, обобщение и объяснение (анализ). Понятие обработки данных связывают, в первую очередь, с методами описательной или дескриптивной статистики, которые применяются для получения обобщенных сведений об обследованной совокупности объектов (например, людей). Если исследование проводилось выборочным методом, результаты статистической обработки относятся только к выборке. Для того чтобы обобщить их на генеральную совокупность, применяются специальные процедуры статистического вывода или индуктивной статистики (некоторые из них рассматриваются в главе "Выборочный метод в социологическом исследовании"). Методы статистического анализа данных предназначены главным образом для исследования связей между переменными.

Общая структура обработки социологической информации включает в себя следующие компоненты:

1. Редактирование и кодирование информации. Основное назначение данного этапа состоит в унификации и формализации информации, которая была получена в ходе исследования (опроса). Часть анкетной информации заранее формализована: даны возможные варианты ответов и проставлены их цифровые коды. Однако, часто в таких ответах встречаются описки, нечеткое написание и т.п., что устраняется при редактировании собранных анкет. Другой тип собираемых данных представляют ответы на открытые вопросы. Их группировка и последующее кодирование также является задачей этого этапа.

2. Перенос данных на машинные носители. Объем информации, собираемой в ходе социологического исследования, как правило, достаточно велик. Среднее по объему исследование дает не менее нескольких тысяч единиц (байт) информации, а в некоторых случаях это число достигает миллионов. Обработка таких массивов данных без применения современных ЭВМ крайне трудна и малоэффективна. Применение средств вычислительной техники требует, чтобы обрабатываемая информация находилась на специальных носителях.Перенос данных с анкет на такие носители информации составляет содержание этого этапа.

3. Ввод данных в ЭВМ. Находящиеся на носителях информации данные исследований вводятся в ЭВМ и организуются в ней в соответствии с требованиями используемого пакета программ обработки социологических данных. Этот этап реализуется, как правило, специалистами вычислительного центра.

4. Проверка качества данных и коррекция ошибок. Введенная в ЭВМ и соответствующим образом организованная информация исследования во многих случаях содержит более или менее серьезные ошибки. Причины их возникновения разнообразны - это и ошибки опрашиваемых при заполнении анкет, и ошибки перенесения кодов на машиночитаемые носители информации, и ошибки технических устройств ЭВМ и т.д. Однако, независимо от их источника необходимо выявить и исправить все ошибки сразу после ввода данных в ЭВМ, до перехода к этапу анализа информации.

5. Создание переменных. Собранная на основании анкет информация в ряде случаев прямо не отвечает на вопросы, которые необходимо решить в исследовании. Связано это с тем, что подчас сложно бывает непосредственно измерить изучаемую характеристику. Для ее получения может потребоваться выполнение ряда преобразований собранных данных. Создание переменных является этапом в некотором смысле обратным этапу операционализации понятий - переменные выступают в качестве показателей, изучению которых, собственно, и посвящено исследование. Для многих вопросов анкет получаемая информация непосредственно отвечает задачам исследования, и в этом случае сами вопросы являются переменными.

6. Статистический анализ. Этот этап является ключевым в процессе анализа социологических данных. В ходе статистического анализа выявляются искомые статистические закономерности и зависимости.

Наиболее простой способ представления результатов исследования - одномерные частотные распределения, показывающие распространенность объектов с различными значениями переменной. Одномерным частотным распределением называют совокупность значений переменных и их частот. Значения переменных упорядочиваются по возрастанию, непрерывные переменные должны быть предварительно сгруппированы в интервалы.

Различают абсолютные и относительные частоты. Абсолютная частота показывает количество объектов, обладающих определенным значением признака. Относительные частоты могут выражаться в процентах от объема выборки или в долях единицы. При анализе порядковых и количественных переменных часто бывает полезным распределение накопленных частот. Накопленной частотой значения переменной называется сумма частот от первого значения в распределении вплоть до значения, о котором идет речь. Накопленные частоты также бывают абсолют­ными и относительными.

Частотные распределения могут быть представлены графически. Наиболее популярными графиками являются круговая диаграмма, диаграмма столбцов, полигон распределения, гистограмма. Выбор графика определяется его способностью отражать свойства измерительных шкал - упорядоченность и дискретность/непрерывность. Круговая диаграмма применяется, главным образом, для номинальных и порядковых данных (Диаграмма столбцов применяется для порядковых и дискретных количественных шкал; промежутки между столбцами подчеркивают дискретный.

пределения.

К мерам центральной тенденции относятся мода, медиана и среднее арифметическое. Все они в определенном смысле характеризуют центр распределения.

Мода, или частотное среднее, представляет собой наиболее часто встречающееся значение признака, т.е. значение, обладающее максимальной частотой. Если значения переменной сгруппированы в интервалы, говорят о модальном интервале. Так, модальный возраст минчан - 35-39 лет. Мода является наиболее универсальным показателем центра распределения. Она определена не только для количественных, но также для номинальных и порядковых шкал.

Медианой называется значение признака, которому соответствует накопленная частота, равная 50 %. Медиана определяется для порядковых и количественных признаков: одна половина выборки имеет значение признака ниже, чем медианное, вторая - выше, чем медианное.

Согласно наиболее общему определению, между двумя переменными существует статистическая связь, если при изменении значения одной переменной меняется распределение другой. Если статистической связи между переменными нет, говорят, что они статистически независимы.

Универсальным средством анализа связей является таблица сопряженности, представляющая совместное распределение двух признаков. Все коэффициенты связи, основанные на критерии "хи-квадрат" изменяются в диапазоне от 0 до 1. Значение, равное нулю, свидетельствует о статистической независимости признаков, отсутствии связи между ними. Чем ближе значение коэффициента к единице, тем теснее связь.

Выбор модели, адекватной проверяемой гипотезе и характеру имеющихся данных, является одним из критических моментов исследования. Традиционно он определяется уровнем измерения анализируемых показателей. Для количественных зависимых переменных обычно используется множественный регрессионный анализ, если независимые переменные также являются количественными или порядковыми, или дисперсионный анализ, если предикторы измерены по номинальным или порядковым шкалам. К номинальным зависимым переменным в аналогичных ситуациях применяется дис-криминантный анализ.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]