Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Блок 2.Методы соц исследований.docx
Скачиваний:
67
Добавлен:
20.05.2015
Размер:
111.15 Кб
Скачать

17. Этапы обработки и анализ результатов количественного си

Заключительный этап социологического исследования включает обработку, интерпретацию и анализ данных, построение эмпирическивыверенных и обоснованных обобщений, выводов, рекомендаций и проектов. Общая структура обработки социологической информации включает в себя следующие компоненты:

1. Редактирование и кодирование информации. Основное назначение данного этапа состоит в унификации и формализации информации, которая была получена в ходе исследования (опроса). Часть анкетной информации заранее формализована: даны возможные варианты ответов и проставлены их цифровые коды. Однако, часто в таких ответах встречаются описки, нечеткое написание и т. п., что устраняется при редактировании собранных анкет. Другой тип собираемых данных представляют ответы на открытые вопросы. Их группировка и последующее кодирование также является задачей этого этапа.

2. Перенос данных на машинные носители. Объем информации, собираемой в ходе социологического исследования, как правило, достаточно велик. Среднее по объему исследование дает не менее нескольких тысяч единиц (байт) информации, а в некоторых случаях это число достигает миллионов. Обработка таких массивов данных без применения современных ЭВМ крайне трудна и малоэффективна. Применение средств вычислительной техники требует, чтобы обрабатываемая информация находилась на специальных носителях. Перенос данных с анкет на такие носители информации составляет содержание этого этапа.

3. Ввод данных в ЭВМ. Находящиеся на носителях информации данные исследований вводятся в ЭВМ и организуются в ней в соответствии с требованиями используемого пакета программ обработки социологических данных. Этот этап реализуется, как правило, специалистами вычислительного центра.

4. Проверка качества данных и коррекция ошибок. Введенная в ЭВМ и соответствующим образом организованная информация исследования во многих случаях содержит более или менее серьезные ошибки. Причины их возникновения разнообразны - это и ошибки опрашиваемых при заполнении анкет, и ошибки перенесения кодов на машиночитаемые носители информации, и ошибки технических устройств ЭВМ и т. д. Однако, независимо от их источника необходимо выявить и исправить все ошибки сразу после ввода данных в ЭВМ, до перехода к этапу анализа информации.

5. Создание переменных. Собранная на основании анкет информация в ряде случаев прямо не отвечает на вопросы, которые необходимо решить в исследовании. Связано это с тем, что подчас сложно бывает непосредственно измерить изучаемую характеристику. Для ее получения может потребоваться выполнение ряда преобразований собранных данных. Создание переменных является этапом в некотором смысле обратным этапу операционализации понятий- переменные выступают в качестве показателей, изучению которых, собственно, и посвящено исследование. Для многих вопросов анкет получаемая информация непосредственно отвечает задачам исследования, и в этом случае сами вопросы являются переменными.

6. Статистический анализ. Этот этап является ключевым в процессе анализа социологических данных. В ходе статистического анализа выявляются искомые статистические закономерности и зависимости.

7. Интерпретация - превращение социологических данных в показатели, которые являются не просто числовыми величинами, а определенными социологическими данными, соотнесенными с целями и задачами исследователя, его знанием, опытом.

В количественном анализе оперируют понятиями переменных, влияющих друг на друга. При сборе, обработке, анализе, моделировании и сопоставлении результатов разных исследований используется совокупность методов и моделей прикладной математической статистики. К первой группе относят выборочный метод, описательную статистику, анализ связей и зависимостей, теорию статистических выводов, оценок и критериев, планирование экспериментов, ко второй - ряд методов многопеременной статистики, различные методы шкалирования, таксономические процедуры, корреляционный, факторный, причинный анализ, а также большую группу статистических моделей.

18. Вариационные ряды. Одномерные и двумерные распределения, их графическое представление (Конспект) Каждый вопрос анкеты можно рассматривать как некую случайную величину. Варианты ответов на поставленный вопрос – это значения случайной величины. В социологических исследованиях вопросы анкет мы называем признаками. Если мы рассматриваем признак Х, то Х 1, Х 2 … Х n - варианты этого признака. Подсчитав количество опрошенных, которые выбрали тот иной вариант ответа,получаем частоты.

Частота – это кол-во индивидов, обладающих тем или иным значением признака. Частоты могут быть абсолютными (количество встретившихся ответов), относительными (отношение количества ответивших на вопрос определенных образом к общему числу ответивших на вопрос), кумулятивными (сумма предыдущих частот). Т. о., вариационный ряд – это совокупность упорядоченных вариант (значений признака) и соответствующих им частот.

Х

До 5

От 6 до 10

От 11 до 20

Свыше 20

N (х)

12

15

2

5

Одномерное распределение - распределение по одному признаку. Двумерное распределение – распределение по двум признака одновременно. Графическое представление одномерных распределений 1) Полигон – линия, соединяющая точки с координатами (Xi; N(Xi)) или(Xi; V(ню)i)), или (Xi; % (X)i). Обычно изображают как замкнутую кривую; точки полученной ломаной соединяют с началом координат т концом изображаемой оси. Существует специальный полигон, который называют кумулятой, острый соединяет точки с координатами (Xi; F(Xi)) или (Xi; f(Xi)).

2) Гистограмма – это столбики с высотой N(Xi). При помощи этих же средств возможно графически представить двумерные распределения. Тогда полигон и гистограммы строятся в одной системе координат. 19. Меры центральной тенденции. Квантили.

Меры центральной тенденции — обобщенные характеристики распределения некоторого признака в данной совокупности индивидов. Их называют также средними, оперируя которыми, мы теряем часть информации, но отражаем типичное для изучаемой совокупности в определенных условиях. Чтобы средняя была характеристикой, улавливающей тенденцию, закономерность, она должна применяться к достаточно однородной совокупности. Поэтому исчислению М. ц. т. предшествует выделение из изучаемой общности в некотором смысле однородныхподобщностей.

Наиболее часто используется так называемая средняя арифметическая величина М, определяемая как сумма всех значений признака у различных индивидов, деленная на общее число индивидов.

Если данные сгруппированы, то М равна сумме произведений вариант на их частости (относительные частоты).

Из свойств М отметим следующие: сумма произведений отклонений вариант от М на их частости (или частоты) всегда равна нулю; М не меняется при увеличении частостей в несколько раз; при увеличении вариант в несколько раз М увеличивается во столько же раз; при увеличении всех вариант на одну и ту же величину М увеличивается на эту же величину. Медиана Ме — значение признака, приходящееся на центральный член ранжированного ряда. У одной половины членов такого ряда значения данного признака меньше, чем медианное, у другой — больше.

На медианное значение признака влияют лишь центральные значения его, поэтому ненадежное знание граничных значений (а такая ситуация встречается на практике), приводит к искажению М, но не искажает Ме. В отличие от М, Ме можно использовать и для описания качественных, неметрических признаков. Мода Мо — наиболее часто встречающееся в данной совокупности значение признака, т. е. это варианта с наибольшей частотой. Мо — не отражает степени модальности, т. е. не несет в себе информацию о том, насколько распространено данное значение признака в изучаемой совокупности. Подобно Ме, Мо может применяться для описания качественных и классификационных признаков. Для непрерывных количественных признаков Мо — абсцисса максимума кривой распределения. Если максимум один, то распределение называется унимодальным (например, распределение населения по возрасту в отсутствии войн и эпидемий), если максимумов два — бимодальным (например, распределение населения по возрасту в послевоенные десятилетия: два максимума на кривой распределения появляются из-за возникновения минимума, соответствующего снижению рождаемости в годы войны) и т. д. На Мо, как и на Ме, не влияют концы распределений. При так называемом нормальном распределении (например, распределение по росту людей данного пола) М = Ме=Мо. Ме всегда находится между М и Мо. Если при унимодальном распределении Мо>Ме, то говорят о левой асимметрии, если Мо<Ме,— о правой.

В качестве М. в. используются также квантили. Квантиль (значение признака) делит сумму частот на равное число частей. Число частей может быть различным, отсюда различные квантили — квартили, децили, перцентили. Квартиль делит сумму частот на 4 части. Квартилей три: Q1, Q2, Q3— такое значение, что у 25 % индивидов значение данного признака меньше, а у 75 % —больше, чем Q1, Q2 — это, очевидно, медиана (Меры центральной тенденции). У 75 % индивидов значение признака меньше, чем Q3, а у 25 % — больше. В качестве М. в. используется величина

/\ Q= Q3 - Q1— полуквартильное отклонение (половина вариант заключена между Q1 и Q3). Дециль делит сумму частот на 10 частей. Децилей девять: Д1 ..., Д9. В качестве меры разброса используется величина ^D = D9-D1. Перцетиль делит сумму частот на 100 частей. Их, очевидно, 99. Все рассмотренные М. в. относятся к количественным признакам. Для классификационных признаков можно ввести меру вариации, основанную на различии в качестве, но такие меры не получили распространения