Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Социология.docx
Скачиваний:
37
Добавлен:
23.09.2019
Размер:
336.61 Кб
Скачать

75. Методы эмпирического исследования. Тестирование.

Тест — стандартизированное, ограниченное по времени испытание. Он позволяет с заранее установленной степенью вероятности определить актуальный, существующий у человека в данное время уровень знаний, относительно устойчивые личностные свойства (в том числе умения и навыки), устойчивые черты поведения.

Основное назначение — дает возможность получить количественные и качественные оценки измеряемых характеристик; диагностика и мониторинг групп работников и населения.

Объектом при тестировании могут выступать — личность, малая (контактная) группа, социальная группа, общность.

Предмет – выраженность некоторого психического свойства (черты, характеристики), а также совокупности психических свойств личности или же психических состояний (отношений, взаимовосприятий) групп и коллективов.

Существуют различные виды анкетирования.

По числу опрашиваемых выделяют:

· групповое

· индивидуальное

В зависимости от ситуации и аудитории различают:

· анкетирование по месту работы,

· в целевой аудитории (например, в библиотеке)

· на улице.

Важное значение имеет способ доставки анкет. Здесь различают следующие разновидности:

· раздаточное (курьерское) анкетирование. Позволяет одному анкетеру одновременно опрашивать много человек путем раздачи анкет в аудитории;

· почтовое анкетирование, при котором анкета доставляется респонденту по почте;

· прессовый опрос. В этом случае анкета публикуется в средствах массовой информации. Данный метод имеет ограниченные возможности, поскольку социолог не формирует выборочную совокупность, не в состоянии спрогнозировать, кто ответит на анкету. Применяется в журналистике.

76. Методы анализа эмпирических данных. Анализ частотных распределений и таблиц сопряженности.

Частотное распределение - показатель  того, сколько раз каждое значение  переменной происходит в совокупности наблюдений. 

Таблица  частотного распределения — один из самых простых способов представления социологических наблюдений. Она состоит, по крайней мере, из двух столбцов: левый содержит значения которые может принимать переменная,  а правый — число раз, которое каждое значение происходит. Иногда включаются дополнительные столбцы, отражающие процентное распределение.

Таблица сопряженности - таблица с группировкой значений в двух направлениях: по горизонтальным строкам и вертикальным столбцам, на пересечении которых рассчитаны итоги по этим группам. Кроме того, таблица может включать общие итоги по строкам и столбцам.

Простейшая форма кросстабуляции - это таблица сопряженности 2 x 2, в которой значения двух переменных "пересечены" (сопряжены) на разных уровнях и каждая переменная принимает только два значения, т.е. имеет два уровня (поэтому таблица называется "2 на 2"). К примеру, пусть проводится исследование, в котором мужчины и женщины опрашиваются о том, какой напиток они предпочитают (газированную воду марки A или газированную воду марки B); файл данных может быть таким:

 

пол

газ. вода

наблюдение 1 наблюдение 2 наблюдение 3 наблюдение 4 наблюдение 5 ...

мужчина женщина женщина женщина мужчина ...

A B B A B ...

Результаты кросстабуляции этих переменных выглядят следующим образом.

 

газ. вода: A

газ. вода: B

 

пол: мужчина

20 (40%)

30 (60%)

50 (50%)

пол: женщина

30 (60%)

20 (40%)

50 (50%)

 

50 (50%)

50 (50%)

100 (100%)

 Таблица сопряженности - средство представления совместного распределения двух переменных, предназначенное для исследования связи между ними. Таблица сопряженности является наиболее универсальным средством изучения статистических связей, так как в ней могут быть представлены переменные с любым уровнем измерения.

Строки таблицы сопряженности соответствуют значениям одной переменной, столбцы - значениям другой переменной (количественные шкалы предварительно должны быть сгруппированы в интервалы). На пересечении строки и столбца указывается частота совместного появления fij соответствующих значений двух признаков xi и yj.

Сумма частот по строке fi называется маргинальной частотой строки; сумма частот по столбцу fj - маргинальной частотой столбца.

Сумма маргинальных частот равна объему выборки n; их распределение представляет собой одномерное распределение переменной, образующей строки или столбцы таблицы.

В таблицах сопряженности могут быть представлены как абсолютные, так и относительные частоты (в долях или процентах). Относительные частоты могут рассчитываться по отношению:

к маргинальной частоте по строке

к маргинальной частоте по столбцу

к объему выборки

Таблицы сопряженности используются для проверки гипотезы о наличии связи между двумя признаками ( Статистическая связь, Критерий "хи-квадрат" ), а также для измерения тесноты связи ( Коэффициент фи, Коэффициент контингенции, Коэффициент Крамера)

Кросстабуляция - это процесс объединения двух (или нескольких) таблиц частот так, что каждая ячейка (клетка) в построенной таблице представляется единственной комбинацией значений или уровней табулированных переменных. Таким образом, кросстабуляция позволяет совместить частоты появления наблюдений на разных уровнях рассматриваемых факторов. Исследуя эти частоты, можно определить связи между табулированными переменными. Обычно табулируются категориальные (номинальные) переменные или переменные с относительно небольшим числом значений. Если вы хотите табулировать непрерывную переменную (например, доход), то вначале ее следует перекодировать, разбив диапазон изменения на небольшое число интервалов (например, доход: низкий, средний, высокий).

Было:

 

ПОЛ

ГАЗ. ВОДА

наблюдение 1 наблюдение 2 наблюдение 3 наблюдение 4 наблюдение 5 ...

мужчина женщина женщина женщина мужчина ...

A B B A B ...

Стало:

 

ГАЗ. ВОДА: A

ГАЗ. ВОДА: B

 

ПОЛ: мужчина

20 (40%)

30 (60%)

50 (50%)

ПОЛ: женщина

30 (60%)

20 (40%)

50 (50%)

 

50 (50%)

50 (50%)

100 (100%)

Каждая ячейка таблицы содержит единственную комбинацию значений двух табулированных переменных (в строке - указана переменная Пол в столбце - переменная марка воды). Числа в каждой ячейке, на пересечении определенной строки и определенного столбца, показывают, сколько наблюдений соответствует данным уровням факторов. В целом таблица показывает, что женщины больше мужчин предпочитают газированную воду марки A, мужчины больше женщин предпочитают марку B. Таким образом, пол и предпочтение могут быть зависимыми (позже будет показано, как эту связь измерить статистически).

Критерий хи-квадрат Пирсона. Хи-квадрат Пирсона - это наиболее простой критерий проверки значимости связи между двумя категоризованными переменными. Критерий Пирсона основывается на том, что в двувходовой таблице ожидаемые частоты при гипотезе "между переменными нет зависимости" можно вычислить непосредственно. Представьте, что 20 мужчин и 20 женщин опрошены относительно выбора газированной воды (марка A или марка B). Если между предпочтением и полом нет связи, то естественно ожидать равного выбора марки A и марки B для каждого пола.

Значение статистики хи-квадрат и ее уровень значимости зависит от общего числа наблюдений и количества ячеек в таблице. В соответствии с принципами, обсуждаемыми в разделе Элементарные понятия статистики, относительно малые отклонения наблюдаемых частот от ожидаемых будет доказывать значимость, если число наблюдений велико.

Имеется только одно существенное ограничение использования критерия хи-квадрат (кроме очевидного предположения о случайном выборе наблюдений), которое состоит в том, что ожидаемые частоты не должны быть очень малы. Это связано с тем, что критерий хи-квадрат по своей природе проверяет вероятности в каждой ячейке; и если ожидаемые частоты в ячейках, становятся, маленькими, например, меньше 5, то эти вероятности нельзя оценить с достаточной точностью с помощью имеющихся частот.

Гипотеза H0: переменные x и y независимы. Пусть имеется таблица сопряженности KxL, построенная для переменных x и y:

1

...

j

...

L

1

...

i

nij

...

K

Введем следующие обозначения: - наблюдаемая частота (i,j) - ожидаемая частота при H0 Статистика

Условие применимости

Eij<5 не более чем в 20% ячеек n>40