Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
пособие Епархина О.В.12.doc
Скачиваний:
19
Добавлен:
18.11.2019
Размер:
1.24 Mб
Скачать

5.2. Показатели связи в двухмерных распределениях

Довольно часто используемым показателем силы связи выступа­ют различные коэффициенты корреляции48. Корреляция указывает на степень статистической взаимосвязи признаков. Одним из индек­сов такого рода при использовании порядковой шкалы измерения выступает коэффициент ранговой корреляции Спирмена. Формула расчета его имеет следующий вид:

.

Коэффициент ранговой корреляции Спирмена будет равен +1 (абсолютная положительная связь), если ответы рес­пондентов анализируемых групп будут в точности совпадать; он будет равен -1 (абсолютная отрицательная связь), если ответы всех респондентов обеих анализируемых групп будут прямо противопо­ложны; если rs = 0, то это означает полное отсутствие всякой связи. Коэффициент ранговой корреляции показы­вает, насколько одинаковыми или различными оказываются от­веты на один и тот же вопрос со стороны двух сравниваемых между собою групп респондентов.

Тема 6. Анализ связей между номинальными признаками

6.1. Общая характеристика подходов к анализу номинальных данных

Роль номинальных данных в социологии огромна, что объясняется следующими причинами:

- простота их получения и естественность интерпретации;

- они более надёжны, чем данные, полученные по шкалам более высокого типа;

- в методах, используемых для анализа номинальных данных, обычно бывают заложены модели, отвечающие естественной логике социолога.

Изучение связей между переменными, как правило, интересует исследователя не само по себе, а как отражение соответствующих причинно-следственных отношений. Однако социолог может наблюдать только статистические связи, а понятия «причина» и «следствие» не могут быть формализованы. Математика не может доказать, что такой-то признак служит причиной (следствием) того или иного явления. Для оценки связей между признаками используются частотные таблицы, или таблицы сопряженности (выборочные оценки вероятностных распределений многомерных случайных величин). На основе анализа подобных таблиц можно судить о сопряженности (совместной встречаемости) каких-то значений одних признаков с некоторыми значениями других признаков.

Предположим, что мы имеем два признака X и Y, первый из которых принимает значения 1, 2, . . ., r, а второй — значения 1, 2, . . ., c. Назовем двухмерной таблицей сопряженности матрицу, на пересечении i-й строки и j-го столбца которой стоит число nij, означающее количество объектов, обладающих i-м значением первого признака и j-м значением второго (i =1, . . ., r; j =1, . . ., c):

.

Обычно ее представляют с явно обозначенными наименованиями признаков и их значений и выписанными маргинальными суммами:

Таблица 18

Общий вид таблицы сопряженности

Значения X

Значения Y

Маргиналы

по строкам

1

2

j

c

1

n11

n12

n1j

n1c

n1.

2

n21

n22

n2j

n2c

n2.

i

ni1

ni2

nij

nic

ni.

r

nr1

nr2

nrj

nrc

nr.

Маргиналы

по столбцам

n.1

n.2

n.j

n.c

n

Правый крайний столбец образуют строковые маргинальные суммы (маргиналы по строкам). Нижняя строка образуется столбцовыми маргинальными суммами (маргиналами по столбцам). Объем выборки n равен сумме маргиналов по столбцам (либо по строкам). В качестве элементов таблицы могут фигурировать частоты, средние значения, мода, медиана, дисперсии, величины отклонений от средних по строке (столбцу), разница между эмпирической и теоретической частотой (пакет SPSS).

Действия исследователя могут быть направлены на:

- поиск сочетаний значений признаков, детерминирующих поведение респондента, т.е. поиск взаимодействий;

  • поиск латентной переменной для каждого респондента.

Часто при этом используется т. н. оцифровка, т.е. приписывание каждой градации любого номинального признака определенного числа, отвечающего искомому значению соответствующей латентной переменной.

Математические методы работы с таблицами номинальных данных направлены на решение задач, типологизированных по классам. Рассмотрим классификацию задач, приведенную Ю.Н.Толстовой49. Ею выделяются следующие типы задач:

- «альтернатива-альтернатива», т. е. такие, которые позволяют изучать связь между отдельными значениями любых рассматриваемых признаков (детерминационный анализ50;

- «группа альтернатив - группа альтернатив», т.е. включающие анализ фрагментов таблиц сопряженности, методы выявления логических закономерностей, методы поиска детерминирующих сочетаний значений рассматриваемых признаков, в т. ч. алгоритмы, для обозначения которых используются аббревиатуры, включающие в себя сочетание AID (automatic interaction detector): CHAID, THAID51.

- «признак – признак» (наиболее знакомые социологу коэффициенты парной связи);

- «признак - группа признаков», включающие регрессионный анализ, методы построения индексов;

- «группа признаков - группа признаков», предполагающие канонический анализ, или анализ соответствий, который дает возможность осуществлять оцифровку, изучать связи между признаками с т. н. «совместными» альтернативами, находить веса признаков при формировании индекса52.

Тип задач, отвечающих рассмотрению всей совокупности признаков как системы, называется анализом системы признаков (логлинейный анализ или причинный анализ).