- •Тема 1. Общие идеи. Постановка проблемы и выдвижение гипотез
- •1. Идея метода
- •2. Постановка проблемы и выдвижение гипотез
- •3. Требования к теории
- •Тема 2. Понятия ковариации и каузации. Каузальная модель теории
- •1. Ковариация и каузация
- •2. Понятие функциональной связи
- •3. Построение каузальной модели
- •Тема 3. Понятие операционализации, альтернативные и рабочие гипотезы
- •1. Альтернативные гипотезы
- •2. Процедура операционализации
- •3. Рабочие гипотезы, их отличие от альтернативных гипотез
- •Тема 4. Измерение. Ошибки измерения
- •1. Понятие измерения
- •2. Ошибки измерения
- •Тема 5. Валидность и надежность измерения
- •1. Понятие валидности
- •2. Способы валидизации
- •3. Надежность измерения
- •Тема 6. Построение анкеты
- •1. Структура анкеты
- •Уважаемые сограждане!
- •Сводная таблица данных1
- •2. Виды вопросов и их формулировка
- •3. Расположение вопросов и ответов
- •4. Предварительное опробование анкеты
- •Тема 7. Формирование выборки
- •1. Генеральная совокупность и выборка
- •2. Способы построения выборки
- •3. Определение объема выборки
- •Тема 8. Проведение опроса
- •1. Опрос и его виды и способы организации
- •2. Проведение опроса
- •3. Контроль над проведением опроса
- •4. Вторичный анализ данных опроса
- •Тема 9. Интервью
- •1. Определение интервью. Выборочное интервью
- •2. Направленное интервью
- •3. Специализированное интервью
- •Тема 10. Социологический эксперимент
- •1. Понятие переменной
- •2. Классический эксперимент в социологии
- •3. Способы подбора групп, участвующих в эксперименте. Полевой эксперимент и квазиэксперимент
- •Тема 11. Контент-анализ
- •1. Определение контент-анализа
- •2. Содержательный контент-анализ
- •3. Структурный контент-анализ
- •4. Что нужно учитывать при проведении контент-анализа
- •Тема 12. Описание и анализ данных: таблицы, диаграммы, гистограммы
- •1. Перечневая таблица
- •2. Графическое изображение
- •3. Другие способы представления данных
- •4. Правила оформления данных
- •Тема 13. Анализ номинальных и порядковых переменных
- •1. Анализ номинальных переменных
- •2. Анализ порядковых переменных
- •Тема 14. Анализ интервальных переменных
- •1. Понятия средней арифметической и стандартного отклонения
- •2. Анализ нормального распределения
- •Тема 15. Анализ связей между номинальными переменными
- •1. Связь двух номинальных переменных с двумя значениями. Понятие Хи-квадрата
- •2. Связь двух номинальных переменных, имеющих больше двух значений
- •3. Связь между несколькими номинальными переменными
- •Тема 16. Анализ связи между порядковыми переменными
- •1. Определение связи между двумя порядковыми переменными
- •2. Определение связи между таблицами с порядковыми переменными
- •Тема 17. Анализ связей между интервальными переменными
- •1. Понятие линии регрессии. Определение коэффициента связи между интервальными переменными
- •2. Проверка коэффициента связи на статистическую значимость
- •3. Смысл коэффициента корреляции Пирсона
- •Тема 18. Пример социологического исследования
3. Смысл коэффициента корреляции Пирсона
Вернемся к коэффициенту Пирсона. Чтобы лучше понять его роль, проведем эксперимент. Увеличим разброс точек вдоль прямой. Для этого в столбце, соответствующем переменной Y, в первой строке уменьшим на 2 число часов, проводимых перед телевизором, во второй строке число часов, наоборот, увеличим на 2, в третьей строке снова уменьшим на 2, в четвертой – увеличим на 2 и т. д. Получаем табл. 17.5.
Таблица 17.5
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
X |
1 |
1 |
2 |
3 |
3 |
3 |
4 |
4 |
4 |
5 |
6 |
6 |
7 |
7 |
8 |
8 |
9 |
9 |
10 |
10 |
Y |
1 |
6,5 |
1,5 |
7 |
2 |
7 |
3 |
6 |
4 |
7 |
3 |
9 |
3 |
8 |
5 |
8 |
3 |
8 |
5 |
8 |
Этой таблице соответствует график на рис. 17.4, в котором все точки разбросаны, если можно так выразиться, с большим размахом.
Интересно здесь то, что уравнение линии регрессии при новом, более размашистом положении точек, оказывается практически тем же самым, и, соответственно, почти тем же самым является коэффициент связи.
Рис. 17.4. Время, затрачиваемое на просмотр телепередач, при различных количествах лет, прошедших после выхода на пенсию (второй вариант)
Покажем это. Строим табл. 17.6, в которой сведены элементы формулы
Таблица 17.6
№ |
||||||
1 |
1 |
–4,5 |
20,25 |
1 |
–4,25 |
19,125 |
2 |
1 |
–4,5 |
20,25 |
6,5 |
1,25 |
–5,625 |
3 |
2 |
–3,5 |
12,25 |
1,5 |
–3,75 |
13,125 |
4 |
3 |
–2,5 |
6,25 |
7 |
1,75 |
–4,375 |
5 |
3 |
–2,5 |
6,25 |
2 |
–3,25 |
8,125 |
6 |
3 |
–2,5 |
6,25 |
7 |
1,75 |
–4,375 |
7 |
4 |
–1,5 |
2,25 |
3 |
–2,25 |
3,375 |
8 |
4 |
–1,5 |
2,25 |
6 |
0,75 |
–1,125 |
9 |
4 |
–1,5 |
2,25 |
4 |
–1,25 |
1,875 |
10 |
5 |
–0,5 |
0,25 |
7 |
1,75 |
–0,875 |
11 |
6 |
0,5 |
0,25 |
3 |
–2,25 |
–1,125 |
12 |
6 |
0,5 |
0,25 |
9 |
3,75 |
1,875 |
13 |
7 |
1,5 |
2,25 |
3 |
–2,25 |
–3,375 |
14 |
7 |
1,5 |
2,25 |
8 |
2,75 |
4,125 |
15 |
8 |
2,5 |
6,25 |
5 |
–0,25 |
–0,625 |
16 |
8 |
2,5 |
6,25 |
8 |
2,75 |
6,875 |
17 |
9 |
3,5 |
12,25 |
3 |
–2,25 |
–7,875 |
18 |
9 |
3,5 |
12,25 |
8 |
2,75 |
9,625 |
19 |
10 |
4,5 |
20,25 |
5 |
–0,25 |
–1,125 |
20 |
10 |
4,5 |
20,25 |
8 |
2,75 |
12,375 |
|
= 110 |
|
= 161 |
= 105 |
|
= 50 |
|
= 5,5 |
|
|
= 5,25 |
|
|
Получаем: а = 0,31 (50 : 161); в = 3,5 (5,25 – 0,31 х 5,5).
Новое уравнение: Y = 0,31X + 3,5. Мы видим, что оно почти совпадает с прежним уравнением: Y = 0,286X + 3,68.
Итак, коэффициент связи между обеими переменными может практически не измениться даже при большем разбросе точек.
Теперь проверим коэффициент 0,31 на статистическую значимость, для этого определим коэффициент корреляции Пирсона. Напоминаем его формулу:
Снова строим таблицу, в которой присутствуют необходимые элементы формулы (табл. 17.7).
Таблица 17.7
№ |
x |
y |
xy |
x2 |
y2 |
1 |
1 |
1 |
1 |
1 |
1 |
2 |
1 |
6,5 |
6,5 |
1 |
42,25 |
3 |
2 |
1,5 |
3 |
4 |
2,25 |
4 |
3 |
7 |
21 |
9 |
49 |
5 |
3 |
2 |
6 |
9 |
4 |
6 |
3 |
7 |
21 |
9 |
49 |
7 |
4 |
3 |
12 |
16 |
9 |
8 |
4 |
6 |
24 |
16 |
36 |
9 |
4 |
4 |
16 |
16 |
64 |
10 |
5 |
7 |
35 |
25 |
49 |
11 |
6 |
3 |
18 |
36 |
9 |
12 |
6 |
9 |
54 |
36 |
81 |
13 |
7 |
3 |
21 |
49 |
9 |
14 |
7 |
8 |
56 |
49 |
64 |
15 |
8 |
5 |
40 |
64 |
25 |
16 |
8 |
8 |
64 |
64 |
64 |
17 |
9 |
3 |
27 |
91 |
9 |
18 |
9 |
8 |
72 |
81 |
64 |
19 |
10 |
5 |
50 |
100 |
25 |
20 |
10 |
8 |
89 |
100 |
64 |
|
= 110 |
= 105 |
= 636,5 |
= 776 |
= 719,5 |
Определяем коэффициент Пирсона:
_________________________________
Rxy = (20х636,5 – 11550) : √(20х776 - 12100) х (20х719,5 – 11025) =
____________________________ _________
= (12730 – 11550) : √(15520 – 12100) х (14390 – 11025) = 1180 : √3420 х 3365 = 1180 : √11508300 = 1180 : 3392,4 = 0,348.
Выбираем уровень значимости 0,05, количество степеней свободы равно 18, в таблице коэффициента корреляции (табл. 17.4) этим данным соответствует число 0,4438. У нас же получилось 0,348. Следовательно, наш новый коэффициент связи 0,31 не является статистически значимым. Уравнением Y = 0,31X + 3,5 мы выразили всего лишь случайную связь.
Даже если бы мы претендовали на 1 ошибку в 10 случаях, наш коэффициент связи все равно являлся бы статистически незначимым, так как таблица коэффициента корреляции дает в этом случае число 0,3783, которое больше получившегося у нас коэффициента Пирсона.
Сделаем вывод. Увеличение разброса точек снижает вероятность получения статистически значимого коэффициента связи между переменными. Можно сказать иначе, коэффициент Пирсона измеряет степень близости точек к линии, выражающей связь между интервальными переменными.
Проведя соответствующие расчеты, несложно показать, что в случае, когда все точки лежат точно на прямой, коэффициент Пирсона равен единице.