- •Институт социальных и гуманитарных знаний
- •Isbn удк ббк
- •Раздел 1
- •Основы методологии статистики
- •Раздел 1 – выводы
- •Раздел 2
- •Основные вопросы организации статистической отчетности
- •3Адание:
- •Раздел 2 – выводы
- •Раздел 3
- •Тема 10
- •Тема 11__________________________________________________________
- •Тема 12
- •Тема 13
- •Раздел 3 – выводы
- •Раздел 4
- •Тема 14
- •Тема 15
- •Тема 16
- •Раздел 4 – выводы
- •Раздел 5
- •Тема 17
- •Тема 18
- •Тема 19
- •Раздел 5- выводы
- •Раздел 6
- •Индексы
- •Тема 20
- •Особенности индексного метода
- •Тема 21________________________________
- •Тема 22
- •Агрегатные и средние индексы
- •Тема 23
- •Раздел 6- выводы
- •Раздел 7_______________________________________
- •Раздел 7 пособия ознакомит вас с некоторыми положениями регрессионно - корреляционного анализа взаимосвязей процессов и явлений, составляющего важную познавательную задачу статистики.
- •Тема 24
- •Тема 25
- •Тема 26
- •3 А д а н и е
- •3 А д а н и е
- •Тема 27.Методы факторного анализа и многомерной классификации
- •Раздел 7-выводы
- •Значения t-критерия Стьюдента (двухсторонний критерий)
- •Литература.
Тема 26
КОРРЕЛЯЦИЯ РАНГОВ И АТРИБУТИВНЫХ ПРИЗНАКОВ
После изучения этой темы вы сможете:
1. объяснить методику расчетов коэффициентов ранговой корреляции
К. Спирмена и М. Кендэла
2. провести практические расчеты этих коэффициентов
3. иметь представление о корреляционных связях атрибутивных признаков;
4. объяснить методику расчета коэффициентов ассоциации, контингенции, коллигации и сопряженности и практически осуществить такие расчеты.
Пусть n объектов совокупности N пронумерованы в порядке возрастания или убывания какого-то признака х, то есть они ранжированы по этому признаку. Ранг указывает то место , которое занимает объект среди других объектов. Это очень распространенная задача. Для такого рода ранжированных объектов показателями связи служат коэффициенты корреляции рангов. Наибольшее распространение из них получили коэффициенты К. Спирмена и М. Кендэла
Коэффициент корреляции рангов К. Спирмена (ρ) основан на рассмотрении разности рангов значений признаков.
Ρ = 1 – (6Σd)/(n(n-1))
Где n – число сопоставимых пар; d – разность между рангами (порядковыми номерами) в двух рядах. Этот коэффициент понимается так же, как и коэффициент линейной корреляции, имеет те же свойства и пределы изменения. В отличии от коэффициентов линейной корреляции он относится к так называемым непараметрическим методам корреляционного анализа и может применяться при любой форме распределения и для любых признаков.
Коэффициент ранговой корреляции М. Кендэла (r) вычисляется так:
R = (2S)/(n(n-1))
где S - алгебраическая сумма числа высших рангов по отношению к каждому низшему рангу, взятому последовательно как значение у и сопоставленному с рядом значений х в восходящем и нисходящем порядках. Эту величину можно представить как Р + Q При определении слагаемого Р нужно установить, сколько чисел, находящихся справа от каждого из элементов последовательности рангов переменной у, имеют величину ранга, превышающую ранг рассматриваемого элемента. Суммируя полученные таким образом числа, мы определим Р, которое можно рассматривать как меру соответствия последовательности рангов переменной у последовательности рангов переменной x. Второе слагаемое Q характеризует степень несоответствия последовательности рангов переменной у последовательности рангов переменной х. Чтобы определить Q, подсчитываем, сколько чисел, находящихся справа от каждого из членов последовательности рангов переменной у, имеют ранг меньше, чем этот фактор. Такие величины берутся со знаком минус. Коэффициент М.Кендэла изменяется в тех же пределах (от -1 до +1) и равен нулю при отсутствии связи между рядами рангов. Между коэффициентами ранговой корреляции К. Спирмэна и М. Кендэла при достаточно большом числе наблюдений справедливо следующее соотношение:
ρ= 3/2r
Приведем пример расчета обоих коэффициентов корреляции рангов на условных данных.
Таблица 24
-
X
У
Rx
Ry
Rx - Ry
(Rx - Ry)
201
0,2
1
1
-6
36
178
0,6
2
6
-4
16
155
1,1
3
4
-1
1
154
0,8
4
5
-1
1
126
2,5
5
3
+2
4
81
4,4
6
2
+4
16
71
16,9
7
1
+6
36
п = 1
-
-
-
-
ПО
Определим коэффициент К. Спирмэна:
ρ = 1 – (6*110)/(7(49-1))
Для вычисления коэффициента М. Кендэла определим величины Р и Q. Р - величина, вычисляемая для каждого ранга второго ряда (если первый ряд ранжирован строго в порядке возрастания вариант) как сумма последующих рангов, больших по своей величине, чем взятый ранг. Так, число рангов, превышающих ранг 7, равно 0, ранг 6 - равно 0 и т.д.
Р=0+0+ 1 +0 + 0 + 0 = 1.
Для вычисления Q необходимо для каждого ранга второго ряда определить число последующих рангов, меньших по своей величине, чем взятый ранг, и просуммировать их:
Q = (-6) + (-5) + (-3) + (-3) + (-2) + (-1) = -20.
Следовательно, r = -0,905.
Оба коэффициента показывают высокую степень отрицательной (обратной) связи между взятыми признаками, и вполне логично, что первый коэффициент оказался несколько выше.