Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Скачиваний:
101
Добавлен:
10.06.2015
Размер:
414.21 Кб
Скачать

3.4.2. Коэффициенты корреляции рангов

Наряду с линейным коэффициентом корреляции r для измерения тесноты связи между двумя коррелируемыми признаками используются менее точные, но более простые по расчету непараметрические показатели: коэффициент Фехнера, коэффициенты корреляции рангов (или ранговые коэффициенты корреляции) Спирмэна иКендэла , которые основаны на корреляции не самих значений коррелируемых признаков, а ихрангов.

Ранг – это порядковый номер, присваиваемый каждому индивидуальному значению х и у (отдельно) в ранжированном ряду.

Ранжирование – это процедура упорядочения объектов изучения, которая выполняется на основе предпочтения.

Правила ранжирования:

  • оба признака необходимо ранжировать (нумеровать) в одном и том же порядке: от меньших значений к большим (и наоборот);

  • если встречается несколько одинаковых значений х (или у), то каждому из них присваивается ранг, равный частному от деления суммы рангов (суммы мест), приходящихся на это значение, на число равных значений (например, если за рангом 3 следуют три равных значений признака, то им всем присвоится ранг 5, т.к. (4 + 5 + 6) / 3 = 5);

  • ранги признаков х и у обозначаются символами и(иногдаи).

Суждение о связи между изменениями значений х и у основано на сравнении поведения рангов по двум признакам параллельно:

  • если у каждой пары х и у ранги совпадают, это характеризует максимально тесную прямую связь;

  • если же наблюдается полная противоположность рангов, т.е. в одном ряду ранги возрастают от 1 до n, а в другом – убывают от n до 1, это максимально возможная обратная связь.

Коэффициент корреляции рангов Спирмэна () (применяется обычно на начальном этапе выявления связи между изучаемыми показателями иможет быть использован для определения связи как между количественными, так и между качественными признаками при условии, если их значения можно упорядочить или проранжировать).

Коэффициент Спирмэна рассчитывается так:

  • значения признаков х и у нумеруют (отдельно) в порядке возрастания от 1 до n, т.е. им присваивают определенный ранг (и) – порядковый номер в ранжированном ряду;

  • для каждой пары рангов находят их разность d = ;

  • вычисляют квадраты этих разностей ;

  • вычисляют коэффициент корреляции рангов Спирмэна по одной из формул

или . (16)

Коэффициент корреляции рангов Спирмэна может принимать следующие значения:

(17)

(ср. с r). Следует иметь в виду, что, поскольку коэффициент Спирмэна учитывает разность только рангов, он менее точен по сравнению r. Поэтому его крайние значения (1 или 0) нельзя безоговорочно расценивать как свидетельство функциональной связи или полного отсутствия зависимости между х и у.

Пример. Расчет коэффициента корреляции рангов Спирмена по данным о часовой оплате труда х и уровне текучести кадров у (таблица 5).

Значения х располагаем по возрастанию, поэтому и значения располагаются по порядку возраста. Если бы значенияу для соответствующих значений х в первых двух строках таблицы располагались «правильно», то они стояли бы в таком порядке: 35, 34, …, но фактическое их расположение – 34. 35, … Поэтому для них не 8, 7, …, а 7, 8, и т.д. (ср. также строки 5 и 6). Для данного примера= – 0,952, что свидетельствует осильной обратной связи между х и у.

Таблица 5

х

у

Ранги

Разность рангов

d=

30

34

1

7

–6

36

40

35

2

8

–6

36

50

33

3

6

–3

9

60

28

4

5

–1

1

70

20

5

3

2

4

80

24

6

4

2

4

90

15

7

2

5

25

100

11

8

1

7

49

n = 8

=164

Коэффициент корреляции рангов Кендэла () (может быть использован для определения связи как между количественными, так и между качественными признаками, характеризующими однородные объекты, ранжированные по одному признаку).

или , (18)

где S – сумма положительных и отрицательных баллов.

Расчет коэффициента выполняется в следующей последовательности:

  1. Ранги х) располагаются строго впорядке возрастания.

  2. Значения у располагаются в порядке, соответствующем значениям х.

  3. Параллельно записывают соответствующее каждому значению значение(см. пример к вычислению коэффициента).

  4. Устанавливается мера соответствия последовательности «правильному» следованию(напоминаем,расположены строго по возрастанию):

а) для каждого последовательно определяют число следующих за ним рангов,превышающих его значение, т.е. определяют «правильное» следование, и они учитываются со знаком «+», а их сумма обозначается буквой P;

б) для каждого последовательно определяют число следующих за ним рангов,меньших по значению, т.е. определяют «неправильное» следование, и они учитываются со знаком «–», а их сумма обозначается буквой Q.

  1. Определяется сумма баллов по всем членам ряда, т.е. S=P+Q.

  2. Вычисляется по (18).

Пример. По 10 хозяйствам имеются данные об урожайности картофеля у (ц/га) и о количестве внесенных на 1 га удобрений х (кг). Необходимо измерить тесноту связи между изменениями х и у с помощью коэффициента корреляции рангов Кендэла (табл. 6).

Таблица 6

х

у

Ранги

Подсчет баллов

«+»

«–»

1

2

3

4

5

6

138

218

1

1

9

0

175

240

2

3

7

1

190

232

3

2

7

0

196

280

4

6

4

2

200

260

5

4

5

0

235

310

6

9

1

3

250

290

7

7

2

1

260

278

8

5

2

0

275

300

9

8

1

0

290

320

10

10

n=10

P=38

Q=–7

Рассмотрим примеры определения значений в столбцах 5 и 6.

В первой строке столбца 5 стоит число «9», как оно получено?

Обращаемся к первой строке столбца 4, т.е. к значениям : там стоит число «1». Как видим, в этом столбцевсе последующие значения больше «1», т.е. число значений, превышающих «1», равняется 9 = 10 – 1. Поэтому в первой строку столбца 5 ставим число «9».

В первой строке столбца 6 стоит число «0».

Обращаемся к первой строке столбца 4, т.е. к значениям : там стоит число «1». Как видим, в этом столбцевсе последующие значения больше «1», т.е. число значений, меньших «1», равняется 0 = 9 – 9. Поэтому в первой строку столбца 6 ставим число «0».

Например, в четвертой строке столбца 5 стоит число «4», которое получено из следующих рассуждений.

Обращаемся к четвертой строке столбца 4, т.е. к значениям : там стоит число «6». Как видим, в этом столбце изпоследующих значений 9, 7, 8, 10 (всего 4 значения)больше «6», поэтому в четвертую строку столбца 5 ставим число «4».

Во второй строке столбца 6 стоит число «2», оно получено так.

Обращаемся ко второй строке столбца 4, т.е. к значениям : там изпоследующих значений числа 4 и 5 (всего 2 значения)меньше «6». Поэтому в четвертую строку столбца 6 ставим число «2».

Рассуждая подобным образом, находим все значения в столбцах для «+» и «–».

Далее вычисляем P = 38 и Q = –7, т.е. S=P+Q = 38 – 7 = 31, и = 0,69; полученное значениехарактеризует довольно большую (выше среднего) тесноту связи между изменениямих и у.

Заметим, рассчитывается аналогично и для случая противоположной напрвленности ранговх и у.

Преимущества коэффициентов корреляции рангов Спирмэна и Кендэла:

  • они легко вычисляются;

  • могут быть использован для определения связи как между количественными, так и между качественными признаками;

  • не требуется знать форму связи изучаемых явлений.

Коэффициент конкордации (Wмножественный коэффициент ранговой корреляции) применяется в тех случаях, когда число ранжируемых признаков (факторов) больше двух и вычисляется по следующей формуле

, (19)

где S – сумма квадратов отклонений суммы m рангов от их средней

величины;

m – число ранжируемых признаков;

n – число ранжируемых единиц (число наблюдений).

Коэффициент конкордации W может принимать следующие значения:

; (20)

применяется особенно часто в экспертных оценках, например, для того, чтобы определить степень согласованности мнений экспертов о важности того или иного оцениваемого показателя или составить рейтинг отдельных единиц по какому-либо признаку.

Соседние файлы в папке регрессия_Лекции_10-11