Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции ГМУ Документ Microsoft Word.doc
Скачиваний:
218
Добавлен:
14.05.2015
Размер:
1.64 Mб
Скачать

3. Понятие о методе ранговой корреляции

При изучении признаков с непрерывными и неизвестными законами распределения классические подходы корреляционного анализа неэффективны. В этих случаях для изучения тесноты связей применяют, например, метод ранговой корреляции.

Пусть дан вариационный ряд признака Х:. Рангом наблюдаемого значенияпризнакаХназывается номер этого наблюдения в вариационном ряду, т.е.R() =jпри условии, что неравенства строгие. Если встречаются одинаковые члены, то в качестве ранга берется среднее арифметическое соответствующих номеров. Например, сумма оценок, полученных студентами на двух экзаменах, образуют вариационный ряд: 5, 5, 5, 7, 8, 9, 10, 10. Ранг трех студентов в начале ряда (1 + 2 + 3) / 3 = 2 илиR(5) = 2;R(7) = 4,R(8) = 5,R(9) = 6,R(10) = (7 + 8) / 2 = 7,5.

При изучении связи между ХиYпредположим, что выборка упорядочена поХ. Тогда ей соответствует следующая матрица (подстановка):

,

в которой первая строка состоит из рангов наблюдений Х, а вторая из рангов наблюденийY.

Для изучения связи между ХиYиспользуют эти подстановки или ранги. Жесткой функциональной положительной связи междуХ иY соответствует подстановка:

,

а жесткой отрицательной связи подстановка:

.

Остальные n-2 подстановки получаются при той или иной степени связи.

Два элемента перестановки R() иR() инверсны (не образуют порядка), еслиR() стоит левееR(j) и больше его. Если при этом условииR() меньшеR(j), то инверсии нет, и они образуют порядок.

В качестве меры связи берут разность между суммами чисел порядков Nи чисел беспорядковQ, образованных элементами второй строки подстановки.

С помощью комбинаторики можно определить вероятности получения перестановок заданной меры связи. Например, для подстановок из четырех элементов рассмотрим расчетную таблицу:

Число порядков N

Число инверсий Q

Мера сходства

Подстановки

Вероятность

0

6

-6

4321

1/24

1

5

-4

3421, 4231, 4321

3/24

2

4

-2

3412, 4132, 4213, 2431, 3241

5/24

3

3

0

3214, 2413, 4123, 3142, 1432, 2341

6/24

4

2

2

2143, 1423, 2314, 3124, 1342

5/24

5

1

4

2134, 1324, 1243

3/24

6

0

6

1234

1/24

Из таблицы видно, что распределения вероятностей симметричны относительно центра =N Q = 0. Отсюда следует, что таблицы для решения задач проверки гипотез относительно меры сходства (или связи) можно давать для неотрицательных значений.

Коэффициент ранговой корреляции Кендалла определяется по формуле:

.

Коэффициент ранговой корреляции Спирмена определяется по формуле:

, где.

Пример 3. В таблице приведены данные о стаже работы (Х) и времени выполнения печати текста (Y) 10 машинисток. Вычислить коэффициенты ранговой корреляции Кендалла и Спирмена.

№ машинистки

Стаж, Х

Время выполнения задания, Y

1

32

12

2

15

24

3

16

23

4

18

21

5

20

20

6

28

9

7

21

11

8

29

10

9

23

15

10

17

16

Решение.Расположим пары наблюденийв порядке возрастанияХ, получаем таблицу:

Х

15

16

17

18

20

21

23

28

29

32

Y

24

23

16

21

20

11

15

9

10

12

По этой таблице составляем матрицу подстановок, в которой первая строка состоит из рангов наблюдений Х, а вторая –Y:

.

Подсчитываем меру сходства , приписывая числу инверсий, образуемых элементами второй перестановки (строки), знак минус. Так, например, для 10 имеем -9, для 6 – (2 – 5) = -3, …, для 4 – 1. Суммируя их, получаем= -31.

Вычисляем коэффициент ранговой корреляции Кендалла:

.

Вычисляем коэффициент корреляции Спирмена. Сначала вычисляем

;

.

Итак, связь между стажем машинистки и временем, затраченным на работу, можно считать доказанной, т.е. чем больше стаж, тем меньше затраты времени.

Коэффициент корреляции Спирмена и Кендалла можно рассчитать в пакете «Stadia».