Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Kurs_lekcij_dlya_distancionnogo_obucheniya (1).doc
Скачиваний:
42
Добавлен:
13.08.2019
Размер:
2.93 Mб
Скачать

6.4. Ранговая корреляция

Если n вариантов ряда расположены в соответствии с возрастанием или убыванием признака х, то говорят, что объекты ранжированы по этому признаку. Ранг для хi указывает место, которое занимает i-е значение признака среди других n значений признака х (i=1,2,..n).

Например, при исследовании рынка можно задаться целью выяснения предпочтений потребителей при выборе товара (при покупке акций, мороженного, водки и т.п.), таким образом, чтобы они распределили товар в порядке возрастания (или убывания) своих потребительских предпочтений. Если имеется два набора ранжированных данных, то можно установить степень линейной зависимости между ними. Предположим имеется 5 продуктов, которые ранжированы по порядку предпочтений от 1 до 5 в соответствии с двумя характеристиками А и В.

Характеристики

для ранжирования

Продукты

V W X Y Z

A

B

2 5 1 3 4

1 3 2 4 5

Для определения наличия взаимосвязи между ранговыми оценками используется коэффициент ранговой корреляции Спирмена. Его расчет основан на различиях между рангами.

Обозначим D= ранг A – ранг B

Коэффициент Спирмена равен: ,

где n – число пар ранжированных наблюдений.

В нашем примере мы имеем пять пар рангов, следовательно, n = 5. Cумма D2 равна:

(2-1)2 + (5-3)2 + (1-2)2 + (3-4)2 + (4-5)2=1+4+1+1+1=8

Коэффициент Спирмена равен:

То есть мы нашли достаточно сильную линейную связь. Коэффициент Спирмена изменяется в интервале от [-1; 1] и интерпретируется так же как и коэффициент Пирсона. Разница лишь в том. что он вычисляется для ранжированных данных.

Значимость коэффициента Спирмена проверяется на основе t критерия Стьюдента по формуле: . (12).

Значение коэффициента считается существенным, если tрасч. > tкрит. (; k = n-2).

6.5. Корреляция альтернативных признаков

Альтернативные признаки – это признаки, принимающие только два возможных значения. Исследования их корреляции основано на показателях, построенных на четырехклеточных таблицах, в которые сводятся значения признаков.

a

b

c

d

Например, требуется измерить связь между прививками от гриппа и снижением заболеваемости гриппом в группе случайно выбранных студентов.

Заболели

Не заболели

Итого

Привитые

30

20

50

Не привитые

15

5

20

Итого

45

25

70

Вопрос: существует ли связь между заболеваемостью и прививками?

Решение

Для измерения тесноты взаимосвязи признаков производится расчет коэффициента контингенции по формуле:

(13)

Коэффициент контингенции принимает значения на интервале [-1; 1]. Интерпретация аналогична коэффициенту корреляции. Мы получили слабую отрицательную связь, то есть

Другой метод измерения связи основан на расчете коэффициента ассоциации:

(14)

Минус перед коэффициентом говорит об обратном направлении связи, чем больше прививок, тем меньше заболеваний.

Коэффициент контингенции всегда бывает меньше коэффициента ассоциации и дает более корректную оценку тесноты связи.

Задача В результате обследования работников предприятия получены следующие данные (чел.)

Образование

Удовлетворены работой

Не удовлетворены работой

Итого

Высшее и среднее

300

50

350

Незаконченное среднее

200

250

450

Итого

500

300

800

Требуется оценить тесноту взаимосвязи между уровнем образования и удовлетворенностью своей работой с помощью коэффициентов контингенции и ассоциации.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]