Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
ozz_otvety.doc
Скачиваний:
3085
Добавлен:
13.02.2016
Размер:
2.71 Mб
Скачать

18. Методы расчета коэффициента корреляции, их значение и практическое применение.

При корреляционной связи одной и той же величине одного признака соответствуют разные величины другого. Например: между ростом и весом имеется корреляционная связь, между заболеваемостью злокачественными новообразованиямии возрастом и т.д.

Существует 2 метода вычисления коэффициента корреляции: метод квадратов( Пирсона), метод рангов (Спирмена).

Наиболее точным является метод квадратов (Пирсона), при котором коэффициент корреляции определяется по формуле: , где

rху ― коэффициент корреляции между статистическим рядом X и Y.

dх ― отклонение каждого из чисел статистического ряда X от своей средней арифметической.

dу ― отклонение каждого из чисел статистического ряда Y от своей средней арифметической.

В зависимости от силы связи и ее направления коэффициент корреляции может находиться в пределах от 0 до 1 (-1). Коэффициент корреляции, равный 0, говорит о полном отсутствии связи. Чем ближе уровень коэффициента корреляции к 1 или (-1), тем соответственно больше, теснее измеряемая им прямая или обратная связь. При коэффициенте корреляции равном 1 или (-1) связь полная, функциональная.

Схема оценки силы корреляционной связи по коэффициенту корреляции

Сила связи

Величина коэффициента корреляции при наличии

прямой связи (+)

обратной связи (-)

Связь отсутствует

0

0

Связь малая (слабая)

от 0 до +0,29

от 0 до –0,29

Связь средняя (умеренная)

от +0,3 до +0,69

от –0,3 до –0,69

Связь большая (сильная)

от +0,7 до +0,99

от –0,7 до –0,99

Связь полная

(функциональная)

+1,0

–1,0

Для вычисления коэффициента корреляции по методу квадратов составляется таблица из 7 колонок. Разберем процесс вычисления на примере:

ОПРЕДЕЛИТЬ СИЛУ И ХАРАКТЕР СВЯЗИ МЕЖДУ

СОДЕРЖАНИЕМ ЙОДА В ВОДЕ И ПОРАЖЕННОСТЬЮ ЗОБОМ:

Содержание йода в мг в воде (Vx)

Пора-

жен-

ность

зобом

в %

(Vy)

dx = VxMx

dy = VyMy

dx dy

dx2

dy2

201

0,2

63

–3,6

–226,8

3969

0,04

178

0,6

40

–3,2

–128,0

1600

0,36

155

1,1

17

–2,7

–45,9

289

1,21

154

0,8

16

–3,0

–48,0

256

0,64

126

2,5

–12

–1,3

–15,6

144

6,25

81

4,4

–57

0,6

–34,2

3249

19,36

71

16,9

–67

13,1

–877,7

4489

285,61

Σ -1345,0

Σ 13996,0

Σ 313,47

1. Определяем среднее содержание йода в воде (в мг/л).

мг/л

2.Определяем среднюю пораженность зобом в %.

3. Определяем отклонение каждого Vx от Мx, т.е. dx.

201–138=63; 178–138=40 и т.д.

4. Аналогично определяем отклонение каждого Vу от Mу, т.е. dу.

0,2–3,8=-3,6; 0,6–38=-3,2 и т.д.

5. Определяем произведения отклонений. Полученное произведение суммируем и получаем.

6. dх возводим в квадрат и результаты суммируем, получаем.

7. Аналогично возводим в квадрат dу, результаты суммируем, получим

8. Наконец, все полученные суммы подставляем в формулу:

Для решения вопроса о достоверности коэффициента корреляции определяют его среднюю ошибку по формуле:

(Если число наблюдений менее 30, тогда в знаменателе n–1).

В нашем примере

Величина коэффициента корреляции считается достоверной, если не менее чем в 3 раза превышает свою среднюю ошибку.

В нашем примере

Таким образом, коэффициент корреляции не достоверен, что вызывает необходимость увеличения числа наблюдений.

Коэффициент корреляции можно определить несколько менее точным, но намного более легким способом ― методом рангов (Спирмена).

Метод Спирмена: P=1-(6∑d2/n-(n2-1))

составить два ряда из парных сопоставляемых признаков, обозначив первый и второй ряд соответственно х и у. При этом представить первый ряд признака в убывающем или возрастающем порядке, а числовые значения второго ряда расположить напротив тех значений первого ряда, которым они соответствуют

величину признака в каждом из сравниваемых рядов заменить порядковым номером (рангом). Рангами, или номерами, обозначают места показателей (значения) первого и второго рядов. При этом числовым значениям второго признака ранги должны присваиваться в том же порядке, какой был принят при раздаче их величинам первого признака. При одинаковых величинах признака в ряду ранги следует определять как среднее число из суммы порядковых номеров этих величин

определить разность рангов между х и у (d): d = х — у

возвести полученную разность рангов в квадрат (d2)

получить сумму квадратов разности (Σ d2) и подставить полученные значения в формулу: 

Пример:  методом рангов установить направление и силу связи между стажем работы в годах и частотой травм, если получены следующие данные:

Стаж работы в годах

Число травм на 100 работающих

до 1 года  1-2  3-4  5-6  7 и более

24  16  12  12  6

Обоснование выбора метода: для решения задачи может быть выбран только метод ранговой корреляции, т.к. первый ряд признака "стаж работы в годах" имеет открытые варианты (стаж работы до 1 года и 7 и более лет), что не позволяет использовать для установления связи между сопоставляемыми признаками более точный метод — метод квадратов.

Решение. Последовательность расчетов изложена в тексте, результаты представлены в табл. 2.

Таблица 2

Стаж работы в годах

Число травм

Порядковые номера (ранги)

Разность рангов

Квадрат разности рангов

X

Y

d(х-у)

d2

До 1 года

24

1

5

-4

16

1-2

16

2

4

-2

4

3-4

12

3

2,5

+0,5

0,25

5-6

12

4

2,5

+1,5

2,25

7 и более

6

5

1

+4

16

 

Σ d2 = 38,5

Каждый из рядов парных признаков обозначить через "х" и через "у" (графы 1—2).

Величину каждого из признаков заменить ранговым (порядковым) номером. Порядок раздачи рангов в ряду "x" следующий: минимальному значению признака (стаж до 1 года) присвоен порядковый номер "1", последующим вариантам этого же ряда признака соответственно в порядке увеличения 2-й, 3-й, 4-й и 5-й порядковые номера — ранги (см. графу 3).  Аналогичный порядок соблюдается при раздаче рангов второму признаку "у" (графа 4).  В тех случаях, когда встречаются несколько одинаковых по величине вариант (например, в задаче-эталоне это 12 и 12 травм на 100 работающих при стаже 3—4 года и 5—6 лет, порядковый номер обозначить средним числом из суммы их порядковых номеров. Эти данные о числе травм (12 травм) при ранжировании должны занимать 2 и 3 места, таким образом среднее число из них равно (2 + 3)/2 = 2,5.  Таким образом, числу травм "12" и "12" (признаку) следует раздать ранговые номера одинаковые — "2,5" (графа 4).

Определить разность рангов d = (х — у) — (графа 5)

Разность рангов возвести в квадрат (d2) и получить сумму квадратов разности рангов Σ d2 (графа 6).

Произвести расчет коэффициента ранговой корреляции по формуле:

где n — число сопоставляемых пар вариант в ряду "x" и в ряду "у"

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]