Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика_теория.doc
Скачиваний:
23
Добавлен:
17.09.2019
Размер:
3.64 Mб
Скачать

Примеры на ранговые корреляции

Пример 1. Оценить тесноту связи между экспертными оценками шансов депутатов на этапе предвыборной компании и результатами выборов в городскую Думу.

Порядковый номер кандидата в депутаты

Ранг кандидатов по оценке экспертов

Ранг депутатов по числу поданных голосов на выборах

Разность рангов

1

7

5

2

4

2

4

6

2

4

3

1

2

1

1

4

3

7

4

16

5

10

8

2

4

6

5

3

2

4

7

9

10

1

1

8

2

1

1

1

9

8

9

1

1

10

6

4

2

4

Итого

-

-

-

40

Решение. Расчет коэффициента рангов Спирмэна

.

Можно предположить наличие достаточно тесной прямой зависимости между оценками экспертов аналитического центра на стадии предвыборной компании и результатами выборов.

Пример 2. По данным примера 1 определить величину коэффициента корреляции рангов Кендэла.

Решение. Упорядочить ранги по х

Экспертные оценки (х)

1

2

3

4

5

6

7

8

9

10

Результат выборов (у)

2

1

7

6

3

4

5

9

10

8

Расчет P=35=(8+8+3+3+5+4+3+1).

Расчет Q=-10= (-1, 0, -4, -3, 0, 0, 0, -1, -1).

Отсюда .

13.5 Множественная и частная корреляция

В предыдущем материале по теме рассматривалась зависимость между двумя признаками, т.е. речь шла о так называемой парной корреляции. На практике чаще всего приходится рассматривать корреляционную связь одновременно между тремя и более признаками. В таких случаях изучение корреляционной связи не может ограничиваться парными зависимостями; в анализ необходимо включить другие признаки-факторы, также существенно влияющие на формирование и развитие зависимого признака. Одновременное изучение корреляции нескольких признаков (больше двух) проводится на основании использования методов множественной корреляции. Например, уровень фондоотдачи, как известно, зависит от размеров предприятия, удельного веса активной части, форм воспроизводства основных производственных фондов, степени изношенности их и ряда других факторов-признаков.

Для измерения степени тесноты связи между изменениями величин результативного признака у и изменениями значений факториальных признаков вычисляется коэффициент множественной (совокупной) корреляции.

Величина совокупного коэффициента корреляции для случая зависимости результативного признака от двух факторных признаков исчисляется по формуле

.

В данной формуле символ «0» присвоен результативному признаку y, а символ «1», и «2» соответствует номерам факторов-признаков. Т.е. - коэффициенты корреляции между изменениями первого факторного признака и результативным признаком у, и результативным признаком у, между факторными признаками и . Как видели выше, эти коэффициенты в теории корреляции называются парными коэффициентами корреляции.

Величина называется коэффициентом детерминации для множественной корреляции и показывает в какой мере вариация результативного признака у обусловлена влиянием изучаемых признаков факторов (обычно в процентах после умножения на 100).

Величина коэффициента множественной корреляции изменяется в пределах от 0 до 1 и численно не может быть меньше, чем любой из образующих его парных коэффициентов корреляции. Чем ближе совокупный коэффициент корреляции к единице, тем меньше роль неучтенных в модели факторов и тем больше оснований считать, что данная модель эффективно отражает реальную действительность.

Для исчисления коэффициента множественной корреляции в общем случае (большом числе факторов) используются матрицы парных коэффициентов корреляции и коэффициент множественной детерминации. А коэффициент множественной детерминации определяется по следующей формуле

.

Взаимная зависимость между факторами-признаками называется мультиколлинеарностью и в качестве критерия мультиколлинеарности принимаются следующие неравенства

,

.

Если из этих неравенств не выполняется хотя бы одно, то из модели необходимо исключить один из признаков-факторов ( или ), связь которого с результативным признаком у будет менее тесной. Однако при этом необходимо помнить, что окончательный вывод о наличии или отсутствии мультиколлинеарности должен быть сделан в соответствии с теорией и логикой взаимосвязи между конкретными факторными признаками.

Для более глубокого исследования множественной корреляции необходимо установить степень тесноты связи между результативным признаком у и каждым из факторных признаков при исключении влияния других факторных признаков.

Для решения этой задачи определяются так называемые коэффициенты частной корреляции, выявляющие степень «чистого» влияния факторного признака на результативный признак. Для исчисления частных коэффициентов корреляции могут быть использованы парныекоэффициенты корреляции:

,

,

где и - соответственно частный коэффициент корреляции между результативным признаком у и фактором и при элиминировании влияния другого фактора ( или ).

Коэффициент частной корреляции, следовательно, отражает какую часть колеблемости у от влияния всех факторов вызывает рассматриваемый фактор при исключении влияния других.

Для общего случая частные коэффициенты корреляции можно определить по формуле

,

где - коэффициент детерминации результативного признака у с комплексом факторных признаков ;

- коэффициент детерминации результативного признака у с набором признаков-факторов ;

- частный коэффициент корреляции у с факторным признаком при исключении влияния других факторов .

При расчете набора всех частных коэффициентов корреляции m последовательно изменяется от первого до последнего фактора включительно.

Изложенные выше положения множественной корреляции рассмотрим на учебном примере. Необходимо отметить, что теория корреляции располагает рядом других подходов для решения задач изучения множественной корреляции: расчет коэффициента множественной корреляции как отношения дисперсии отклонений эмпирических значений от расчетных значений по уравнению множественной регрессии результативного признака к дисперсии эмпирических значений результативного признака (формула будет приведена ниже), расчеты коэффициентов эластичности , стандартизированных частных коэффициентов регрессии, - коэффициентов и - коэффициентов и др.

Итак, расчет коэффициента множественной корреляции между зависимым признаком у и многими независимыми признаками-факторами на базе уравнения множественной регрессии может осуществляться по формуле

,

где у – эмпирические значения результативного признака у;

- средняя величина результативного признака;

- теоретические значения результативного признака у, рассчитанные по уравнению множественной регрессии;

- дисперсия эмпирических значений результативного признака;

- дисперсия отклонений эмпирических значений относительно теоретических значений результативного признака.

Пример. Изучить производительность труда (выработки за смену) от продолжительности внутрисменных простоев и длительности производственного стажа.

Решение.

1) Исходные данные, расчет промежуточных результатов для определения парных коэффициентов корреляции, коэффициента множественной корреляции и коэффициентов частной корреляции представим таблично (см. ниже).

2) Расчет средних величин

шт; шт; года.

3) Расчет парных коэффициентов корреляции

Между факторами имеется значительная обратная взаимосвязь. Исходя из условия и видим нарушение первого условия и строго говоря фактор необходимо исключить из регрессионной модели.

Для учебных целей этого не сделаем. Сохраним модель в первоначальном виде по формальным соображениям.

4) Расчет коэффициента множественной корреляции

,

без учета знака.

Табельный номер рабочего

Выработка изделий за смену в штуках у

Продолжительность внутрисменных простоев в минутах

Длительность производственного стажа в годах

№51

390

19

3

-4

5

-1

-20

4

-5

16

25

1

№52

387

15

2

-7

1

-2

-7

14

-2

49

1

4

№53

389

17

3

-5

3

-1

-15

5

-3

25

9

1

№54

401

11

5

7

-3

1

-21

7

-3

49

9

1

№55

394

14

5

0

0

1

0

0

0

0

0

1

№56

394

12

4

0

-2

0

0

0

0

0

4

0

№57

395

16

3

1

2

-1

2

-1

-2

1

4

1

№58

391

13

5

-3

-1

1

3

-3

-1

9

1

1

№59

404

10

6

10

-4

2

-40

20

-8

100

16

4

№60

395

13

4

1

-1

0

-1

0

0

1

1

0

Итого

-

-

-

70

14

, .

5) Расчет частных коэффициентов корреляции

;

.