- •7. Основы корреляционно-регрессионного анализа
- •Понятие корреляционной связи
- •Корреляционный анализ количественных переменных
- •Корреляционный анализ количественных переменными. Ограничения корреляционного анализа
- •Корреляционный анализ неколичественных переменных
- •Корреляционный анализ ранговых переменных
- •Коэффициент корреляции Спирмена
- •Изучение корреляционной связи между атрибутивными признаками
- •Для альтернативных признаков
- •Для атрибутивных признаков
Корреляционный анализ количественных переменных
x
y
27,068
172,17
29,889
200,90
33,158
232,10
34,444
231,83
37,299
246,53
37,554
236,99
37,755
233,40
37,909
256,43
38,348
261,89
39,137
259,36
40,370
253,62
46,298
278,87
между количественными переменными.
Для выявления наличия и характера корреляционной связи между двумяколичественными признаками в статистике используется рядметодов.
1. Рассмотрение параллельных данных(значенийxиyв каждой изnединиц). Единицы наблюдения необходимо расположить по возрастанию значений факторного признаках(как в таблице справа) и затем сравнить с ним (визуально) поведение результативного признакау.
В нашей задаче в 6 случаях по мере увеличения значений xувеличиваются и значенияy, а в 5 случаях этого не происходит, поэтому затруднительно говорить о прямой связи междухиу.
2. Графический метод– это графическое изображение корреляционной зависимости. Для этого, имеяnвзаимосвязанных пар значенийxиyи пользуясь прямоугольной системой координат, каждую такую пару изображают в виде точки на плоскости с координатамиxиy. Совокупность полученных точек представляет собойкорреляционное поле(рис. 1), а соединяя последовательно нанесенные точки отрезками, получают ломаную линию, именуемуюэмпирической линией регрессии (рис. 2).
Рис. 1. Корреляционное поле Рис. 2. Эмпирическая линия регрессии
По характеру расположения точек на поле корреляции делаютвывод о наличии или отсутствии связи, о характере связи (линейнаяили нелинейная), а если связь линейная- то прямая или обратная).В нашей задаче эмпирическая линия регрессии (рис.2) похожа на восходящую прямую, что позволяет выдвинуть гипотезу о наличии прямой линейной зависимости между величиной стоимостного внешнеторгового товарооборота и величиной таможенных платежей в федеральный бюджет.
3. Метод аналитических группировокиспользуется при большом числе наблюдений для выявления корреляционной связи между двумя количественными признаками. Метод аналитических группировок может также применяться, если значения фактораX–ранговые признаки.
Чтобы выявить наличие корреляционной связи между двумя количественными признаками, проводится группировка единиц совокупности по факторному признаку хи для каждой выделенной группы рассчитывается среднее значение результативного признака(можно рассчитать и среднее значение факторного признака). Если результативный признакузависит от факторногох, то в изменении среднего значениябудет прослеживаться определенная закономерность.
В последнем столбце таблицы приведены средние величины, рассчитанные на основе индивидуальных данных о размерах таможенных отдельных предприятий каждой группы. Данные таблицы свидетельствуют, что чем крупнее товарооборот, тем меньше доля издержек обращения.
|
Аналитическая таблица и эмпирическая линия регрессии показывают, что при увеличении Xсредние значенияYтакже увеличиваются, что свидетельствует о наличии прямой связи междуXиY.
4. Коэффициент корреляции знаков (Фехнера)– простейший показатель тесноты связи, основанный на сравнении поведения отклонений индивидуальных значений каждого признака (xиy) от своей средней величины. При этом во внимание принимаются не величины, а их знаки («+» или «–»). Определив знаки отклонений от средней величины в каждом ряду, рассматривают все пары знаков и подсчитывают число их совпадений (С) и несовпадений (Н). Коэффициент Фехнерарассчитывается как отношение разности чисел пар совпадений и несовпадений знаков к их сумме, т.е. к общему числу наблюдаемых единиц:
. (1)
Коэффициент Фехнера может принимать значения от 0 до 1. Однако, еслиКФ=±1, то это ни в коей мере нельзя воспринимать как свидетельство функциональной зависимости междухиу.
Еслито корреляционная связь междуXиYпрямая;
прикорреляционная связь междуXиYобратная;
прикорреляционная связь междуXи отсутствует.
Теснота связи (сила связи) определяется по шкале Чеддока.
Рассчитаем коэффициент Фехнера для наших данных.
;.
В двух последних столбцах следующей таблицы приведены знаки отклонений каждого хиуот своей средней величины. Число совпадений знаков – 10, а несовпадений – 2.
Вспомогательная таблица для расчета коэффициента Фехнера
№ п/п |
x |
y |
x – |
y – |
1 |
27,068 |
172,17 |
– |
– |
2 |
29,889 |
200,90 |
– |
– |
3 |
33,158 |
232,10 |
– |
– |
4 |
34,444 |
231,83 |
– |
– |
5 |
37,299 |
246,53 |
+ |
+ |
6 |
37,554 |
236,99 |
+ |
– |
7 |
37,755 |
233,40 |
+ |
– |
8 |
37,909 |
256,43 |
+ |
+ |
9 |
38,348 |
261,89 |
+ |
+ |
10 |
39,137 |
259,36 |
+ |
+ |
11 |
40,370 |
253,62 |
+ |
+ |
12 |
46,298 |
278,87 |
+ |
+ |
Итого |
439,229 |
2864,09 |
|
|
Тогда определяем коэффициент корреляции знаков (Фехнера):
КФ=
Обычно такое значение показателя тесноты связи характеризует заметную прямую зависимость между xиy, однако, следует иметь в виду, что посколькуКФ зависит только от знаков и не учитывает величину самих отклоненийхиуот их средних величин, то он практически характеризует не столько тесноту связи, сколько ее наличие и направление.