Статистика / СТАТ. Учебник для вузов
.pdf(однофакторным) анализом, а двух и больше факторов – многофакторным. Среди множества функций чаще всего в парном анализе используют наиболее простую и надежную линейную функцию:
|
+а1 X |
|
Y = ао |
(8.11) |
где а0 и а1 - параметры искомой прямой линии, которые определяются способом наименьших квадратов.
Методика расчета и использования линейного уравнения регрессии приведена в п.6.4. «Тенденции развития и прогнозирования рядов динамики».
Для оценки тесноты связи между факторным и результаным показателем при линейной зависимости используют линейный коэффициент корреляции:
|
r = |
|
|
- |
|
× |
|
|
|
|
|
XY |
X |
Y |
|
||||||
|
|
σ xσ y |
|
|||||||
|
xy |
(8.12) |
||||||||
|
|
|
||||||||
где X - факторный показатель (аргумент); |
|
|||||||||
Y – |
результатный показатель (функция); σx и σy - |
|||||||||
средние |
квадратические отклонения значений |
X и Y; |
|
|
∑ (XY)f |
|
|
|
∑(Xf ) |
|
|
|
∑(Yf ) |
|
|
|
; X = |
|
|
|
||||||
XY = |
∑f |
∑f |
; Y = |
∑f . |
|||||||
|
|
|
|||||||||
|
|
|
|
|
|
211 |
|
|
|
|
Значение коэффициента корреляции rхy
колеблются от-1 (случай полной обратной связи) до +1 (случай полной прямой связи). Чем ближе значение rхy к
единице, тем более тесная связь, чем ближе rхy к нулю,
тем слабее связь. При r < 0.30 связь считается слабой, при r = 0.3-0.7 – средней, при r > 0.7-0.9 – сильной, при r > 0.9 –
очень сильной (тесной).
Для нелинейной формы зависимости теснота связи определяется при помощи корреляционного отношения:
η = |
σ2 |
, |
|
x |
(8.13) |
||
|
σ2 |
|
|
|
y |
|
|
где σ2y − общая дисперсия результатного показателя,
которая зависит от вариации всех факторов; σ2х − факторная
дисперсия, которая зависит от вариации лишь отобранных для уравнения регрессии факторных
|
|
|
∑(Y − Y ) |
f |
|
|
|||
|
σ2 |
= |
ˆ |
|
2 |
|
, |
|
ˆ |
|
∑f |
|
|
|
|||||
показателей; |
x |
|
|
|
|
где |
Yx - теоретические |
(расчетные) значения результатного показателя, которые получены по уравнению регрессии; Y – среднее значение
212
результатного показателя, вычисленное по фактическим (исходным) данным;
|
|
|
∑ (Yi − |
|
)2 f |
|
|
|
2 |
= |
Y |
|
Y |
||
f - весы; |
σy |
∑ f |
, где |
||||
|
|
i - фактические |
(исходные) значения результатного показателя. Отношение факторной дисперсии к общей, то есть
σ2x
σ2y характеризует тесноту корреляционной связи. Это
отношение показывает, какую часть общей вариации результатного показателя составляет вариация факторов, которые отобраны для уравнения регрессии.
Корреляционное отношение (η ) изменяется от 0 до 1.
Чем ближе η к 1, тем более тесной является корреляционная связь. При η = 1 связь является полной,
функциональной. При η = 0 связь отсутствует.
Проверка существенности корреляционной связи
основывается на сравнении фактической величины η 2 с
так называемой критической. Существуют таблицы критических значений η 2 . Если фактическая величина
213
η 2 |
больше критической, то |
связь считается |
существенной. |
|
|
|
Корреляционное отношение |
используют для |
измерения тесноты связи как показателей однофакторного уравнения регрессии, так и многофакторного.
В многофакторном КРА на практике также чаще всего применяют простое и надежное линейное
уравнение множественной регрессии:
|
ˆ |
= a0 + a1X1 + a2X2 + ... + an Xn , (8.14) |
|
Y |
|
где |
ˆ |
результатный, функциональный показатель |
Y – |
(зависимая переменная); X1, X2,..., Xn - факторные показатели, факторы, которые определяют величину
результатного |
показателя |
(независимые переменные); |
a0 , a1..., an |
- параметры |
регрессионного уравнения, |
которые обычно определяются способом наименьших квадратов.
Выбор оптимальной формы связи и факторов регрессионного уравнения производится на основе совместного, комплексного использования качественного (содержательного) и количественного (числового) анализа. В количественном анализе применяются
214
коэффициенты |
множественной |
(многофакторной) |
|
детерминации R2 и корреляции |
R, F - |
критерий |
|
Фишера, t – критерий Стьюдента, критерии К. |
Пирсона, |
А. А. Чупрова, Г. Крамера, П. Хьюбера и многих других. При этом еще в 1934 г. норвежский экономист Рагнар Фриш обратил внимание на недопустимость использования в регрессионных моделях излишнего количества второстепенных, несущественных факторов.2
Коэффициент множественной детерминации определяют по формуле:
|
σ2 |
|
|
R 2 = |
ˆ |
|
|
Y |
, |
|
|
|
|
||
|
σY |
(8.15) |
|
|
2 |
|
где σ2 - факторная дисперсия результатного показателя,
ˆ
Y
которая получена по теоретическим (расчетным) значениям многофакторного уравнения регрессии; чаще всего – это линейное уравнение множественной регрессии
(8.14); σ2y - общая дисперсия результатного показателя.
2 Frisch R.A. Statistical confluence analysis by means of complete regression
systems. – T ubingen, 1934.
215
Коэффициент множественной детерминации – это отношение факторной дисперсии к общей. Как и в случае парной корреляции, он показывает, какую часть общей вариации результатного показателя составляет вариация факторов, которые отобраны для уравнения регрессии.
Корень квадратный из коэффициента множественной детерминации называют коэффициентом
(индексом) корреляции:
|
|
|
|
|
|
σ2 |
|
||
|
|
R = |
R 2 = |
1 − |
|
||||
|
|
|
(x ) |
, |
|
||||
|
|
|
|
|
|||||
|
|
|
|
|
|
σY |
(8.16) |
||
|
|
|
|
|
|
|
2 |
|
|
где |
σ(2x) |
= σY2 − σ2ˆ |
- остаточная |
дисперсия, |
то есть |
||||
|
|
Y |
|
|
|
|
|
|
|
разность (остаток) между общей и факторной дисперсией. Для проверки надежности коэффициентов детерминации и корреляции чаще всего используют t –
критерий Стьюдента и F – критерий Фишера (F –
отношение). При этом t – критерий Стьюдента применяют также для отбора факторов уравнения регрессии. Проверка основывается на сравнении фактических величин η2 , R2, F и t с критическими (табличными).
216
Фактические величины η2 , R2, F и t должны превышать их критические значения.
Коэффициенты множественной детерминации R2
и корреляции изменяются от 0 до 1. Чем ближе R² и R к
1, тем более тесной является корреляционная связь. Например, если коэффициент множественной корреляции
R составляет 0.92, а коэффициент множественной
детерминации R 2 = 0.85 , то это может означать, что прирост или уменьшение результатного показателя на 85% зависит от отобранных для уравнения регрессии факторов и лишь на 15% от всех других факторов. Однако это не исключает возможности отбора для результатного показателя другого уравнения регрессии с другим составом факторов, который может иметь более высокие и
надежные значения η2 , R2, F , t а также других критериев. Такая неопределенность КРА является его особенностью, поскольку корреляционная связь, в отличие от функциональной, является нестрогой и неполной.
Влияние каждого фактора на прирост или уменьшение результатного показателя методом КРА чаще
217
всего определяется на основе линейного уравнения регрессии:
|
xi |
= a1iX1i − a0iX0i , |
(8.17) |
где |
хi - прирост (+) или уменьшение |
результатного |
показателя за счет соответствующего фактора Xі ; a1iX1i
иa0iX0i - фактическое и базисное значение
соответствующего фактора Xi и его параметра ai .
Например, в результате выборочного обследования было получено такое линейное уравнение регрессии, которое описывает корреляционную связь между денежными затратами человека за месяц на питание ( Y )
и его среднемесячным доходом ( X1 ), а также числом членов семьи ( X2 ):
ˆ |
+ 0, 2182X1 |
− 56, 493X2, |
(8.18) |
Y = 98, 405 |
ˆ
где Y – среднемесячные денежные затраты человека на питание в относительно твердой валюте (в евро); X1 –
среднемесячный денежный доход в расчете на одного человека семьи (в евро); X2 – число членов семьи.
В линейном уравнении параметр ai называют
частным коэффициентом регрессии. Он показывает, как
218
ˆ
в среднем меняется результатный показатель Y при
изменении факторного показателя Xі на единицу (при условии, что другие факторные показатели остаются
неизменными). В данном случае |
a = 0, 2182 |
и |
|
1 |
|
a2 = −56, 493 можно трактовать так: |
a1 показывает, что |
при росте дохода на 1 евро затраты на питание увеличиваются на 0,22 евро; a2 – при увеличении семьи на одного человека затраты на питание каждого члена семьи уменьшаются в среднем на 56,49 евро.
Определим по формуле 8,17 влияние первого фактора ( X1 ) - роста среднемесячного дохода на денежные затраты на питание. Если, например, в базисном году среднемесячный доход составил 600 евро, а в текущем 750 евро, то за счет этого фактора денежные
затраты |
на |
питание |
увеличились |
на: |
|
x1 |
= 0, 2182 × 750 - 0, 2182 × 600 = 32, 73 євро. |
|
В настоящее время техника корреляционных вычислений хорошо известна. Все расчеты целесообразно выполнять при помощи стандартных программ для ПЭВМ, в частности программы Excel или более специализированных Statgraphics, Statistica и т.п. Поэтому из-за ограниченного объема данной работы рутинные, но
219
довольно трудоемкие, корреляционные расчеты здесь не приведены.
Еще в 1877 г. английский антрополог Френсис Гальтон впервые сформулировал такие исходные для корреляционно-регрессионного метода понятия, как «регрессия» и «корреляция». С этого времени можно выделить три основных этапа в развитии данного метода: 1) применение традиционного корреляционнорегрессионного анализа, основанного на методе наименьших квадратов и предпосылке о «подчинении» исходных данных закону нормального распределения; 2) создание теории распределения и развитие непараметрической статистики; 3) формирование интегрированной теории – « робастного»1 корреляционнорегрессионного анализа (формирование этой теории далеко еще не закончено).
В последнее время самое важное значение приобретает проблема не изолированного, а системного, комплексного применения корреляционно-регрессионного метода совместно с другими статистическими, менеджментскими и иными методами. В частности, в
экономике, статистике и бизнесе весьма эффективным
1 От анг. robust – сильный, умный.
220