Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Статистика / СТАТ. Учебник для вузов

.pdf
Скачиваний:
47
Добавлен:
06.06.2015
Размер:
2.07 Mб
Скачать

(однофакторным) анализом, а двух и больше факторов – многофакторным. Среди множества функций чаще всего в парном анализе используют наиболее простую и надежную линейную функцию:

 

+а1 X

 

Y = ао

(8.11)

где а0 и а1 - параметры искомой прямой линии, которые определяются способом наименьших квадратов.

Методика расчета и использования линейного уравнения регрессии приведена в п.6.4. «Тенденции развития и прогнозирования рядов динамики».

Для оценки тесноты связи между факторным и результаным показателем при линейной зависимости используют линейный коэффициент корреляции:

 

r =

 

 

-

 

×

 

 

 

 

 

XY

X

Y

 

 

 

σ xσ y

 

 

xy

(8.12)

 

 

 

где X - факторный показатель (аргумент);

 

Y

результатный показатель (функция); σx и σy -

средние

квадратические отклонения значений

X и Y;

 

 

(XY)f

 

 

 

(Xf )

 

 

 

(Yf )

 

 

; X =

 

 

 

XY =

f

f

; Y =

f .

 

 

 

 

 

 

 

 

 

211

 

 

 

 

Значение коэффициента корреляции rхy

колеблются от-1 (случай полной обратной связи) до +1 (случай полной прямой связи). Чем ближе значение rхy к

единице, тем более тесная связь, чем ближе rхy к нулю,

тем слабее связь. При r < 0.30 связь считается слабой, при r = 0.3-0.7 – средней, при r > 0.7-0.9 – сильной, при r > 0.9 –

очень сильной (тесной).

Для нелинейной формы зависимости теснота связи определяется при помощи корреляционного отношения:

η =

σ2

,

 

x

(8.13)

 

σ2

 

 

y

 

 

где σ2y − общая дисперсия результатного показателя,

которая зависит от вариации всех факторов; σ2х − факторная

дисперсия, которая зависит от вариации лишь отобранных для уравнения регрессии факторных

 

 

 

(Y Y )

f

 

 

 

σ2

=

ˆ

 

2

 

,

 

ˆ

 

f

 

 

 

показателей;

x

 

 

 

 

где

Yx - теоретические

(расчетные) значения результатного показателя, которые получены по уравнению регрессии; Y – среднее значение

212

результатного показателя, вычисленное по фактическим (исходным) данным;

 

 

 

(Yi

 

)2 f

 

 

 

2

=

Y

 

Y

f - весы;

σy

f

, где

 

 

i - фактические

(исходные) значения результатного показателя. Отношение факторной дисперсии к общей, то есть

σ2x

σ2y характеризует тесноту корреляционной связи. Это

отношение показывает, какую часть общей вариации результатного показателя составляет вариация факторов, которые отобраны для уравнения регрессии.

Корреляционное отношение (η ) изменяется от 0 до 1.

Чем ближе η к 1, тем более тесной является корреляционная связь. При η = 1 связь является полной,

функциональной. При η = 0 связь отсутствует.

Проверка существенности корреляционной связи

основывается на сравнении фактической величины η 2 с

так называемой критической. Существуют таблицы критических значений η 2 . Если фактическая величина

213

η 2

больше критической, то

связь считается

существенной.

 

 

Корреляционное отношение

используют для

измерения тесноты связи как показателей однофакторного уравнения регрессии, так и многофакторного.

В многофакторном КРА на практике также чаще всего применяют простое и надежное линейное

уравнение множественной регрессии:

 

ˆ

= a0 + a1X1 + a2X2 + ... + an Xn , (8.14)

 

Y

где

ˆ

результатный, функциональный показатель

Y

(зависимая переменная); X1, X2,..., Xn - факторные показатели, факторы, которые определяют величину

результатного

показателя

(независимые переменные);

a0 , a1..., an

- параметры

регрессионного уравнения,

которые обычно определяются способом наименьших квадратов.

Выбор оптимальной формы связи и факторов регрессионного уравнения производится на основе совместного, комплексного использования качественного (содержательного) и количественного (числового) анализа. В количественном анализе применяются

214

коэффициенты

множественной

(многофакторной)

детерминации R2 и корреляции

R, F -

критерий

Фишера, t – критерий Стьюдента, критерии К.

Пирсона,

А. А. Чупрова, Г. Крамера, П. Хьюбера и многих других. При этом еще в 1934 г. норвежский экономист Рагнар Фриш обратил внимание на недопустимость использования в регрессионных моделях излишнего количества второстепенных, несущественных факторов.2

Коэффициент множественной детерминации определяют по формуле:

 

σ2

 

R 2 =

ˆ

 

Y

,

 

 

 

 

σY

(8.15)

 

2

 

где σ2 - факторная дисперсия результатного показателя,

ˆ

Y

которая получена по теоретическим (расчетным) значениям многофакторного уравнения регрессии; чаще всего – это линейное уравнение множественной регрессии

(8.14); σ2y - общая дисперсия результатного показателя.

2 Frisch R.A. Statistical confluence analysis by means of complete regression

systems. – T ubingen, 1934.

215

Коэффициент множественной детерминации – это отношение факторной дисперсии к общей. Как и в случае парной корреляции, он показывает, какую часть общей вариации результатного показателя составляет вариация факторов, которые отобраны для уравнения регрессии.

Корень квадратный из коэффициента множественной детерминации называют коэффициентом

(индексом) корреляции:

 

 

 

 

 

 

σ2

 

 

 

R =

R 2 =

1 −

 

 

 

 

(x )

,

 

 

 

 

 

 

 

 

 

 

 

 

σY

(8.16)

 

 

 

 

 

 

 

2

 

где

σ(2x)

= σY2 − σ2ˆ

- остаточная

дисперсия,

то есть

 

 

Y

 

 

 

 

 

 

 

разность (остаток) между общей и факторной дисперсией. Для проверки надежности коэффициентов детерминации и корреляции чаще всего используют t –

критерий Стьюдента и F – критерий Фишера (F –

отношение). При этом t – критерий Стьюдента применяют также для отбора факторов уравнения регрессии. Проверка основывается на сравнении фактических величин η2 , R2, F и t с критическими (табличными).

216

Фактические величины η2 , R2, F и t должны превышать их критические значения.

Коэффициенты множественной детерминации R2

и корреляции изменяются от 0 до 1. Чем ближе и R к

1, тем более тесной является корреляционная связь. Например, если коэффициент множественной корреляции

R составляет 0.92, а коэффициент множественной

детерминации R 2 = 0.85 , то это может означать, что прирост или уменьшение результатного показателя на 85% зависит от отобранных для уравнения регрессии факторов и лишь на 15% от всех других факторов. Однако это не исключает возможности отбора для результатного показателя другого уравнения регрессии с другим составом факторов, который может иметь более высокие и

надежные значения η2 , R2, F , t а также других критериев. Такая неопределенность КРА является его особенностью, поскольку корреляционная связь, в отличие от функциональной, является нестрогой и неполной.

Влияние каждого фактора на прирост или уменьшение результатного показателя методом КРА чаще

217

всего определяется на основе линейного уравнения регрессии:

 

xi

= a1iX1i − a0iX0i ,

(8.17)

где

хi - прирост (+) или уменьшение

результатного

показателя за счет соответствующего фактора Xі ; a1iX1i

иa0iX0i - фактическое и базисное значение

соответствующего фактора Xi и его параметра ai .

Например, в результате выборочного обследования было получено такое линейное уравнение регрессии, которое описывает корреляционную связь между денежными затратами человека за месяц на питание ( Y )

и его среднемесячным доходом ( X1 ), а также числом членов семьи ( X2 ):

ˆ

+ 0, 2182X1

− 56, 493X2,

(8.18)

Y = 98, 405

ˆ

где Y – среднемесячные денежные затраты человека на питание в относительно твердой валюте (в евро); X1

среднемесячный денежный доход в расчете на одного человека семьи (в евро); X2 – число членов семьи.

В линейном уравнении параметр ai называют

частным коэффициентом регрессии. Он показывает, как

218

ˆ

в среднем меняется результатный показатель Y при

изменении факторного показателя Xі на единицу (при условии, что другие факторные показатели остаются

неизменными). В данном случае

a = 0, 2182

и

 

1

 

a2 = −56, 493 можно трактовать так:

a1 показывает, что

при росте дохода на 1 евро затраты на питание увеличиваются на 0,22 евро; a2 – при увеличении семьи на одного человека затраты на питание каждого члена семьи уменьшаются в среднем на 56,49 евро.

Определим по формуле 8,17 влияние первого фактора ( X1 ) - роста среднемесячного дохода на денежные затраты на питание. Если, например, в базисном году среднемесячный доход составил 600 евро, а в текущем 750 евро, то за счет этого фактора денежные

затраты

на

питание

увеличились

на:

x1

= 0, 2182 × 750 - 0, 2182 × 600 = 32, 73 євро.

 

В настоящее время техника корреляционных вычислений хорошо известна. Все расчеты целесообразно выполнять при помощи стандартных программ для ПЭВМ, в частности программы Excel или более специализированных Statgraphics, Statistica и т.п. Поэтому из-за ограниченного объема данной работы рутинные, но

219

довольно трудоемкие, корреляционные расчеты здесь не приведены.

Еще в 1877 г. английский антрополог Френсис Гальтон впервые сформулировал такие исходные для корреляционно-регрессионного метода понятия, как «регрессия» и «корреляция». С этого времени можно выделить три основных этапа в развитии данного метода: 1) применение традиционного корреляционнорегрессионного анализа, основанного на методе наименьших квадратов и предпосылке о «подчинении» исходных данных закону нормального распределения; 2) создание теории распределения и развитие непараметрической статистики; 3) формирование интегрированной теории – « робастного»1 корреляционнорегрессионного анализа (формирование этой теории далеко еще не закончено).

В последнее время самое важное значение приобретает проблема не изолированного, а системного, комплексного применения корреляционно-регрессионного метода совместно с другими статистическими, менеджментскими и иными методами. В частности, в

экономике, статистике и бизнесе весьма эффективным

1 От анг. robust – сильный, умный.

220