- •Министерство образования и науки украины
- •Основные понятия регрессионного анализа Парная регрессия
- •Проверка гипотезы о значимости коэффициента корреляции.
- •Прогноз и его доверительные интервалы.
- •Оценка адекватности нелинейной парной регрессии.
- •Прогноз и его доверительный интервал для парной нелинейной регрессии.
- •Множественная регрессия.
- •Мультиколлинеарность.
- •Алгоритм фаррара –глобера состоит из следующих шагов:
- •Автокорреляция
- •Пространственная корреляция возмущений ( Гетероскедастичность)
- •Пример решение задания 1.
- •Решение.
Оценка адекватности нелинейной парной регрессии.
Для оценки адекватности парной нелинейной регрессии наблюдаемым данным можно использовать критерий Фишера. Расчетное значение критерия Фишера находится по формуле:
, (12)
где ,,
n - число опытов, m - число включенных в регрессию факторов.
Для заданного уровня значимости и числа степеней свободы,находится табличное значение. Полученное расчетное значение сравниваем с табличным.
Расчетное значение критерия Фишера также можно определить с помощью индекса корреляции R'.
, (13)
.
Прогноз и его доверительный интервал для парной нелинейной регрессии.
Точечная оценка прогноза находится по формуле:
, где . (14)
Интервал значимости вычисляется как , где
.
Средние коэффициенты эластичности для линейной регрессии расчитываются по формуле:
Э yxj = аj xj / y
Множественная регрессия.
Для измерения тесноты связи между двумя из рассматриваемых переменных ( без учета их взаимодействия с другими переменными ) применяются парные коэффициенты корреляции:
r yx1 = ( x1y –x1 y ) /σ x1 σy ; r yx2 = ( x2y – x2 y ) /σ x2 σy ;
r x1x2 = ( x1 x2 – x1 x2 ) /σ x1 σ x2 . (15)
где
σ x1 = x1 2 - ( x1)2
σ x2 = x2 2 – (x2) 2
(16)
σy = y 2 – (y )2
Так как в реальных условиях все переменные, как правило,взаимосвязаны, то на значение коэффициента корреляции частично влияют другие переменные В связи с этим возникает необходимость исследовать частную корреляцию между переменными при исключении ( элиминировании ) влияния одной или нескольких переменных. Теснота этой связи определяется частными коэффициентами корреляции.между переменными Xi и Xj при фиксированных значениях остальных m - 2 переменных по формуле:
rxixj ( x 1,x 2 , …, x m ) = - Аij / A ii * Ajj , (17)
где A ii и Ajj -алгебраические дополнения элементов rii и rjj матрицы парных коэффициентов корреляции ∆ r 11 или по рекуррентной формуле:
r xixj ( x 1,x 2,…,x i-1 ,x i+1 , …, x j-1, x j+1, … ,x m ) =
rxixj, x 1,x 2,x i-1 ,x i+1 , …, x m -1 - rxixm (x 1,x 2, …, x m –1) rxj x m(x 1,x2,…,xm -1)
( 1 – r2xixm( x 1,x 2, …, x m –1) ) ( 1 – r2xj x m(x 1,x2,…,xm -1) )
Частные коэффициенты ( индексы ) корреляции, измеряющие степень и влияние на у фактора хi при неизменом уровне других факторов, можно определить по рекуррентной формуле :
r yxi ( x 1,x 2,x i-1 ,x i+1 , …, x m ) =
ryxi,x1,x2,x i-1 ,x i+1 ,…, xm -1 - ryxm (x 1,x 2, …, x m –1) rxi x m(x 1,x2,…,xm-1)
( 1 – r2yxm( x 1,x 2, …, x m –1) ) ( 1 – r2xi x m(x 1,x2,…,xm -1) )
В зависимости от количества переменных, влияние которых исключается, частные коэффициенты корреляции могут быть различного порядка: при исключении влияния одной переменной получим частный коэффициент корреляции первого порядка; при исключении влияния двух переменных - частный коэффициент корреляции второго порядка и т. д.
Для двухфакторной модели частный коэффициент корреляции первого порядка между признаками х1 и у при исключении признака х2 вычисляют по формуле:
ry x 1 - ryx 2 rx 1x2
r yx1 ( x 2 ) = ___________________________ (18)
( 1 – r2yx 2 ) ( 1 – r2x1x2 )
Для двухфакторной модели частный коэффициент корреляции первого порядка между признаками х2 и у при исключении признака х1 вычисляют по формуле:
ry x 2 - ryx 1 rx 1x2
r yx2 ( x 1 ) = ___________________________ (19)
( 1 – r2yx 1 ) ( 1 – r2x1x2 )
Для двухфакторной модели частный коэффициент корреляции первого порядка между признаками х1 и х2 при исключении влияния результативного признака у вычисляют по формуле:
rх1 x 2 - ryx 1 rуx2
r х2x1 ( у ) = _________________________
( 1 – r2yx 1 ) ( 1 – r2уx2 ) ,
где r – парные коэффициенты корреляции между соответствующим признаками.Очевидно, что коэффициент корреляции r между остатками будет отражать тесноту частной корреляции между переменными хi и хj при исключении влияния остальных переменных.Можно показать, что коэффициент корреляции r между остатками равен частному коэффициенту корреляции rxixj.Частный коэффициент корреляции , как и парный коэффициент rij , может принимать значения от –1 до 1 и его значимость оценивают так же, как и обычного коэффициента корреляции r, но при этом полагают n1 = n – m –2.
Изучение парных и частных коэффициентов корреляции позволяет отобрать наиболее существенные, значимые факторы. Тесноту совместного влияния факторов на результат оценивает коэффициент (индекс )множественной корреляции R yx1x2,…,xm :
R yx1x2,…,xm = 1-σ2y ост. /σ2y
Значение коэффициента (индекса) множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции r yxi .
Совокупный коэффициент ( индекс ) множественной детерминации опреде
ляет только качество выравнивания по уравнению регрессии. Так как многофакторный регрессионный анализ оперирует случайными наблюдениями, и необязательно распределенными по многомерному нормальному закону ( этому закону должны подчиняться отклонения фактических значений регрессанда от расчетных ), то показатели множественной регрессии и корреляции сами могут оказаться подверженными действию случайных факторов. Поэтому только после проверки адекватности уравнения оно может использоваться для экономического анализа.
Общая оценка адекватности уравнения может быть получена с помощью дисперсионного F– критерия Фишера:
F = R²(n-m-1) / (1- R²). m, или F = σ ²у .(n-m-1) / σ ²ост.. m
где m -число факторов.( число параметров р = m + 1 )
Полученное значение F– критерия ( Fрасч. ) сравнивают с табличным для принятого уровня значимости и чисел степеней свободы k1 = m и k2 = n-m-1.
Если Fрасч. > Fтабл. , то уравнение регрессии статистически значимо, т.е.
доля вариации, обусловленная регрессией, намного превышает случайную ошибку.
Принято считать, что уравнение регрессии пригодно для практического использования в том случае, если Fрасч. > Fтабл не менее чем в 4 раза.
Частный F– критерий Фишера оценивает статистическую значимость присутствия каждого из факторов в уравнении регрессии и определяется по формуле:
R2 yx1x2,…,xm - r 2yxi (x 1,x 2,x i-1 ,x i+1 , …, x m) .(n-m-1)
Fчаст. = -------------------------------------------------------------. (20)
R2 yx1x2,…,xm
Для оценки значимости коэффициентов регрессии при линейной зависимости используют t - критерий Стьюдента при n –(m + 1 ) степенях свободы :
ta1 = a1σx1 *√1-r2x1x2 * √n-m-1 / σy √1-R2yx1x2
ta2= a2σx2 * √1-r2x1x2 * √n-m-1 / σy√1-R2yx1x2 (21)
tRyx1x2 = Ryx1x2 * √n-m-1 / √1-R2yx1x2
Если в уравнении все коэффициенты регрессии значимы, то данное уравнение признают окончательным и применяют в качестве модели изучаемого показателя для последующего анализа.
Оценку значимости коеффициентов регрессии с помощью t – критерия
используют, также, для отбора существенных ( информативных ) факторов при многошаговом регрессионном анализе.Он заключается в том, что после оценки значимости всех коэффициентов регрессии из модели исключают
тот фактор, коэффициент при котором незначим и имеет наименьшее значение критерия. Затем строится уравнение регрессии без исключенного фактора, и снова проводится оценка адекватности уравнения и значимости коэфициентов регрессии. Процесс длится до тех пор, пока все коэффициенты регрессии не окажутся значимыми, что свидетельствует о наличии в регрессионной модели только существенных факторов.В некоторых случаях расчетное значе ние t расч. находится вблизи tтабл. , поэтому с точки зрения содержательности модели такой фактор можно оставить для последующей проверки его значимости в сочетании с другим набором факторов.
На основе коэффициентов регрессии невозможно указать какой из фактор-
ных признаков оказывает наибольшее влияние на результативный признак у, так как они не сопоставимы между собой, поскольку измеряются разными единицами.На их основе невозможно также установить в развитии каких фак
торных признаков заложены наиболее крупные резервы изменения регрессанда у , потому что в них не учтена вариация факторных признаков.
Для ответа на выше перечисленные вопросы построим уравнение множественной регрессии в стандартизированном виде:
ty = βıtx ı + β2t x 2 + … + βptx p (22)
где
ty = у – у /σу , tхi = ( xi – xi) /σxi - стандартизованные переменные, βi –
стандартизованные коэффициенты.
Стандартизованные коэффициенты регрессии (β - коэффициенты ) опре-
деляются из следующей системы:
β1 + β2 rx1x2 + β3 rx1x3 + … + βp rx1xp = ryx1
β1 rx2x1 + β2 + β3 rx2x3 + … + βprx2xp = ryx2
…………………………………………………..
β1 rxpx1 + β2 rxpx2 +β3 rxpx3 + … + βp = ryxp
и показывают на какую часть среднего квадратичного отклонения изменяется регрессанд у ( результативный признак у ) с изменением соответствующего факторного признака на величину его среднего квадратичного отклонения. С помощью β – коэффициентов определяют факторы в развитии которых заложены наиболее крупные резервы изучаемого показателя.
Так как связь коэффициентов множественной регрессии ai со стандартными коэффициентами βi (β – коэффициентами) описывается соотношениями:
ai = βiσу / σxi ; a0 = y - b1 x1 - b2 x2 - … - bp xp ,
то β - коэффициенты можно также найти по формулам:
βi = ai σxi / σу,
Средние коэффициенты эластичности для линейной регрессии расчитываются по формуле:
Э yxj = аj xj /y
Частные коэффициенты эластичности вычисляются по формуле:
Э yxj = аj xj /ŷxi (x1,x2,xi-1, xi+1,…,xm)
и показывают на сколько процентов в среднем изменяется анализируемый показатель с изменением на 1% сответствующего фактора при фиксированном положении других факторов.
С помощью частных коэффициентов эластичности можно определить фак-
тор оказывающий наибольшее влияние на регрессанд у ( без учета различия в степени варьирования входящих в уравнение факторов, что, в отличие от β – коэффициентов не дает возможности определить факторы в развитии которых заложены наиболее крупные резервы улучшения изучаемого показателя).
Для определения доли вклада анализируемого фактора в суммарное влияние всех факторов вычисляют ∆і - коэффициент по формуле:
∆і = βіrі/R²
С помощью ∆і – коэффициентов можно определиться фактор, развитием которого можно обеспечить наибольшую долю прироста регрессанда у.
Таким образом на основании частных коэффициентов эластичности Э yxj ,βi - , ∆і - коэффициентов можно судить о резервах роста исследуемого показателя у (регрессанда у ) которые заложены в том или ином факторе xi.