МУ Эконометрика 1583
.pdf31
Таблица 8
|
X |
Y |
X |
1.000000 |
0.953688 |
Y |
0.953688 |
1.000000 |
На пересечении переменных х и у и находится коэффициент rxy, который равен 0,953. Полученное значение rxy довольно близко к единице, что свидетельствует о тесной связи между х (уровень механизации) и у (дневная выработка). Данные расчеты подтверждают предварительные предположение анализа и выбор переменных.
Затем построим поле корреляции, которое позволит предположить форму связи между переменными. Для того чтобы построить поле корреляции моделируемого (результативного) и факторного признаков, не-
обходимо в окне группы GROUP01 выбрать View/Graph/Scatter/Simple scatter.
Полученный в результате график представляет собой поле корреляции переменных у и х (рис. 6).
Рис. 6. Поле корреляции результативного и факторного признаков
Данный график позволяет сделать предположение о линейной связи между выбранными переменными. Опираясь на данное предположение, будем искать зависимость в виде:
yˆ b0 b1x ,
где yˆ оцененное значение признака у; х – значения фактора, принад-
лежащих выборке наблюдений; b0 и b1 – коэффициенты регрессии, рассчитанные по методу наименьших квадратов (см. п. 1.1).
Для оценки регрессии в командной строке рабочего окна программы опишем в общем виде искомое уравнение:
ls у c х ,
где ls метод оценки параметров – МНК (метод наименьших квадратов); у эндогенная (зависимая) переменная c константа (b0); х экзогенная
32
(факторная) переменная.
Либо можно выбрать в строке главного меню EViews:
Quick/Estimate equation и в появившемся окне в поле Equation Specification
описать уравнение.
В окне регрессии (табл. 9) будут получены зависимая переменная, применяемый метод, число наблюдений, параметры уравнения регрессии, стандартные ошибки, значения t-статистик и соответствующие им вероятности, значение R2 и ряд других показателей.
Таблица 9
Dependent Variable: Y
Method: Least Squares
Date: 04/09/08 Time: 16:15
Sample: 1 28
Included observations: 28
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
C |
-19.34739 |
3.051022 |
-6.341282 |
0.0000 |
X |
0.739465 |
0.045740 |
16.16669 |
0.0000 |
|
|
|
|
|
R-squared |
0.909522 |
|
|
||
Adjusted R-squared |
0.906042 |
|
|
||
S.E. of regression |
4.834278 |
|
|
||
Sum squared resid |
607.6263 |
|
|
||
Log likelihood |
-82.81326 |
|
|
||
Durbin-Watson stat |
0.606482 |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
Mean dependent var 27.71429
S.D. dependent var |
15.77118 |
||
Akaike info criterion |
6.058090 |
||
Schwarz criterion |
6.153247 |
||
F-statistic |
261.3618 |
||
Prob(F-statistic) |
0.000000 |
||
|
|
|
|
|
|
|
|
В результате расчетов получили уравнение регрессии
у = 19,35 + 0,74∙х.
Из полученного уравнения регрессии следует, что при увеличении уровня механизации х на 1% дневная выработка у увеличивается в среднем на 0,74 ед.
Программа EViews производит расчет следующих статистик:
Стандартная ошибка коэффициента (Std. Error).
Статистика Стьюдента t-статистика (t-Statistic).
Р-значение для t-статистики (Prob.)
Коэффициент детерминации R2 (R-squared).
Скорректированный коэффициент детерминации Radj2 (Adjusted
R-squared).
Стандартная ошибка регрессии s.e.regr. (S.E. of regression).
Сумма квадратов остатков регрессии RSS (Sum squared resid).
Логарифм функции правдоподобия (Log likelihood).
Статистика Дарбина-Уотсона DW (Durbin-Watson stat).
Среднее значение (Mean dependent var).
Стандартное отклонение переменной (S.D. dependent var).
Информационный критерий Акаике AIC (Akaike info criterion).
Информационный критерий Шварца BIC или SC (Schwarz criterion).
33
Статистика Фишера F-статистика (F-statistic).
Р-значение для F-статистики (Prob(F-statistic)).
Рассчитанные статистики позволяют оценить значимость и надежность полученных оценок регрессии и парного уравнения в целом.
Выдвигаем нулевую гипотеза (Н0) о равенстве нулю коэффициента регрессии (Н0:b1 = 0) против альтернативной гипотезы (Н1) о неравенстве нулю коэффициента регрессии (Н1:b1 0).
Программа EViews рассчитывает значение вероятности нулевой ги-
потезы (Prob.). Для наших |
расчетов установим уровень |
значимости |
= 0,05. Коэффициент |
b1 являются значимыми, |
так как |
Prob. = 0,00 < 0,05. |
|
|
Чтобы можно было использовать полученную модель на практике необходимо оценить ее значимость. Для оценки надежности выборочного уравнения регрессии применяется F-критерий Фишера. Выдвигаем нулевую гипотезу (Н0) о равенстве нулю коэффициентов регрессии (Н0:bi = 0) против альтернативной гипотезы (Н1) о неравенстве нулю коэффициентов регрессии (Н1:bi 0).
Если Fнабл > F ;p;n-p-1, отвергается нулевая гипотеза – об отсутствии связи между выбранными переменными и уравнение регрессии считается значимым. Программа рассчитывает Fнабл (F-statistic). Для нашего примера Fнабл = 261,36. Для нашего примера уравнение регрессии считается значимым, так как вероятность нулевой гипотезы Prob(F-statistic) меньше уровня значимости Prob. = 0,00 < 0,05 .
Мерой качества уравнения регрессии, характеристикой прогностической силы анализируемой регрессионной модели является коэффициент детерминации.
Величина R2 показывает, какая часть (доля) вариации зависимой переменной обусловлена вариацией объясняющей переменной.
Для оцененной модели коэффициент детерминации (R-squared) равен 0,910. Данное значение показывает, что вариация признака (дневная выработка) на 91% объясняется вариацией фактора (уровень механизации).
Также программа Eviews позволяет построить эмпирическую линию регрессии. Для этого в окне Workfile выделим группу переменных и вы-
берем: View/Graph/Scatter/Scatter with regression. В промежуточном окне не-
обходимо нажать OK. Полученный график (рис. 7) – эмпирическая линия регрессии.
Чтобы построить теоретическую (подогнанную) линию регрессии, необходимо найти теоретические (вычисленные с помощью уравнения регрессии) значения результативного признака. Для этого открыть окно с параметрами уравнения регрессии, далее выбрать Forecast. Появится окно, в котором к исходным добавилась новая переменная YF (прогнозное (теоретическое, выровненное) значение переменной у).
34
Полученный график (рис. 8) – теоретическая (подогнанная) линия регрессии.
Рис. 7. Окно эмпирической линии |
Рис. 8. Окно теоретической линии |
регрессии |
регрессии |
Следующая операция возможна только в том случае, если ей предшествует построение регрессионного уравнения. Сохраним остатки полученной регрессии, для этого в окне оцененной регрессии выберем Procs/Make residual series…, укажем имя для остатков (по умолчанию
Resid01).
Вокне регрессии можно выбрать View/Actual,Fitted…/Actual,Fitted…Graph
ипоявится график, представленный на рис. 9. На данном графике переменные Residual – остатки ei, Actual – наблюдаемое значение признака (уi), Fitted – оцененное по уравнению регрессии значение признака.
|
|
|
|
|
|
|
|
|
|
|
|
|
80 |
|
|
|
|
|
|
|
|
|
|
|
|
|
60 |
|
|
|
|
|
|
|
|
|
|
|
|
|
40 |
|
|
|
|
|
|
|
|
|
|
|
|
|
20 |
15 |
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
-20 |
|
10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
-5 |
|
|
|
|
|
|
|
|
|
|
|
|
|
-10 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
4 |
6 |
8 |
10 |
12 |
14 |
16 |
18 |
20 |
22 |
24 |
26 |
28 |
Residual Actual Fitted
Рис. 9. График случайной составляющей
Также возможно табличное представление данного графика, для этого в окне оцененного уравнения регрессии необходимо выбрать пункт
меню View/Actual,Fitted…/Actual,Fitted…table. Результат представлен
на рис. 10.
35
График остатков позволяет сделать предположения о качестве модели, т.е. необходимо ли выполнять тесты на выявление автокорреляции остатков и гетероскедастичность модели.
Значения ei – отрицательные
Значения ei – положительные
Рис. 10. Окно случайной составляющей
Для оцененной модели можно предположить наличие положительной автокорреляции, так как наблюдается чередование зон, где наблюдаемые значения остатков положительные, и зон, где значения остатков отрицательные. Для проверки данного предположения воспользуемся тестом Дарбина Уотсона. Табличные значение dн = 1,33 и dв = 1,48. Оцененное значение Durbin-Watson stat попадает в диапазон 0 < DW = 0,606 < dн = 1,33. Имеет место положительная автокорреляция.
Оценим модель на гетероскедастичность.
1. Тест Уайта (White Heteroskedasticity). В окне регрессии выберем View/Residual Tests/White Heteroskedasticity (no cross terms). Появится окно,
представленное в табл. 10.
Зависимость квадратов остатков оказалась следующей:
2 = 235,369 – 7,115х + 0,054х2 + и
(11,423) |
(10,403) |
(9,802) |
Значимость коэффициентов при х существенна (tтабл = 2,06). Уравнение в целом надежно Fнабл = 22,483 > Fтабл = 3,40. Следовательно, необходимо признать наличие гетероскедастичности остатков исходя из теста Уайта. При этом количественно гетероскедастичность может быть представлена квадратичной функцией.
36
Таблица 10
White Heteroskedasticity Test:
F-statistic |
55.48308 |
Probability |
0.000000 |
|
Obs*R-squared |
22.85166 |
Probability |
0.000011 |
|
|
|
|
|
|
Test Equation: |
|
|
|
|
Dependent Variable: RESID^2 |
|
|
|
|
Method: Least Squares |
|
|
|
|
Date: 04/11/08 |
Time: 15:28 |
|
|
|
Sample: 1 28 |
|
|
|
|
Included observations: 28 |
|
|
|
|
|
|
|
|
|
Variable |
Coefficient |
Std. Error |
t-Statistic |
Prob. |
|
|
|
|
|
C |
235.3685 |
20.60337 |
11.42379 |
0.0000 |
X |
-7.115247 0.683950 |
-10.40317 |
0.0000 |
|
X^2 |
0.053753 |
0.005484 |
9.801704 |
0.0000 |
|
|
|
|
|
R-squared |
0.816131 |
|
|
||
Adjusted R-squared |
0.801421 |
|
|
||
S.E. of regression |
15.58328 |
|
|
||
Sum squared resid |
6070.966 |
|
|
||
Log likelihood |
-115.0372 |
|
|
||
Durbin-Watson stat |
1.629011 |
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
Mean dependent var |
21.70094 |
||
S.D. dependent var |
34.96974 |
||
Akaike info criterion |
8.431231 |
||
Schwarz criterion |
8.573967 |
||
F-statistic |
55.48308 |
||
Prob(F-statistic) |
0.000000 |
||
|
|
|
|
|
|
|
|
2. Тест Парка. Откроем группу из остатков и переменной х, постро-
им модель вида ln 2 = а + b ln х + и (ls log(resid01^2) c log(x)). Получим рег-
рессию:
Таблица 11
Dependent Variable: LOG(RESID01^2)
Method: Least Squares
Date: 04/14/08 Time: 10:43
Sample: 1 28
Included observations: 28
Variable |
Coefficient |
|
Std. Error |
t-Statistic |
|
Prob. |
||||
|
|
|
|
|
|
|
|
|
|
|
C |
5.640005 |
|
3.602229 |
1.565699 |
|
0.1295 |
||||
LOG(X) |
-0.902552 0.877044 |
-1.029084 |
|
0.3129 |
||||||
|
|
|
|
|
|
|
|
|
|
|
R-squared |
0.039137 |
|
|
Mean dependent var |
1.950559 |
|||||
Adjusted R-squared |
0.002181 |
|
|
S.D. dependent var |
1.854612 |
|||||
S.E. of regression |
1.852588 |
|
|
Akaike info criterion |
4.139794 |
|||||
Sum squared resid |
89.23418 |
|
|
Schwarz criterion |
4.234951 |
|||||
Log likelihood |
-55.95711 |
|
|
F-statistic |
|
|
1.059014 |
|||
Durbin-Watson stat |
0.908512 |
|
|
Prob(F-statistic) |
0.312919 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В результате получим следующую модель:
ln 2 = 5,635 0,901 ln х.
Проверка уравнения на значимость показывает: R2 = 0,039; F = 1,056; ta = 1,565 и tb = 1,028. По тесту Парка зависимость дисперсии остатков от х проявляется ненадежно: все параметры статистически не значимы, R2 очень низкий, t-критерий и F-статистика меньше табличных значений (t0,95;26 = 2,06; F0,05;1;26 = 4,23). Тест Парка показал отсутствие количественной связи между логарифмом квадратов остатков и логарифмом фактора.
3. Тест Гейзера. В группе остатков и фактора построим модели вида |e| = a + b ∙ xc. Зададим значение с = 2; 1; 0,5; 0,5; 1. Для этого в ко-
37
мандной строке программы EViews наберем команды и получим модели, расчеты поместим в табл. 12.
|
|
|
|
|
Таблица 12 |
с |
Команда |
Уравнение |
Значимость |
Связь |
|
4 |
ls abs(resid01) c 1/(x^4) |
|e| = 3,24 + 526604,0x-4 |
F = 23,04 |
присутствует |
|
3 |
ls abs(resid01) c 1/(x^3) |
|e| = 3,09 + 35368,30x-3 |
F = 23,91 |
присутствует |
|
2 |
ls abs(resid01) c 1/(x^2) |
|e| = 2,62 |
+ 2327,52x-2 |
F = 22,14 |
присутствует |
1 |
ls abs(resid01) c 1/(x) |
|e| = 0,87 |
+ 153,09x-1 |
F = 14,61 |
присутствует |
0,5 |
ls abs(resid01) c 1/(x^0.5) |
|e| = 2,40 + 46,10x-0,5 |
F = 9,65 |
присутствует |
|
0,5 |
ls abs(resid01) c x^0.5 |
|e| = 8,58 |
0,62x0,5 |
F = 2,56 |
отсутствует |
1 |
ls abs(resid01) c x |
|e| = 5,39 |
0,03x |
F = 0,945 |
отсутствует |
Из теста Гейзера следует, что абсолютная величина остатков достаточно сильно зависит от х-3.
Проведенные тесты показывают наличие гетероскедастичности. Истинные значения ошибок дисперсии нам не известны, поэтому мы не можем использовать взвешенный метод наименьших квадратов (the method of weighted least squares) для скорректированных в рамках гетероскедастичности стандартных ошибок и значения t-критерия. Мы можем сделать только предположение о природе дисперсии ошибок: дисперсия ошибок пропорциональна квадрату факторной переменной (тест Уайта), либо пропорциональна факторной переменной в степени 3 (тест Гейзера).
Применим преобразование квадратного корня ( E(ei2) 2x2 ). В ок-
не оцененной регрессии (рис. 11) нажимаем и используем вес 1/х.
Рис. 11. Преобразование 1/х
Выполнив преобразование, получили модель:
y5,27 1 0,50 . x x
Проверка уравнения на значимость показывает: R2 = 0,26; F = 175,39;
38
ta = 3,00 и tb = 12,34. По сравнению с моделью у = 19,35 + 0,74х, оце-
ненной обычным МНК, полученная модель хуже.
Применим преобразование факторной переменной в степени 4
2
2 2
( E(ei ) ). В окне оцененной регрессии используем вес х . x4
Выполнив преобразование, получили модель:
y |
37,55 |
1 |
0,98 |
1 |
|
x2 |
x2 |
x |
|||
|
|
Проверка уравнения на значимость показывает: R2 = 0,99; F = 735,16; ta = 12,47 и tb = 27,11. По сравнению с моделью у = 19,35 + 0,74∙х, оце-
ненной обычным МНК, полученная модель значительно лучше.
2.2. Использование EViews для построения нелинейных однофакторных моделей
Программа EViews может быть использована для построения различных типов регрессионных моделей.
Для данных (см. табл. 2) построим нелинейные модели, оценим адекватность полученных результатов и выберем наилучшую модель.
В разд. 2.1 была проанализирована линейная регрессия. Полученная модель: у = 19,35 + 0,74х, статистики R2 = 0,91; F = 261,36.
Рассчитаем параметры следующих нелинейных моделей: степенной y = axb, показательной y = abx, логарифмической y = a + blnx, равносто-
ронней гиперболы y = a + b , квадратичной y = a + bx2, полиномиальной x
y = a + b1x + b2x2 и выберем наилучшую из них.
Степенная модель – это нелинейная модель внутренне нелинейна. Однако ее можно считать внутренне линейной, ибо логарифмирование данного уравнения по основанию е приводит его к линейному виду: ln y = ln a + b∙ln x + ln . Аналогично можно привести к линейному виду показательную функцию: ln y = ln a + x∙ln b + ln .
Промежуточные результаты занесем в табл. 13.
Уравнения линейной, показательной, квадратичной и полиномиальной регрессий достаточно хорошо описывают исходные данные. В данных моделях значений критериев адекватности довольно высоко (F- критерий, коэффициент детерминации R2). Некоторое предпочтение можно отдать квадратичной функции, для которой коэффициент детерминации и критерий Фишера наибольшие.
39
|
|
|
|
|
Таблица 13 |
|
Функция |
Команда |
Уравнение регрессии |
Адекват- |
|||
EViews |
ность |
|||||
|
|
|
|
|||
Линейная |
ls у c х |
у = 19,35 + 0,74х |
R2 = 0,910 |
|||
|
|
|
F = 261,36 |
|||
|
|
|
|
|
||
Степенная |
ls log(y) c log(x) |
ln y = 3,18 + 1,54∙ln x |
R2 = 0,870 |
|||
y = е 3,18 х1,54 = 0,04х1,54 |
F = 175,06 |
|||||
|
|
|||||
Показательная |
ls log(y) c x |
ln y = 1,11 + 0,03x |
R2 = 0,928 |
|||
y = е1,11 е0,03х = 3,03∙1,03х |
F = 335,13 |
|||||
|
|
|||||
Логарифмическая |
ls у c log(x) |
у = 104,81 + 32,42∙ln(х) |
R2 = 0,698 |
|||
|
|
|
F = 60,179 |
|||
|
|
|
|
|
||
Гиперболы |
ls у c 1/x |
у = 44,41 900,23∙ |
1 |
|
R2 = 0,412 |
|
|
F = 18,242 |
|||||
x |
||||||
|
|
|
|
|||
Квадратичной |
ls у c х^2 |
у = 0,380 + 0,006х2 |
R2 = 0,976 |
|||
|
|
|
F = 1078,7 |
|||
|
|
|
|
|
||
Полиномиальная |
ls у c x х^2 |
у = 5,8 0,19х + 0,008х2 |
R2 = 0,979 |
|||
|
|
|
F = 587,98 |
|||
|
|
|
|
|
2.3. Использование EViews для построения линейной многофакторной модели
При изучении влияния стоимости основных и оборотных средств на величину валового дохода по 25 предприятиям были получены данные, представленные в табл. 14.
|
|
|
Таблица 14 |
Номер |
Валовой доход |
Среднегодовая |
Среднегодовая |
стоимость основ- |
стоимость оборот- |
||
предприятия |
за год, млн руб. |
ных фондов, |
ных средств, |
|
|
млн руб. |
млн руб. |
N |
DOXOD |
OF |
OBS |
1 |
45 |
17 |
54 |
2 |
48 |
20 |
78 |
3 |
50 |
80 |
100 |
4 |
52 |
65 |
114 |
5 |
56 |
124 |
42 |
6 |
45 |
100 |
38 |
7 |
63 |
28 |
56 |
8 |
69 |
36 |
59 |
9 |
75 |
98 |
46 |
10 |
80 |
114 |
65 |
11 |
88 |
102 |
56 |
12 |
90 |
96 |
50 |
13 |
99 |
102 |
87 |
40
|
|
|
Окончание табл. 14 |
|
|
Среднегодовая |
Среднегодовая |
Номер |
Валовой доход |
стоимость основ- |
стоимость оборот- |
предприятия |
за год, млн руб. |
ных фондов, |
ных средств, |
|
|
млн руб. |
млн руб. |
N |
DOXOD |
OF |
OBS |
14 |
75 |
116 |
54 |
15 |
113 |
50 |
63 |
16 |
118 |
60 |
75 |
17 |
65 |
56 |
28 |
18 |
111 |
87 |
56 |
19 |
121 |
112 |
45 |
20 |
160 |
115 |
88 |
21 |
176 |
120 |
74 |
22 |
186 |
110 |
90 |
23 |
192 |
111 |
102 |
24 |
203 |
118 |
105 |
25 |
237 |
154 |
106 |
Построим линейное уравнение множественной регрессии
DOXOD = b0 + b1 ∙ OF + b2 ∙ OBS
и поясним экономический смысл его параметров.
Для этого в командной строке программы EViews введем команду ls DOXOD c OF OBS. В результате получим результат, представленный в табл. 15.
Таблица 15
Dependent Variable: DOXOD
Method: Least Squares
Date: 04/17/08 Time: 11:48
Sample: 1 25
Included observations: 25
Variable |
Coefficient |
|
Std. Error |
t-Statistic |
|
Prob. |
||||
|
|
|
|
|
|
|
|
|
|
|
C |
-34.12082 |
|
28.84270 |
-1.182997 |
|
0.2494 |
||||
OF |
0.787621 |
|
0.228615 |
3.445179 |
|
0.0023 |
||||
OBS |
1.007708 |
|
0.345494 |
2.916716 |
|
0.0080 |
||||
|
|
|
|
|
|
|
|
|
||
R-squared |
0.540413 |
|
|
Mean dependent var 104.6800 |
||||||
Adjusted R-squared |
0.498633 |
|
|
S.D. dependent var |
56.29737 |
|||||
S.E. of regression |
39.86264 |
|
|
Akaike info criterion |
10.32092 |
|||||
Sum squared resid |
34958.66 |
|
|
Schwarz criterion |
10.46719 |
|||||
Log likelihood |
-126.0115 |
|
|
F-statistic |
|
|
12.93455 |
|||
Durbin-Watson stat |
0.587820 |
|
|
Prob(F-statistic) |
0.000193 |
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Получили уравнение регрессии
DOXOD = 34,121 + 0,788∙OF + 1,008∙OBS.
Коэффициент регрессии b1 показывает, что при увеличении на 1 млн руб. среднегодовой стоимости основных фондов (OF) валовой