Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

МУ Эконометрика 1583

.pdf
Скачиваний:
31
Добавлен:
11.03.2015
Размер:
1.3 Mб
Скачать

31

Таблица 8

 

X

Y

X

1.000000

0.953688

Y

0.953688

1.000000

На пересечении переменных х и у и находится коэффициент rxy, который равен 0,953. Полученное значение rxy довольно близко к единице, что свидетельствует о тесной связи между х (уровень механизации) и у (дневная выработка). Данные расчеты подтверждают предварительные предположение анализа и выбор переменных.

Затем построим поле корреляции, которое позволит предположить форму связи между переменными. Для того чтобы построить поле корреляции моделируемого (результативного) и факторного признаков, не-

обходимо в окне группы GROUP01 выбрать View/Graph/Scatter/Simple scatter.

Полученный в результате график представляет собой поле корреляции переменных у и х (рис. 6).

Рис. 6. Поле корреляции результативного и факторного признаков

Данный график позволяет сделать предположение о линейной связи между выбранными переменными. Опираясь на данное предположение, будем искать зависимость в виде:

yˆ b0 b1x ,

где yˆ оцененное значение признака у; х – значения фактора, принад-

лежащих выборке наблюдений; b0 и b1 – коэффициенты регрессии, рассчитанные по методу наименьших квадратов (см. п. 1.1).

Для оценки регрессии в командной строке рабочего окна программы опишем в общем виде искомое уравнение:

ls у c х ,

где ls метод оценки параметров – МНК (метод наименьших квадратов); у эндогенная (зависимая) переменная c константа (b0); х экзогенная

32

(факторная) переменная.

Либо можно выбрать в строке главного меню EViews:

Quick/Estimate equation и в появившемся окне в поле Equation Specification

описать уравнение.

В окне регрессии (табл. 9) будут получены зависимая переменная, применяемый метод, число наблюдений, параметры уравнения регрессии, стандартные ошибки, значения t-статистик и соответствующие им вероятности, значение R2 и ряд других показателей.

Таблица 9

Dependent Variable: Y

Method: Least Squares

Date: 04/09/08 Time: 16:15

Sample: 1 28

Included observations: 28

Variable

Coefficient

Std. Error

t-Statistic

Prob.

 

 

 

 

 

C

-19.34739

3.051022

-6.341282

0.0000

X

0.739465

0.045740

16.16669

0.0000

 

 

 

 

 

R-squared

0.909522

 

 

Adjusted R-squared

0.906042

 

 

S.E. of regression

4.834278

 

 

Sum squared resid

607.6263

 

 

Log likelihood

-82.81326

 

 

Durbin-Watson stat

0.606482

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Mean dependent var 27.71429

S.D. dependent var

15.77118

Akaike info criterion

6.058090

Schwarz criterion

6.153247

F-statistic

261.3618

Prob(F-statistic)

0.000000

 

 

 

 

 

 

 

 

В результате расчетов получили уравнение регрессии

у = 19,35 + 0,74∙х.

Из полученного уравнения регрессии следует, что при увеличении уровня механизации х на 1% дневная выработка у увеличивается в среднем на 0,74 ед.

Программа EViews производит расчет следующих статистик:

Стандартная ошибка коэффициента (Std. Error).

Статистика Стьюдента t-статистика (t-Statistic).

Р-значение для t-статистики (Prob.)

Коэффициент детерминации R2 (R-squared).

Скорректированный коэффициент детерминации Radj2 (Adjusted

R-squared).

Стандартная ошибка регрессии s.e.regr. (S.E. of regression).

Сумма квадратов остатков регрессии RSS (Sum squared resid).

Логарифм функции правдоподобия (Log likelihood).

Статистика Дарбина-Уотсона DW (Durbin-Watson stat).

Среднее значение (Mean dependent var).

Стандартное отклонение переменной (S.D. dependent var).

Информационный критерий Акаике AIC (Akaike info criterion).

Информационный критерий Шварца BIC или SC (Schwarz criterion).

33

Статистика Фишера F-статистика (F-statistic).

Р-значение для F-статистики (Prob(F-statistic)).

Рассчитанные статистики позволяют оценить значимость и надежность полученных оценок регрессии и парного уравнения в целом.

Выдвигаем нулевую гипотеза (Н0) о равенстве нулю коэффициента регрессии (Н0:b1 = 0) против альтернативной гипотезы (Н1) о неравенстве нулю коэффициента регрессии (Н1:b1 0).

Программа EViews рассчитывает значение вероятности нулевой ги-

потезы (Prob.). Для наших

расчетов установим уровень

значимости

= 0,05. Коэффициент

b1 являются значимыми,

так как

Prob. = 0,00 < 0,05.

 

 

Чтобы можно было использовать полученную модель на практике необходимо оценить ее значимость. Для оценки надежности выборочного уравнения регрессии применяется F-критерий Фишера. Выдвигаем нулевую гипотезу (Н0) о равенстве нулю коэффициентов регрессии (Н0:bi = 0) против альтернативной гипотезы (Н1) о неравенстве нулю коэффициентов регрессии (Н1:bi 0).

Если Fнабл > F ;p;n-p-1, отвергается нулевая гипотеза – об отсутствии связи между выбранными переменными и уравнение регрессии считается значимым. Программа рассчитывает Fнабл (F-statistic). Для нашего примера Fнабл = 261,36. Для нашего примера уравнение регрессии считается значимым, так как вероятность нулевой гипотезы Prob(F-statistic) меньше уровня значимости Prob. = 0,00 < 0,05 .

Мерой качества уравнения регрессии, характеристикой прогностической силы анализируемой регрессионной модели является коэффициент детерминации.

Величина R2 показывает, какая часть (доля) вариации зависимой переменной обусловлена вариацией объясняющей переменной.

Для оцененной модели коэффициент детерминации (R-squared) равен 0,910. Данное значение показывает, что вариация признака (дневная выработка) на 91% объясняется вариацией фактора (уровень механизации).

Также программа Eviews позволяет построить эмпирическую линию регрессии. Для этого в окне Workfile выделим группу переменных и вы-

берем: View/Graph/Scatter/Scatter with regression. В промежуточном окне не-

обходимо нажать OK. Полученный график (рис. 7) – эмпирическая линия регрессии.

Чтобы построить теоретическую (подогнанную) линию регрессии, необходимо найти теоретические (вычисленные с помощью уравнения регрессии) значения результативного признака. Для этого открыть окно с параметрами уравнения регрессии, далее выбрать Forecast. Появится окно, в котором к исходным добавилась новая переменная YF (прогнозное (теоретическое, выровненное) значение переменной у).

34

Полученный график (рис. 8) – теоретическая (подогнанная) линия регрессии.

Рис. 7. Окно эмпирической линии

Рис. 8. Окно теоретической линии

регрессии

регрессии

Следующая операция возможна только в том случае, если ей предшествует построение регрессионного уравнения. Сохраним остатки полученной регрессии, для этого в окне оцененной регрессии выберем Procs/Make residual series…, укажем имя для остатков (по умолчанию

Resid01).

Вокне регрессии можно выбрать View/Actual,Fitted…/Actual,Fitted…Graph

ипоявится график, представленный на рис. 9. На данном графике переменные Residual – остатки ei, Actual – наблюдаемое значение признака (уi), Fitted – оцененное по уравнению регрессии значение признака.

 

 

 

 

 

 

 

 

 

 

 

 

 

80

 

 

 

 

 

 

 

 

 

 

 

 

 

60

 

 

 

 

 

 

 

 

 

 

 

 

 

40

 

 

 

 

 

 

 

 

 

 

 

 

 

20

15

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

-20

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

-5

 

 

 

 

 

 

 

 

 

 

 

 

 

-10

 

 

 

 

 

 

 

 

 

 

 

 

 

2

4

6

8

10

12

14

16

18

20

22

24

26

28

Residual Actual Fitted

Рис. 9. График случайной составляющей

Также возможно табличное представление данного графика, для этого в окне оцененного уравнения регрессии необходимо выбрать пункт

меню View/Actual,Fitted…/Actual,Fitted…table. Результат представлен

на рис. 10.

35

График остатков позволяет сделать предположения о качестве модели, т.е. необходимо ли выполнять тесты на выявление автокорреляции остатков и гетероскедастичность модели.

Значения ei – отрицательные

Значения ei – положительные

Рис. 10. Окно случайной составляющей

Для оцененной модели можно предположить наличие положительной автокорреляции, так как наблюдается чередование зон, где наблюдаемые значения остатков положительные, и зон, где значения остатков отрицательные. Для проверки данного предположения воспользуемся тестом Дарбина Уотсона. Табличные значение dн = 1,33 и dв = 1,48. Оцененное значение Durbin-Watson stat попадает в диапазон 0 < DW = 0,606 < dн = 1,33. Имеет место положительная автокорреляция.

Оценим модель на гетероскедастичность.

1. Тест Уайта (White Heteroskedasticity). В окне регрессии выберем View/Residual Tests/White Heteroskedasticity (no cross terms). Появится окно,

представленное в табл. 10.

Зависимость квадратов остатков оказалась следующей:

2 = 235,369 – 7,115х + 0,054х2 + и

(11,423)

(10,403)

(9,802)

Значимость коэффициентов при х существенна (tтабл = 2,06). Уравнение в целом надежно Fнабл = 22,483 > Fтабл = 3,40. Следовательно, необходимо признать наличие гетероскедастичности остатков исходя из теста Уайта. При этом количественно гетероскедастичность может быть представлена квадратичной функцией.

36

Таблица 10

White Heteroskedasticity Test:

F-statistic

55.48308

Probability

0.000000

Obs*R-squared

22.85166

Probability

0.000011

 

 

 

 

 

Test Equation:

 

 

 

 

Dependent Variable: RESID^2

 

 

 

Method: Least Squares

 

 

 

Date: 04/11/08

Time: 15:28

 

 

 

Sample: 1 28

 

 

 

 

Included observations: 28

 

 

 

 

 

 

 

 

Variable

Coefficient

Std. Error

t-Statistic

Prob.

 

 

 

 

 

C

235.3685

20.60337

11.42379

0.0000

X

-7.115247 0.683950

-10.40317

0.0000

X^2

0.053753

0.005484

9.801704

0.0000

 

 

 

 

 

R-squared

0.816131

 

 

Adjusted R-squared

0.801421

 

 

S.E. of regression

15.58328

 

 

Sum squared resid

6070.966

 

 

Log likelihood

-115.0372

 

 

Durbin-Watson stat

1.629011

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Mean dependent var

21.70094

S.D. dependent var

34.96974

Akaike info criterion

8.431231

Schwarz criterion

8.573967

F-statistic

55.48308

Prob(F-statistic)

0.000000

 

 

 

 

 

 

 

 

2. Тест Парка. Откроем группу из остатков и переменной х, постро-

им модель вида ln 2 = а + b ln х + и (ls log(resid01^2) c log(x)). Получим рег-

рессию:

Таблица 11

Dependent Variable: LOG(RESID01^2)

Method: Least Squares

Date: 04/14/08 Time: 10:43

Sample: 1 28

Included observations: 28

Variable

Coefficient

 

Std. Error

t-Statistic

 

Prob.

 

 

 

 

 

 

 

 

 

 

 

C

5.640005

 

3.602229

1.565699

 

0.1295

LOG(X)

-0.902552 0.877044

-1.029084

 

0.3129

 

 

 

 

 

 

 

 

 

 

R-squared

0.039137

 

 

Mean dependent var

1.950559

Adjusted R-squared

0.002181

 

 

S.D. dependent var

1.854612

S.E. of regression

1.852588

 

 

Akaike info criterion

4.139794

Sum squared resid

89.23418

 

 

Schwarz criterion

4.234951

Log likelihood

-55.95711

 

 

F-statistic

 

 

1.059014

Durbin-Watson stat

0.908512

 

 

Prob(F-statistic)

0.312919

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В результате получим следующую модель:

ln 2 = 5,635 0,901 ln х.

Проверка уравнения на значимость показывает: R2 = 0,039; F = 1,056; ta = 1,565 и tb = 1,028. По тесту Парка зависимость дисперсии остатков от х проявляется ненадежно: все параметры статистически не значимы, R2 очень низкий, t-критерий и F-статистика меньше табличных значений (t0,95;26 = 2,06; F0,05;1;26 = 4,23). Тест Парка показал отсутствие количественной связи между логарифмом квадратов остатков и логарифмом фактора.

3. Тест Гейзера. В группе остатков и фактора построим модели вида |e| = a + b xc. Зададим значение с = 2; 1; 0,5; 0,5; 1. Для этого в ко-

Estimate/Options/Weighted LS

37

мандной строке программы EViews наберем команды и получим модели, расчеты поместим в табл. 12.

 

 

 

 

 

Таблица 12

с

Команда

Уравнение

Значимость

Связь

4

ls abs(resid01) c 1/(x^4)

|e| = 3,24 + 526604,0x-4

F = 23,04

присутствует

3

ls abs(resid01) c 1/(x^3)

|e| = 3,09 + 35368,30x-3

F = 23,91

присутствует

2

ls abs(resid01) c 1/(x^2)

|e| = 2,62

+ 2327,52x-2

F = 22,14

присутствует

1

ls abs(resid01) c 1/(x)

|e| = 0,87

+ 153,09x-1

F = 14,61

присутствует

0,5

ls abs(resid01) c 1/(x^0.5)

|e| = 2,40 + 46,10x-0,5

F = 9,65

присутствует

0,5

ls abs(resid01) c x^0.5

|e| = 8,58

0,62x0,5

F = 2,56

отсутствует

1

ls abs(resid01) c x

|e| = 5,39

0,03x

F = 0,945

отсутствует

Из теста Гейзера следует, что абсолютная величина остатков достаточно сильно зависит от х-3.

Проведенные тесты показывают наличие гетероскедастичности. Истинные значения ошибок дисперсии нам не известны, поэтому мы не можем использовать взвешенный метод наименьших квадратов (the method of weighted least squares) для скорректированных в рамках гетероскедастичности стандартных ошибок и значения t-критерия. Мы можем сделать только предположение о природе дисперсии ошибок: дисперсия ошибок пропорциональна квадрату факторной переменной (тест Уайта), либо пропорциональна факторной переменной в степени 3 (тест Гейзера).

Применим преобразование квадратного корня ( E(ei2) 2x2 ). В ок-

не оцененной регрессии (рис. 11) нажимаем и используем вес 1/х.

Рис. 11. Преобразование 1/х

Выполнив преобразование, получили модель:

y5,27 1 0,50 . x x

Проверка уравнения на значимость показывает: R2 = 0,26; F = 175,39;

38

ta = 3,00 и tb = 12,34. По сравнению с моделью у = 19,35 + 0,74х, оце-

ненной обычным МНК, полученная модель хуже.

Применим преобразование факторной переменной в степени 4

2

2 2

( E(ei ) ). В окне оцененной регрессии используем вес х . x4

Выполнив преобразование, получили модель:

y

37,55

1

0,98

1

x2

x2

x

 

 

Проверка уравнения на значимость показывает: R2 = 0,99; F = 735,16; ta = 12,47 и tb = 27,11. По сравнению с моделью у = 19,35 + 0,74∙х, оце-

ненной обычным МНК, полученная модель значительно лучше.

2.2. Использование EViews для построения нелинейных однофакторных моделей

Программа EViews может быть использована для построения различных типов регрессионных моделей.

Для данных (см. табл. 2) построим нелинейные модели, оценим адекватность полученных результатов и выберем наилучшую модель.

В разд. 2.1 была проанализирована линейная регрессия. Полученная модель: у = 19,35 + 0,74х, статистики R2 = 0,91; F = 261,36.

Рассчитаем параметры следующих нелинейных моделей: степенной y = axb, показательной y = abx, логарифмической y = a + blnx, равносто-

ронней гиперболы y = a + b , квадратичной y = a + bx2, полиномиальной x

y = a + b1x + b2x2 и выберем наилучшую из них.

Степенная модель – это нелинейная модель внутренне нелинейна. Однако ее можно считать внутренне линейной, ибо логарифмирование данного уравнения по основанию е приводит его к линейному виду: ln y = ln a + b∙ln x + ln . Аналогично можно привести к линейному виду показательную функцию: ln y = ln a + x∙ln b + ln .

Промежуточные результаты занесем в табл. 13.

Уравнения линейной, показательной, квадратичной и полиномиальной регрессий достаточно хорошо описывают исходные данные. В данных моделях значений критериев адекватности довольно высоко (F- критерий, коэффициент детерминации R2). Некоторое предпочтение можно отдать квадратичной функции, для которой коэффициент детерминации и критерий Фишера наибольшие.

39

 

 

 

 

 

Таблица 13

Функция

Команда

Уравнение регрессии

Адекват-

EViews

ность

 

 

 

 

Линейная

ls у c х

у = 19,35 + 0,74х

R2 = 0,910

 

 

 

F = 261,36

 

 

 

 

 

Степенная

ls log(y) c log(x)

ln y = 3,18 + 1,54∙ln x

R2 = 0,870

y = е 3,18 х1,54 = 0,04х1,54

F = 175,06

 

 

Показательная

ls log(y) c x

ln y = 1,11 + 0,03x

R2 = 0,928

y = е1,11 е0,03х = 3,03∙1,03х

F = 335,13

 

 

Логарифмическая

ls у c log(x)

у = 104,81 + 32,42∙ln(х)

R2 = 0,698

 

 

 

F = 60,179

 

 

 

 

 

Гиперболы

ls у c 1/x

у = 44,41 900,23∙

1

 

R2 = 0,412

 

F = 18,242

x

 

 

 

 

Квадратичной

ls у c х^2

у = 0,380 + 0,006х2

R2 = 0,976

 

 

 

F = 1078,7

 

 

 

 

 

Полиномиальная

ls у c x х^2

у = 5,8 0,19х + 0,008х2

R2 = 0,979

 

 

 

F = 587,98

 

 

 

 

 

2.3. Использование EViews для построения линейной многофакторной модели

При изучении влияния стоимости основных и оборотных средств на величину валового дохода по 25 предприятиям были получены данные, представленные в табл. 14.

 

 

 

Таблица 14

Номер

Валовой доход

Среднегодовая

Среднегодовая

стоимость основ-

стоимость оборот-

предприятия

за год, млн руб.

ных фондов,

ных средств,

 

 

млн руб.

млн руб.

N

DOXOD

OF

OBS

1

45

17

54

2

48

20

78

3

50

80

100

4

52

65

114

5

56

124

42

6

45

100

38

7

63

28

56

8

69

36

59

9

75

98

46

10

80

114

65

11

88

102

56

12

90

96

50

13

99

102

87

40

 

 

 

Окончание табл. 14

 

 

Среднегодовая

Среднегодовая

Номер

Валовой доход

стоимость основ-

стоимость оборот-

предприятия

за год, млн руб.

ных фондов,

ных средств,

 

 

млн руб.

млн руб.

N

DOXOD

OF

OBS

14

75

116

54

15

113

50

63

16

118

60

75

17

65

56

28

18

111

87

56

19

121

112

45

20

160

115

88

21

176

120

74

22

186

110

90

23

192

111

102

24

203

118

105

25

237

154

106

Построим линейное уравнение множественной регрессии

DOXOD = b0 + b1 OF + b2 OBS

и поясним экономический смысл его параметров.

Для этого в командной строке программы EViews введем команду ls DOXOD c OF OBS. В результате получим результат, представленный в табл. 15.

Таблица 15

Dependent Variable: DOXOD

Method: Least Squares

Date: 04/17/08 Time: 11:48

Sample: 1 25

Included observations: 25

Variable

Coefficient

 

Std. Error

t-Statistic

 

Prob.

 

 

 

 

 

 

 

 

 

 

 

C

-34.12082

 

28.84270

-1.182997

 

0.2494

OF

0.787621

 

0.228615

3.445179

 

0.0023

OBS

1.007708

 

0.345494

2.916716

 

0.0080

 

 

 

 

 

 

 

 

 

R-squared

0.540413

 

 

Mean dependent var 104.6800

Adjusted R-squared

0.498633

 

 

S.D. dependent var

56.29737

S.E. of regression

39.86264

 

 

Akaike info criterion

10.32092

Sum squared resid

34958.66

 

 

Schwarz criterion

10.46719

Log likelihood

-126.0115

 

 

F-statistic

 

 

12.93455

Durbin-Watson stat

0.587820

 

 

Prob(F-statistic)

0.000193

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Получили уравнение регрессии

DOXOD = 34,121 + 0,788∙OF + 1,008∙OBS.

Коэффициент регрессии b1 показывает, что при увеличении на 1 млн руб. среднегодовой стоимости основных фондов (OF) валовой