Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика (лабораторные)

.pdf
Скачиваний:
177
Добавлен:
01.03.2016
Размер:
1.96 Mб
Скачать

близкие статистически значимые результаты, то это подтверждает соответствие оцененной формулы реальной взаимосвязи переменных.

Задача 7.1. Найти параметры A, , производственной функции

Кобба–Дугласа Y A K L e

для данных об объеме производства Y,

капитальных затратах K и затратах труда L некоторой страны за 17 лет:

 

 

T

 

 

 

 

 

 

 

 

Выпуск Y

 

Капитал K

Труд L

 

 

 

 

 

 

 

 

 

 

1

 

100

 

100

100

 

 

2

 

112

 

114

110

 

 

3

 

124

 

131

123

 

 

4

 

143

 

149

125

 

 

5

 

151

 

176

138

 

 

6

 

155

 

198

140

 

 

7

 

153

 

216

145

 

 

8

 

184

 

236

154

 

 

9

 

189

 

266

154

 

 

10

 

227

 

335

196

 

 

11

 

218

 

397

193

 

 

12

 

179

 

417

147

 

 

13

 

165

 

425

155

 

 

14

 

144

 

477

167

 

 

15

 

188

 

493

188

 

 

16

 

192

 

500

190

 

 

17

 

210

 

520

150

 

Решение.

 

 

 

 

 

Логарифмируя обе

части

уравнения

Кобба–Дугласа, имеем

lnY ln A ln K ln L .

Обозначив

y ln Y, k ln K, l ln L ,

получим

линейное

уравнение

множественной

регрессии

y ln A k l , для которого требуется найти коэффициенты.

Создайте файл «лаб7.хls». Разместите данные задачи и их подписи в ячейки А2:D19. В ячейки F2, G2, H2, I2 внесите подписи данных t, y lnY, k ln K, l ln L соответственно. Далее введите преобразованную

формулу Кобба–Дугласа согласно таблице:

Ячейка

Формула

F3

=A3

G3

=LN(B3)

 

H3

=LN(C3)

 

I3

=LN(D3)

 

Формулы диапазона F3:I3 растяните на диапазон F3:I19. Получаем следующую вспомогательную рабочую таблицу:

71

Примените функцию ЛИНЕЙН, указав в качестве известных значений Y диапазон G3:G19, а известных значений X– диапазон H3:I19. Закончите ввод данных одновременным нажатием <CTRL>+<SHIFT>+<ENTER>.

Выведите результаты в диапазон ячеек А22:С26.

Таким

образом,

ln A 0,284445, 0,063371, 0,890318 . Чтобы найти

А, в ячейке А28

введем формулу «=exp(С22)». Получим А=1,329025.

Далее,

пользуясь

 

 

ˆ

Редактором формул, введем в ячейку А30 формулу-комментарий Y , в

ячейки С30 и D30 – буквы K и L соответственно. В ячейки В30, С29 и D29

введем формулы «=А28», «=В22» и «=А22» соответственно. Вид искомой

функции Y 1,329025K

L

. Это означает, что увеличение капитала на

ˆ

0,063371 0,890318

 

1% приведет к росту выпуска продукции на 0,063371%, а увеличение затрат труда на 1% – к росту выпуска на 0,890318%, т.е. вложения в капитал оказываются более выгодными. Так как 0,063371+0,890318<1, то функция показывает убывающую отдачу от масштабов производства.

Задача 7.2. Используя данные задачи 7.1, определите влияние

технического прогресса на выпуск продукции.

 

 

 

Решение.

 

 

 

 

 

 

Усовершенствованный

вариант

функции

имеет

вид

Y A K L ert e .

Множитель

ert отражает влияние на

выпуск

продукции технического прогресса,

r – темп прироста выпуска благодаря

техническому прогрессу.

 

 

 

 

 

Для нахождения

параметров

данной

модели

применительно к

имеющимся данным еще раз примените функцию ЛИНЕЙН. Для этого скопируйте содержимое ячеек А2:А19 в ячейки J2:J19, так как все

72

переменные модели ( k, l, t ) должны располагаться рядом при

использовании этой функции. Выведите весь массив значений функции в диапазон F22:I26. В ячейке F28 введем формулу «=ехр(I22)», чтобы найти значение А. Искомая функция, которая вводится аналогично функции

задачи 7.1, имеет вид

ˆ

1,322788K

0,065149 0,889593

0,00018t

. Однако

Y

L

å

целесообразность включения в модель нового фактора следует проверить. Для этого выведем матрицу парных коэффициентов корреляции (вместе с метками) в диапазон К22:О26 способом, описанным в предыдущих работах (ДАННЫЕ Анализ данных Корреляция). То, что коэффициент корреляции между ln K и t составляет 0,985105, означает, что данные факторы мультиколлинеарны. Поэтому включать в модель фактор времени нецелесообразно.

Вопросы для самопроверки

6.Можно ли с помощью МНК оценить по выборочным данным

7.(Xt , Kt , Lt ) (t 1,T) параметры производственной функции Кобба–

Дугласа?

8.Указать формулы эластичности производственной функции Кобба– Дугласа.

9.Изменятся ли свойства случайного отклонения при преобразовании уравнения регрессии?

10.Что понимается под спецификацией модели?

11.Назовите основные виды ошибок спецификации.

Лабораторная работа № 8

Тема: Множественная регрессия

Изучение связи между двумя и более связанными между собой признаками решается с помощью множественного регрессионного анализа. Он широко используется, например, в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макро– экономических расчетах и др. Основная цель множественной регрессии:

построение модели с большим числом факторов;

определение и сравнение степени влияния различных факторов в отдельности на моделируемый показатель;

73

выделение прямого (непосредственного) влияния факторов на результативный фактор и косвенного влияния фактора (через другие факторы) на результат;

выявление существенности влияния отдельного фактора (или группы факторов) на результативный признак на фоне других факторов и др.

Выбор факторов, влияющих на исследуемый показатель производится, прежде всего, исходя из содержательного экономического анализа. Для получения надежных оценок в модель не следует включать слишком много факторов. Их число не должно превышать одной трети объема имеющихся

данных (т.е. ð n3 ). Для определения наиболее существенных факторов

могут быть использованы коэффициенты линейной и множественной корреляции, детерминации и частные коэффициенты корреляции.

При изучении зависимости методами множественной регрессии задача формулируется так же, как и при использовании парной регрессии, т.е. требуется определить аналитическое выравнивание связи между зависимой переменной Y и объясняющими переменными Х1 , Х 2 ,...,Х р ,

найти функцию модельной регрессии

 

 

M (Y | x1 , x2 ,..., xp ) f (x1 , x2 ,..., xp ).

 

Задача

оценки статистической взаимосвязи переменных Y и

Х1 , Х 2 ,...,Х р

формулируется аналогично случаю парной регрессии.

 

Уравнение множественной регрессии в общем виде может быть

представлено как

 

 

Y f (β, X) ,

где

X (Х1 , Х 2 ,...,Х р ) – вектор независимых (объясняющих) переменных;

β

– вектор

неизвестных параметров, подлежащих определению; –

случайная ошибка (возмущение); Y– зависимая (объясняемая) переменная. Предполагается, что для данной генеральной совокупности именно функция f связывает исследуемую переменную Y с вектором

независимых переменных X .

Теоретическое уравнение (модель) множественной линейной регрессии записывается в виде

Y 0 1 X1 2

X2

... p X p ,

(8.1)

где Х1 , Х 2 ,...,Х р

независимые

(факторные) переменные,

– ошибка,

ассоциируемая

с

моделью.

В

уравнении (8.1)

выражение

74

Mx (Y) 0 1 X1 2 X2 ... p X p является детерминированной

компонентой, а отклонение от нее характеризуется случайной ошибкой . Случайная составляющая отражает влияние на зависимую переменную большого числа факторов, которые не вошли в детерминированную составляющую, поскольку влияние каждого из них незначительно и др.

 

 

Для индивидуальных наблюдений i

( i

1,n

; n p ) выражение (8.1)

запишется в виде

 

 

 

 

 

yi

0 1 xi1 2 xi 2

... p

xip i ,

где yi – значение

объясняемой переменной в

i -м наблюдении; xij

известное значение

j -й объясняющей переменной в i-м наблюдении; i

случайная составляющей переменной Y в i -м наблюдении; 0 – свободный

член,

который формально показывает среднее

значение Y при

 

 

 

 

 

 

 

 

Х1 Х 2

... Х р 0;

( j j 1, p )

называется

j

теоретическим

коэффициентом регрессии (частичным коэффициентом регрессии).

Для оценки неизвестных параметров регрессии предполагается

наличие

n

наблюдений

вектора

объясняющих

переменных

X (Х1 , Х 2 ,...,Х р ) и зависимой переменной Y .

 

Как и в случае парной регрессии, истинные значения параметров0 , 1 ,..., p получить невозможно. В этом случае вместо теоретического

(модельного) уравнения регрессии (8.1) оценивается так называемое эмпирическое уравнение регрессии

Y b0 b1 X1 b2 X2 ... bp X p e,

где b0 , b1 ,..., bp , называемые эмпирическими коэффициентами регрессии,

являются оценками соответствующих теоретических параметров регрессии0 , 1 ,..., p ; e – оценка возмущения . Для индивидуальных наблюдений

имеем:

yi b0

b1 xi1 b2 xi 2

... bp

xip ei .

Самым распространенным методом оценки

неизвестных параметров

0 , 1 ,..., p уравнения

множественной

регрессии является метод

наименьших квадратов (МНК). Оценивание неизвестных коэффициентов модели методом наименьших квадратов состоит, как известно, в

минимизации по всем возможным значениям b0 , b1 ,..., bp

суммы квадратов

n

2

n

p

xij

2

Q(b0 ,b1 ,...,bp ) ei

yi

(b0 bj

) .

i 1

 

i 1

j 1

 

 

75

3. D( i ) M ( i2 ) 2

Необходимым условием минимума функции Q(b0 ,b1 ,...,bp ) является равенство нулю всех ее частных производных по bj , которые являются в свою очередь линейными функциями:

Q

 

n

 

 

p

 

 

 

 

 

 

 

 

 

2 yi

(b0

bj

xij

) ( 1)

0,

 

 

 

b0

 

 

 

 

 

i 1

 

 

j 1

 

 

 

 

 

 

 

Q

 

n

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 yi

(b0

bj

xij ) xij ( xik

) 0 (k 1, p).

 

 

 

bj

 

i 1

 

 

 

 

 

 

 

 

 

 

 

j 1

 

 

 

 

 

Полученная система из (р + 1) линейных алгебраических уравнений с (р+1) неизвестными b0,b1,…,bp называется системой нормальных уравнений. При введении искусственной нулевой переменной xi0 1 нормальные уравнения приобретают в развернутом виде следующую форму:

n b0 b1 xi1 b2 xi 2 bj xij

bp xip yi ,

 

 

 

 

 

 

 

 

 

 

 

xi1

b1 xi21 b2 xi1 xi 2 bj

xi1 xij

bp

xi1 xip

yi

 

xi1 ,

b0

 

.................................................................................................................................

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(8.2)

 

 

xij

b1 xi1 xij

b2 xi 2 xij bj

 

xij2 bp

xij

xip yi

xij ,

b0

 

 

.................................................................................................................................

 

 

 

 

 

 

 

b

 

 

 

x

 

b

 

 

 

x

 

b

 

 

 

 

 

x

 

b

 

 

 

 

 

 

 

 

x

 

 

b

x

ip

x

i1

ip

x

i 2

ip

j

x

ij

ip

p

x2

y

i

ip

.

0

 

 

1

 

 

2

 

 

 

 

 

 

 

 

 

 

ip

 

 

 

 

Система (8.2) имеет единственное решение. Ее можно решать или методом подстановки или методом Гаусса.

Для получения оптимальных оценок неизвестных коэффициентов регрессии, проверки качества модели, свойств ее параметров и др. предполагается выполнение следующих предпосылок (предположений):

1.Х1 , Х 2 ,...,Х р – детерминированные переменные.

2.M ( i ) 0 для всех наблюдений i . Это означает, что в

повторяющихся

выборочных

наблюдениях

(xi1 , xi 2 , , xip , yi )

единственным источником случайных возмущений значений yi являются случайные возмущения регрессионных остатков i .

для всех наблюдений i (свойство

гомоскедастичности регрессионных остатков).

Гомоскедастичность наблюдений означает, что интенсивность случайных возмущений не изменяется ни при изменениях факторов, ни во времени, в течение которого делаются наблюдения.

76

Если же это условие не выполняется, то наблюдения гетероскедастичны (дисперсии возмущений не постоянны).

4. M ( i j ) 0 при i j – отсутствие систематической связи

между значениями случайной составляющей в любых двух наблюдениях (отсутствие автокорреляции).

5. Часто добавляется условие:

 

i

N (0, 2 ) , т.е.

 

i

– нормально

 

 

 

 

 

распределенная случайная величина со средним O и дисперсией 2 . Это предложение выполняется очень часто. Причина заключается в том, что согласно центральной предельной теореме влияние множества случайных величин с примерно одинаковыми дисперсиями эквивалентно влиянию единственной случайной величины с нормальным законом распределения.

Если не оговорено противное, то в число объясняющих переменных включается переменная X 0 , тождественно равная единице: xi 0 1 ( i 1, n ).

Определенная указанным способом модель наблюдений называется нормальной линейной моделью с p объясняющими переменными или

нормальной линейной моделью множественной регрессии переменной Y на переменные Х1 , Х 2 ,...,Х р .

Пятое условие не является необходимым для оценки параметров регрессии. Однако оно необходимо для получения доверительных интервалов отдельных параметров регрессии и уравнения в целом, так и при проверке гипотез о значимости (существенности) параметров регрессии и уравнения в целом.

Система нормальных уравнений (8.2) в матричной форме запишется в

виде:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(X T X) b X T Y .

 

(8.3)

Для решения

матричного уравнения (8.3) относительно b

умножим

обе части

слева

на матрицу

(X T X ) 1

(det(XT·X) 0),

обратную

невырожденной матрице X T

X . В итоге имеем:

 

 

 

 

b ( X

T

X )

1

( X

T

 

ˆ

(8.4)

 

 

 

 

 

 

Y ) β ,

где

 

 

 

 

 

 

 

 

 

 

 

 

y1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y y2

 

– случайный вектор-столбец (матрица-столбец) размерности

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yn

 

 

 

 

 

 

 

 

 

 

 

 

( n 1 ) наблюдаемых значений результативного признака;

77

 

1

x11 ...

x1 p

 

 

 

 

 

 

 

 

 

 

 

 

 

1

x21 ...

x2 p

 

 

 

 

...

... ...

...

матрица

размерности

(n ( p 1))

X

 

 

 

 

1

xi1 ...

xip

 

 

 

 

...

... ...

...

 

 

 

 

 

 

 

 

 

 

 

 

 

1

xn1 ...

xnp

 

 

 

 

 

 

 

 

 

 

 

 

наблюдаемых значений факторных признаков. Один столбец матрицы Х – это вектор значений одной из независимых переменных. Добавление 1 к общему числу факторов p учитывает свободный член 0 в уравнении

регрессии.

 

 

Значения фактора X 0

для свободного члена принято считать

равными единице (n p) ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

1

 

– вектор-столбец (матрица-столбец) размерности (( p 1) 1)

β

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

 

 

 

неизвестных параметров, надлежащих определению;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

ε

 

1

 

 

 

 

вектор-столбец

(матрица-столбец) размерности (n 1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

регрессионных остатков (случайных ошибок или возмущений);

 

 

 

 

1

 

0

...

0

 

 

 

 

 

 

0

 

1

...

0

 

 

En

 

 

 

– единичная матрица размерности n n;

 

 

 

...

 

...

...

...

 

 

 

 

 

0

 

0

0

1

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

0

 

 

 

– вектор-столбец (матрица-столбец) размерности n 1;

 

...

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

78

 

 

 

 

 

 

 

 

M (

 

)

 

 

 

 

 

0

 

 

 

 

1

 

1

 

 

 

 

 

1

M (

 

1 )

 

T

 

 

 

2

cov( ε) ε M (ε ε

 

) M

 

 

 

( 1 2 ... n )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

...

...

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M ( )

 

 

 

 

n

 

 

 

 

 

 

 

n

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M (

 

 

) ...

M (

 

)

 

M ( 1

 

2

) ...

M ( 1

n

)

 

2

 

2

 

2

n

 

...

 

 

...

...

 

 

 

M ( n 2 ) ...

 

 

 

 

M ( n n )

 

M (

2 )

M (

 

) ...

M (

)

 

 

1

1

2

2

 

1 n

 

 

= M ( 2 1 )

M (

2

) ...

M ( 2 n )

– ковариационная матрица раз–

...

 

...

 

 

...

...

 

 

 

 

 

M ( n 2 ) ...

M ( n2 )

 

 

M ( n 1 )

 

 

мерности

n n

регрессионных остатков;

 

b

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

b b1

 

вектор-столбец (матрица-столбец) размерности (( p 1) 1)

 

 

 

 

 

 

 

 

 

 

...

 

 

 

 

 

 

 

 

 

bp

 

 

 

 

 

 

 

 

оценок неизвестных коэффициентов модели;

e1e

e 2 – вектор-столбец (матрица-столбец) размерности n 1 оценок

...

en

регрессионных остатков.

По аналогии с парной регрессией после определения точечных

оценок

bj коэффициентов

j ( j 0, p)

теоретического

уравнения

регрессии

могут быть

проверены

статистическая

значимость

(существенность) коэффициентов линейной регрессии и найдены для них интервальные оценки в рамках нормальной модели множественной линейной регрессии.

Для проверки статистической значимости коэффициентов

множественной линейной регрессии

применяют гипотезу H0 : j

0

 

 

 

 

 

против альтернативной

H1 : j 0 ( j 0, p) .

 

Нулевая гипотеза

соответствует

предположению о том, что

j

объясняющая переменная не имеет существенного значения с точки зрения

79

объяснения изменчивости значений объясняемой переменной Y , так что она может быть исключена из модели.

Для

проверки гипотезы

H 0

о том,

что

она

 

верна,

 

используется

статистика

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

bj j

 

 

bj

 

 

 

 

bj

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

b

j

S(bj

)

Se

( X T X ) 1 jj

Se

 

c jj

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

имеющая

в данной ситуации распределение Стьюдента с числом степеней

свободы

n p 1 ( n

объем выборки). При требуемом уровне

значимости

 

наблюдаемое

значение

t –статистики

 

сравнивается

с

критическим

tкр

t

;n p 1

распределения Стьюдента.

Если

 

tb j

 

t

,

то

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

;n p 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

коэффициент bj , следовательно и j , считается статистически значимым;

в противном случае ( tb j t 2 ;n p 1 ) коэффициент j считается статистически

незначимым (статистически близким к нулю). Это означает, что фактор X j

линейно не связан с зависимой переменной Y . Его наличие среди объясняющих переменных не оправдано со статистической точки зрения. Не оказывая сколько-нибудь серьезного влияния на зависимую переменную, он лишь искажает реальную картину взаимосвязи. Поэтому переменную X j следует исключить из уравнения регрессии. Это не

приведет к существенной потере качества модели, но сделает ее более конкретной.

Впрочем, выводы о статистической значимости или незначимости того или иного параметра модели зависят от выбранного уровня значимости : решение в пользу статистической значимости параметра может изменяться на противоположное при уменьшении , а решение в пользу статистической незначимости параметра может изменяться на противоположное при уменьшении значения .

Зачастую строгая проверка значимости коэффициентов заменяется простым сравнительным анализом:

 

если

 

tb j

1

(bj S(bj )) , то

коэффициент

j

статистически

незначим;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

если

1

tbj

2

(bj 2S(bj )) ,

то коэффициент

j

относительно

статистически значим. В данном случае рекомендуется воспользоваться таблицей критических точек распределения Стьюдента;

80