Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Эконометрика.pdf
Скачиваний:
111
Добавлен:
28.02.2016
Размер:
1.4 Mб
Скачать

если включены лишние переменные в уравнение регрессии, то оценки коэффициентов регрессии будут несмещенными, но при этом неэффективными.

Маловероятно, что оценка первоначальной спецификации уравнения регрессии даст хорошие по всем параметрам результаты. Если оцененная по ряду статистических характеристик (DW, t-статистики, F-статистики) модель множественной регрессии нереалистична, то необходимо провести уточнение состава объясняющих переменных и вновь оценить коэффициенты уравнения регрессии.

Тема 6. Модели множественной регрессии с переменной структурой

6.1. Фиктивные и нефиктивные переменные

Объясняющие переменные в регрессионных моделях отражают количественные характеристики (объем производства, спрос, цену, размер заработной платы и т.д.) и поэтому имеют непрерывные области значений.

Однако некоторые переменные отражают какую-либо качественную сторону исследуемых процессов (качество вспашки, цвет окраски автомобиля, уровень квалификации персонала и т.п.). Такие переменные могут принимать всего два значения или дискретное множество значений.

Например, проанализируем с использованием фиктивной переменной зависимость урожайности пшеницы Y от вида вспашки z и количества внесенного органического удобрения x. По виду вспашки поля характеризуются двумя категориями: зяблевая и весенняя. Вид вспашки не влияет на количество внесенных удобрений, но обуславливает различия в урожайности. В этом случае уравнение регрессии будет иметь вид:

y = а0 + а1 x + cz + ε,

(6.1)

где z – фиктивная переменная, т.е. искусственно введенная переменная, величина которой отражает эффект вида вспашки, а именно z = 1 для зяблевой и z = 0 для весенней вспашки.

Если мы располагаем экспериментальными данными по величине урожайности для весенней и зяблевой вспашки, то используя регрессионный анализ, можем оценить численные значения коэффициентов регрессии а0, а1, c. Коэффициент c – коэффициент при фиктивной переменной z, он дает численную величину эффекта вида вспашки. Следует отметить, что в модели множественной регрессии всегда желательно присутствие хоть одной нефиктивной переменной, т.к. дисперсия фиктивной переменной очень мала и это сказывается на достоверности оценок. В модели с фиктивными переменными коэффициент детерминации R2 часто бывает очень малым, а значения t-статистики незначительно отличаются от 0 для фиктивных переменных. Однако не следует выбрасывать фиктивные переменные из модели, т.к. они описывают небольшие, но важные поправки к нефиктивной (объясняющей) переменной.

Модель может включать не одну, а несколько фиктивных переменных:

y = а0 + а1 x +c1z1 +c2z2 +c3z3 + ε

(6.2)

49

6.2. Сезонные фиктивные переменные

Сезонные фиктивные переменные – совокупность фиктивных переменных, предназначенных для обозначения различных времен года, кварталов, месяцев и т.п. Эту переменную следует выделять, когда имеет место значительное воздействие на результирующую переменную Y сезонного фактора.

Сумма сезонных отклонений должна равняться нулю.

6.3. Зависимая фиктивная переменная

Иногда фиктивные переменные могут быть использованы для объяснения поведения зависимой переменной. Например, если исследовать зависимость наличия автомобиля от дохода, пола субъекта и т.п., то зависимая переменная имеет два возможных значения: 0, если машины нет, и 1, если машина есть. Однако если для моделей данного типа использовать обыкновенный МНК, то полученные оценки не обладают свойствами наилучших линейных несмещенных оценок. Поэтому в этом случае используются другие методы.

Линейная вероятностная модель.

Рассмотрим модели, в которых зависимая переменная выражается в виде фиктивной (двоичной) переменной. Объясняющие переменные могут быть как количественные, так и качественные.

Представим рассматриваемую модель в виде:

Y = β0 1X1 +K+βm Xm + γ1D1 +K+ γk Dk + ε

(6.3)

Например, пусть Υ – результат сдачи с первой попытки экзамена в ГАИ; Χ1 – количество часов вождения в автошколе; Χ2 – средний процент выпускников данной школы, сдающих экзамен в ГАИ

с первой попытки;

 

D3 – использование компьютерной методики обучения.

 

В этой ситуации:

 

Y =

0

– экзамен не сдан с первой попытки

 

1

– экзамен сдан с первой попытки

 

 

 

Пусть 0 ≤ Χ1 ≤ 50, 0 ≤ Χ2 ≤ 100,

 

D3 =

0

– компьютеры не использовались

 

1

– компьютеры использовались

 

 

 

Тогда получим следующую модель:

(6.4)

 

 

Y = β0 + β1 X 1 + β2 X 2 + γ 3 D3 + ε

Модели вида (6.3), (6.4) называются линейными вероятностными моделями.

Суть этого названия поясним на простейшем примере:

(6.5)

 

 

Y = β0 + β1 X + ε

При использовании модели (6.5) среднеожидаемое значение Y (условное математическое ожидание ) при Х = х с учетом того, что М(εi ) = 0, определяется соотношением М(Y/х) = 0 × Р(Y = 1/x) + 1 × P(Y = 1/x) = P(Y = 1/x).

Следовательно, из (6.5) имеем:

Р(Y =1 / x) = β0 + β1 X

(6.6)

Применимость МНК к моделям такого типа имеет определенные ограничения:

50

1. Случайные отклонения εi в данных моделях не являются нормальными случайными величинами, а скорее всего имеют биноминальное распределение.

εi

=1 β0 β1 xi при уi =1,

εi

= −β0 β1 xi при уi = 0.

Однако с ростом объема выборки биноминальное распределение стремится

кнормальному.

2.Случайные отклонения εi не обладают свойством постоянной дисперсии (гомоскедастичности), т.е. D (εi) зависит от вероятностей соответствующих значений Υ, которые, в свою очередь, зависят от выбранных значений Χ.

3.Использование формул (6.3)-(6.5) может привести к ситуации, когда не-

которые уi будут меньше нуля либо больше единицы. Для устранения данной проблемы нужно рассматривать logit модель.

4.Применение линейной вероятностной модели проблематично с содержательной точки зрения. Действительно, увеличение в (6.5) значения перемен-

ной Х на одну единицу приводит к изменению значения Y на величину β1 вне зависимости от конкретного значения Х, что противоречит теоретическим и практическим выкладкам.

Logit модель.

 

 

pi

 

 

ln

 

 

= β0 + β1xi ,

(6.7)

1

 

 

pi

 

где рi = М(Y = 1/xi) – условная вероятность.

Для ее оценки можно использовать МНК. Однако для этого необходимо знать значения зависимой переменной ln1pipi , которые обычно неизвестны.

Поэтому необходимо определить значения рi. В случае, если имеется выборка сгруппированных данных, в качестве рi можно использовать ее оценку р)i = nni .

Тема 7. Модели множественной регрессии с гетероскедастичными и автокоррелируемыми остатками

7.1. Экономические причины гетероскедастичности

Свойства оценок коэффициентов регрессии зависят от свойств остаточной случайной составляющей (ε) в уравнении регрессии. В моделях с гетероскедастичными остатками ошибки в разных наблюдениях некоррелированные (независимые), но их дисперсии имеют разные значения (рис. 2.3.1).

51

Y

X

Рис. 2.3.1. Модель с гетероскедастичными остатками

Таким образом, гетероскедастичность – это нарушение второго условия теоремы Гаусса-Маркова, которое заключается в том, что дисперсия случайной остаточной величины зависит от номера наблюдения (непостоянство дисперсий отклонений). Гетероскедастичность приводит к увеличению дисперсии оценок параметров регрессии и получению неправильного представления о точности уравнения регрессии. Т.е. если имеет место гетероскедастичность, то оценки коэффициентов уравнения регрессии (например, в случае парной регрессии это а0 и а1), найденные с помощью классического метода наименьших квадратов неэффективны и для определения более точных их значений следует применять обобщенный метод наименьших квадратов. Стандартные ошибки, вычисленные при гетероскедастичности, занижены по сравнению с истинными значениями.

Гетероскедастичность имеет место в случаях, когда неоднородны либо анализируемые объекты, либо условия их функционирования, т.е. когда значения переменных, входящих в уравнение регрессии, значительно различаются в разных наблюдениях (в наблюдениях во времени либо в пространстве). Например, если исследуется зависимость производственных затрат предприятия от какихлибо факторов (объема выпускаемой продукции, размера основных фондов и др.), то естественно ожидать, что для крупных предприятий колебания объема затрат будут больше.

Причиной гетероскедастичности могут быть и ошибки в исходных данных. Случайные неточности в начальной информации, такие как ошибки в порядке чисел, могут существенно повлиять на результаты.

Гетероскедастичность может иметь место при анализе временных рядов: если значения переменных x и y увеличиваются во времени, дисперсия остаточной случайной составляющей тоже будет расти.

7.2. Обнаружение гетероскедастичности

Появление проблемы гетероскедастичности часто можно предвидеть заранее, основываясь на характерных особенностях данных. В этих случаях можно выполнить соответствующие действия по устранению этого эффекта на этапе спецификации модели регрессии. Для этого существует ряд статистических тес-

52

тов на гетероскедастичность, например: тест Уайта, тест Голдфелда-Куандта, тест Бреуша-Пагана и др.

Графический анализ остатков

Использование графического представления отклонений позволяет определиться с наличием гетероскедастичности. В этом случае по оси абсцисс откладываются значения i ) объясняющей переменной X (либо линейной комбинации

объясняющих переменных Y = a0

+ a1 X1 + ... + an Xn ), а по оси ординат – либоот-

клонения еi , либо их квадраты еi2

i= 1, 2, ..., п. Примеры таких графиков приведе-

ны на рис. 2.3.2.

 

 

 

 

 

 

 

ei2

 

 

ei2

 

 

 

ei2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ei2

а)

xi

б)

xi

в)

xi

 

 

 

2

 

 

 

 

 

ei

 

 

г)

xi

д)

xi

 

 

Рис. 2.3.2. Графический анализ остатков

На рис. 2.3.2 (а) все отклонения еi2 находятся внутри полуполосы постоянной ширины, параллельной оси абсцисс. Это говорит о независимости дисперсий еi2 от значений переменной X и их постоянстве, т.е. в этом случае выполняются условия гомоскедастичности.

На рис. 2.3.2 (б)-(д) наблюдаются некоторые систематические изменения в соотношениях между значениями хj , переменной X и квадратами отклонений еi2. На рис. 2.3.2 (в) отражена линейная, 2.3.2 (г) квадратичная, 2.3.2 (д) – гиперболическая зависимости между квадратами отклонений и значениями объясняющей переменной X. Другими словами, ситуации, представленные на рис. 2.3.2 (б)-(д), отражают большую вероятность наличия гетероскедастичности для рассматриваемых статистических данных.

Отметим, что графический анализ отклонений является удобным и достаточно надежным в случае парной регрессии. При множественной регрессии графический анализ возможен для каждой из объясняющих переменных Xj , j = 1, 2, ..., т отдельно. Чаще же вместо объясняющих переменных Xj по оси абсцисс откладывают значения y)i , i = 1, 2, ..., п, получаемые из эмпириче-

ского уравнения регрессии. Поскольку по уравнению множественной линейной регрессии y)i является линейной комбинацией хij , j = 1, 2, ... , т, i = 1, 2, ..., п, то

график, отражающий зависимость еi2 от y)i может указать на наличие гетеро-

53

скедастичности аналогично ситуациям на рис. 2.3.2 (б)-(д). Такой анализ наиболее целесообразен при большом количестве объясняющих переменных.

Тест Голдфелда-Квандта

В данном случае также предполагается, что стандартное отклонение

σi = σ (εi ) пропорционально значению хi переменной X в этом наблюдении, т.е.

σi 2 = σ 2 хi 2 ) , i = 1, 2, ...,п. Предполагается, что εi имеет нормальное распреде-

ление и отсутствует автокорреляция остатков. Тест Голдфелда-Квандта состоит в следующем:

1.Все п наблюдений упорядочиваются по величине X.

2.Вся упорядоченная выборка после этого разбивается на три подвыборки размерностей k, (п - 2k), k соответственно.

3.Оцениваются отдельные регрессии для первой подвыборки первых наблюдений) и для третьей подвыборки последних наблюдений). Если предположение о пропорциональности дисперсий отклонений значениям X верно, то

дисперсия регрессии по первой подвыборке (сумма квадратов отклонений

S1 = k ei2 ) будет существенно меньше дисперсии регрессии по третьей подвы-

i=1

борке (суммы квадратов отклонений S

 

=

k

 

 

3

e2 ).

 

 

 

 

 

 

i

 

 

 

 

 

 

i=nk +1

 

 

4. Для сравнения соответствующих дисперсий строится следующая F-ста-

тистика:

S3

(k m 1)

 

S3

 

 

F =

=

,

(7.1)

S

(k m 1)

S

 

 

 

 

 

1

 

 

 

1

 

 

где (k - т - 1) – число степеней свободы соответствующих выборочных дисперсий (т – количество объясняющих переменных в уравнении регрессии).

При сделанных предположениях относительно случайных отклонений построенная F-статистика имеет распределение Фишера с числами степеней

свободы ν1 = ν2 = k - т -1.

 

 

5. Если

F

=

S3

> F

= F

, то гипотеза об отсутствии гетероскеда-

 

 

набл

 

S1

кр

α;ν1

;ν2

 

 

 

 

 

 

стичности отклоняется (здесь α – выбранный уровень значимости). Естественным является вопрос: какими должны быть размеры подвыбо-

рок для принятия обоснованных решений? Для парной регрессии Голдфелд и Квандт предлагают следующие пропорции: п = 30, k = 11; п = 60, k = 22.

Для множественной регрессии данный тест обычно проводится для той объясняющей переменной, которая в наибольшей степени связана с σi . При

этом k должно быть больше, чем (т + 1). Если нет уверенности относительно выбора переменной Xj, то данный тест может осуществляться для каждой из объясняющих переменных.

54

Этот же тест может быть использован при предположении об обратной пропорциональности между σi и значениями объясняющей переменной. При

этом статистика Фишера примет вид: F = S1/S3.

7.3. Неэффективность МНК. Метод взвешенных наименьших квадратов

Метод наименьших квадратов основан на ряде предпосылок относительно природы данных и результатов построения модели. Основные из них – разделение исходных переменных на зависимые и независимые; некоррелированность факторов, входящих в уравнения регрессии; отсутствие автокорреляции остатков, равенства их математического ожидания нулю и постоянная дисперсия.

Если на практике имеет место гетероскедастичность, то оценки классического МНК будут неэффективны. Классический МНК не делает различия между качеством наблюдений, придавая одинаковые «веса» каждому из них независимо от их качества. Если придавать большие «веса» наблюдениям высокого качества и меньшие – наблюдениям низкого качества, то можно получить более точные оценки параметров уравнения регрессии. Например, при анализе временного тренда объемов выпускаемой продукции агропромышленного предприятия в заданный временной интервал включены года, в которые имели место стихийные бедствия (засуха, наводнение и т.п.), что не отражено в регрессионной модели. Для того чтобы исключить вклад этих нетипичных периодов в результаты расчетов, необходимо задать для них меньший «вес», чем для остальных временных периодов. Поэтому важным моментом при использовании обобщенного метода наименьших квадратов (ОМНК) является корректный выбор «весов».

Сначала оценивают регрессионную модель с помощью классического МНК, считая, что отклонения εi независимы между собой. При этом ковариация отклонений (ошибок):

COV (εi , εj) = 0 при i j,

где i, j – номера наблюдений;

COV (εi , εi) = σi2,

где σi2 – дисперсия ошибки i-го наблюдения.

Если величины σi2 известны, то далее можно величины 1 / σi2 использовать в качестве«весов» соответствующихотклоненийинайтиминимумсуммыквадратов:

n

 

( y (a +bx))2

 

S =

i

 

 

(7.2)

 

2

i=1

 

 

σi

 

 

Для простоты изложения опишем ВНК на примере парной регрессии:

yi = α0 +α1xi

+εi

 

 

 

 

 

(7.3)

 

 

 

 

 

 

Разделим обе части (7.3) на известное σ

 

=

σ2

:

 

yi

=α

 

1

+α

xi

+

 

εi

.

 

 

 

 

 

 

 

i

 

i

 

σi

0 σi

1 σi

 

σi

55

 

 

 

 

yi

*

 

xi

*

 

εi

 

 

 

 

1

 

 

 

 

 

 

 

 

 

Положив

 

= yi

,

 

= xi

,

 

 

= vi

,

 

 

= zi , получим уравнение регрессии

 

σi

σi

σi

σi

без свободного члена,

но с дополнительной объясняющей переменной Z и с

«преобразованным» отклонением v:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y *

=α

z +α x * + v

 

 

 

 

(7.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

0

 

i

1 i

i

 

 

 

 

 

 

При этом для vi выполняется условие гомоскедастичности. Действительно,

σ

2(v ) = M (v M (v ))2 = M (v2) M 2(v ) .

Так

как

 

по

 

предпосылке МНК

i

i

i

 

 

i

 

 

i

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

M(ε ) =0,

то M(vi ) =

1

 

M(εi ) =0, тогда:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

σ2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

2

 

ε

2

 

 

1

 

 

 

 

2

1

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σi (vi ) = M(vi ) = M(

 

 

 

) =

 

 

 

M(εi M(εi )) =

 

 

σi

=1=const.

 

 

σ

2

σ

2

σ

2

 

 

 

 

 

 

 

 

 

 

 

i

 

i

 

 

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Следовательно, для преобразованной модели (7.4) выполняются предпосылки МНК. В этом случае оценки, полученные по МНК, будут наилучшими линейными несмещенными оценками.

Таким образом, МВНК включает следующие этапы:

1.Значения каждой пары наблюдений (xi; уi) делят на известную величину

σi. Тем самым наблюдениям с наименьшими дисперсиями придаются наи-

большие «веса», а с максимальными дисперсиями – наименьшие «веса». Действительно, наблюдения с меньшими дисперсиями отклонений будут более значимыми при оценке коэффициентов регрессии, чем наблюдения с большими дисперсиями. Учет этого факта увеличивает вероятность получения более точных оценок.

 

 

1

 

xi

 

 

 

 

2. По МНК для преобразованных значений

 

,

,

yi

строится уравнение

 

σi

σi

 

 

 

 

 

 

σi

 

регрессии без свободного члена с гарантированными качествами оценок.

Дисперсии отклонений неизвестны.

Для применения МВНК необходимо знать фактические значения дисперсий σi2 отклонений. На практике такие значения известны крайне редко. Следова-

тельно, чтобы применить МВНК, необходимо сделать реалистические предположения о значениях σi2 .

Например, может оказаться целесообразным предположить, что дисперсии σi2 отклонений εi пропорциональны значениям хi (рис. 2.3.3 (а)) или значе-

ниям xi2 (рис. 2.3.3 (б)).

σi2

σi2

а)

Xi

б)

Xi

 

 

 

Рис. 2.3.3. Зависимость дисперсии σi2 от значений хi

56

Дисперсииσi2 пропорциональны хi (рис. 2.3.3 (а)):

σi2 = σ 2 хi (σ 2 – коэффициент пропорциональности).

Тогда уравнение (7.3) преобразуется делением его левой и правой частей на

хi :

yi

=

α0

+α

xi

+

εi

 

yi

=α

1

+α

x +ν

 

x

 

x

 

1 x

 

x

 

x

 

0 x

i

1 i

i

i

 

i

 

i

 

i

 

i

 

 

 

 

Несложно показать, что для случайных отклонений νi = εxi i выполняется усло-

вие гомоскедастичности. Следовательно, для регрессии применим обычный МНК. Действительно, всилувыполнимостипредпосылки σi2 =σ 2 i )= σ 2 хi имеем:

 

 

 

 

 

 

 

 

 

 

1

 

 

σ

2

i)=

σ 2

 

εi =

1 σ 2 (ε

)=

σ 2 x =σ 2

= const

 

 

 

 

x

 

x

i

 

x

i

 

 

 

 

 

 

 

i

 

 

i

 

 

 

 

 

 

i

 

 

 

 

 

 

Таким образом, оценив по МНК коэффициенты α0 и α1 затем возвращаются к исходному уравнению регрессии.

Если в уравнении регрессии присутствует несколько объясняющих переменных, можно поступить следующим образом. Вместо конкретной объясняющей переменной Xj используется переменная исходного уравнения множественной линейной регрессии y) = a0 +a1 x1 +a2 x2 +K+ak xk +ε , т.е. фактически

линейная комбинация объясняющих переменных. В этом случае получают следующую регрессию:

yi

=

α0 +α

 

xi1 +K+α

 

xik

+

εi

y)i

 

y)i

1

y)i

k

y)i

 

y)i

 

 

 

 

 

 

 

Иногда из всех объясняющих переменных выбирается наиболее подходящая, исходя из графического представления.

Дисперсииσi2 пропорциональны xi2 (рис. 2.3.3 (б)).

В случае, если зависимость σi2 от xi целесообразнее выразить не линейной

функцией, а квадратичной, то соответствующим преобразованием будет деление уравнения регрессии (7.3) на хi:

yi

=

α0

+α1

+

εi

 

yi

=α0

1

+α1 +νi ,

(7.5)

 

x

x

 

x

x

i

 

 

 

x

 

 

 

i

 

 

i

 

i

i

 

 

где νi =

εi .

 

xi

57

По аналогии с вышеизложенным несложно показать, что для отклонений νi

будет выполняться условие гомоскедастичности. После определения по МНК оценок коэффициентов α0 и α1 для уравнения (7.5) возвращаются к исходному уравнению (7.3).

Отметим, что для применения описанных выше преобразований весьма значимы знания об истинных значениях дисперсий отклонений σi2 либо предполо-

жения, какими эти дисперсии могут быть. Во многих случаях дисперсии отклонений зависят не от включенных в уравнение регрессии объясняющих переменных, а от тех, которые не включены в модель, но играют существенную роль в исследуемой зависимости. В этом случае они должны быть включены в модель. В ряде случаев для устранения гетероскедастичности необходимо изменить спецификацию модели (например, линейную на лог-линейную, мультипликативную на аддитивную и т.п.).

В заключение отметим, что наличие гетероскедастичности не позволяет получить эффективные оценки, что зачастую приводит к необоснованным выводам по их качеству. Обнаружение гетероскедастичности является достаточно трудоемкой проблемой и для ее решения разработано несколько методов (тестов). В случае установления наличия гетероскедастичности ее корректировка также становится достаточно серьезной проблемой. Одним из возможных решений является метод взвешенных наименьших квадратов (при этом необходимы определенная информация либо обоснованные предположения о величинах дисперсий отклонений).

На практике имеет смысл применить несколько методов определения гетероскедастичности и способов ее корректировки (преобразований, стабилизирующих дисперсию).

7.4. Автокорреляция

Автокорреляция ошибки – это нарушение третьего условия Гаусса-Марко- ва, которое заключается в том, что остаточные случайные составляющие εi, εj в уравнении регрессии yi = а0 + а1 x + εi являются зависимыми, т.е.

COV (εi , εj) ≠ 0 при i j,

где i, j – номера наблюдений.

Автокорреляция ошибки приводит к тому, что коэффициенты регрессии, найденные с помощью классического метода наименьших квадратов, становятся неэффективными. Автокорреляция связана с тем, что случайная составляющая ε в уравнении регрессии подвержена воздействию тех переменных, влияющих на результирующую переменную y, которые при создании модели не были включены в уравнение регрессии y = f(xl ,x2 ,...,xn), т.е. в состав определяющих переменных (x1, x2, ..., xn). В общем, это является сигналом недостаточного качества созданной модели и требует формирования нового списка определяющих переменных x1, x2, ..., xm.

В большинстве случаев положительная автокорреляция вызывается направленным постоянным воздействием некоторых не учтенных в модели факторов. Суть автокорреляции поясним следующим примером. Пусть исследуется спрос Y на прохладительные напитки в зависимости от дохода X по ежеме-

58

сячным данным. Трендовая зависимость, отражающая увеличение спроса с ростом дохода, может быть представлена линейной функцией Y=α0 1×X, изображенной на рис. 2.3.4.

Y лето

зима

X

Рис. 2.3.4. Появление положительной автокорреляции, неучтенных под воздействием факторов

Однако фактические точки наблюдений обычно будут превышать трендовую линию в летние периоды и будут ниже ее – в зимние.

Среди основных причин, вызывающих появление автокорреляции, можно выделить: ошибки спецификации, инерцию в изменении экономических показателей, эффект паутины, сглаживание данных.

7.5.Обнаружение автокорреляции

Всилу неизвестности значений параметров уравнения регрессии неизвест-

ными будут также и истинные значения отклонений εt. Поэтому выводы об их независимости осуществляются на основе оценок еt, полученных из эмпирического уравнения регрессии. Рассмотрим возможные методы определения автокорреляции.

Метод рядов

Этот метод достаточно прост: последовательно определяются знаки отклонений et, t = 1, 2, ..., Т. Например,

(- - - - - -

)( + + + + + + +)(- - -)(+ + + +)(-),

т.е. 5 «-», 7 «+», 3 «-», 4 «+», 1 «-» при 20 наблюдениях.

Ряд определяется как непрерывная последовательность одинаковых знаков. Количество знаков в ряду называется длиной ряда.

Визуальное распределение знаков свидетельствует о неслучайном характере связей между отклонениями. Если рядов слишком мало по сравнению с количеством наблюдений п, то вполне вероятна положительная автокорреляция. Если же рядов слишком много, тo вероятна отрицательная автокорреляция. Для более детального анализа предлагается следующая процедура. Пусть:

п – объем выборки;

n1 общее количество знаков «+» при п наблюдениях (количество положительных отклонений – et);

59

п2 общее количество знаков «-» при п наблюдениях (количество отрицательных отклонений – et);

к – количество рядов.

При достаточно большом количестве наблюдений (n1 > 10, п2 > 10) и отсутствии автокорреляции СВ к имеет асимптотически нормальное распределение:

M (k ) =

2n1n2

+ 1;

 

 

n

+ n

2

 

 

1

 

 

D(k ) =

2n1n2 (2n1n2 n1 n2 )

 

(n

+ n

2

) 2 (n + n

2

1)

1

 

1

 

Тогда, если M (k) uα D(k) < k < M (k) + uα D(k) , то гипотеза об отсутствии

автокорреляции не отклоняется.

Для небольшого числа наблюдений (n1 < 20, п2 < 20) Свед и Эйзенхарт разработали таблицы критических значений количества рядов при п наблюдениях (Приложение 4). Суть таблиц в следующем.

На пересечении строки п1 и столбца п2 определяются нижнее k1 и верхнее k2 значения при уровне значимости α = 0,05.

Если k1 < k < k2, то говорят об отсутствии автокорреляции.

Если k < k1, то говорят о положительной автокорреляции остатков. Если k > k2 , говорят об отрицательной автокорреляции остатков.

В нашем примере п = 20, п1 = 11, n2=9, k = 5. По таблицам (Приложение 4) определяем k1 = 6, k2 = 16. Поскольку k = 5 < 6 = k1, то принимается предположение о наличии положительной автокорреляции при уровне значимости α = 0,05.

Критерий Дарбина-Уотсона

Наиболее известным критерием обнаружения автокорреляции первого порядка является критерий Дарбина-Уотсона. Статистика DW Дарбина-Уотсона приводится во всех специальных прикладных компьютерных программах как важнейшая характеристика качества регрессионной модели. На основе вычисленной статистики DW Дарбина-Уотсона делается вывод об автокорреляции:

T

 

(et et1)2

 

DW = t=2

(7.6)

T et2 t=1

Статистика Дарбина-Уотсона тесно связана с выборочным коэффициентом корреляции retet 1 : DW 2(1 retet 1 ) .

Таким образом, 0 < DW < 4, и ее значения могут указать на наличие либо отсутствие автокорреляции. Действительно, если retet 1 0 (автокорреляция отсутст-

вует), то DW ≈ 2. Если retet 1 1 (положительная автокорреляция), то DW ≈ 0. Если retet 1 ≈ -1 (отрицательная автокорреляция), тo DW ≈4.

60

Для более точного определения, какое значение DW свидетельствует об отсутствии автокорреляции, а какое – о ее наличии, была построена таблица критических точек распределения Дарбина-Уотсона. По ней для заданного уровня значимости а, числа наблюдений п и количества объясняющих переменных m определяются два значения: d1 нижняя граница и du верхняя граница.

Общая схема критерия Дарбина-Уотсона следующая:

1. По построенному эмпирическому уравнению регрессии yt =a0+a1xt1+…+amxtm определяются значения отклонений et = yt - yt для каждого наблюдения t, t = 1, 2,

..., Т.

2.По формуле (7.6) рассчитывается статистика DW.

3.По таблице критических точек Дарбина-Уотсона определяются два числа d1 и du и осуществляются выводы по правилу:

0DW <d1 существует положительная автокорреляция;

d1 < DW < du вывод о наличии автокорреляции не определен; d1≤ DW < (4 - du) – автокорреляция отсутствует;

(4 - du) < DW < (4 - d1) – вывод о наличии автокорреляции не определен; (4 - d1) < DW < 4 – существует отрицательная автокорреляция.

Отметим, что при использовании критерия Дарбина-Уотсонa необходимо учитывать следующие ограничения.

1.Критерий DW применяется лишь для тех моделей, которые содержат свободный член.

2.Предполагается, что случайные отклонения εt определяются по итерационной схеме: εt = ρεt-1 + vt, называемой авторегрессионной схемой первого порядка AR(1). Здесь vt случайный член.

3.Статистические данные должны иметь одинаковую периодичность (т.е. не должно быть пропусков в наблюдениях).

4.Критерий Дарбина-Уотсона не применим для регрессионных моделей, содержащих в составе объясняющих переменных зависимую переменную с временным лагом в один период, т.е. для так называемых авторегрессионных моделей вида:

yt =a0+a1xt1+…+amxtm+γyt-1t

(7.7)

Причину четвертого ограничения поясним следующим примером. Пусть уравнение регрессии имеет вид:

yt =a0+a1xt+γyt-1t

(7.8)

Пусть случайное отклонение εt подвержено воздействию авторегрессии первого порядка:

εt=ρεt-1+ vt.

(7.9)

Тогда уравнение регрессии (7.7) можно представить в следующем виде:

yt =a0+a1xt+γyt-1+ρεt-1t

(7.10)

Однако yt-1 зависит от εt , так как если (7.7) верно для t, то оно верно и для t - 1. Следовательно, имеется систематическая связь между одной из объясняющих переменных и одним из компонентов случайного члена, т.е. не выполняется одна из основных предпосылок МНК – объясняющие переменные не должны быть случайными (не должны иметь случайной составляющей). Значение любой объясняющей

61

переменной должно быть экзогенным, полностью определенным. В противном случае оценки будут смещенными даже при больших объемах выборок.

Для авторегрессионных моделей разработаны специальные тесты обнаружения автокорреляции, в частности, h-статистика Дарбина, которая определяется по формуле:

)

n

 

 

h = ρ

1 nD(g)

,

(7.11)

где ρ – оценка ρ авторегрессии первого порядка;

D(g) – выборочная дисперсия коэффициента при лаговой переменной yt-1; п – число наблюдений.

При большом объеме выборки п и справедливости нулевой гипотезы H0: Ρ = 0 статистика h имеет стандартизированное нормальное распределение (h ~ N(0, 1)). Поэтому по заданному уровню значимости α определяется критическая точка uα из условия Ф(иα) =(1-α)/2 и сравнивается h с иα. Если |h|> uα, то нулевая гипотеза об отсутствии автокорреляции должна быть отклонена. В противном случае она не отклоняется.

Отметим, что обычно значение ρ рассчитывается по формуле: ρ = 1 - 0,5DW,

a D(g) равна квадрату стандартной ошибки Sg оценки g коэффициента γ. Поэтому h легко вычисляется на основе данных оцененной регрессии.

Основная проблема при использовании этого теста заключается в невозможности вычисления h при nD(g) > 1.

Пример решения задачи к разделу III

Анализируется объем S сбережений домохозяйства за 10 лет. Предполагается, что его размер st в текущем году t зависит от величины yt-1 располагаемого дохода Y в предыдущем году и от величины zt реальной процентной ставки Z в текущем году. Статистические данные представлены в таблице 2.3.1:

Таблица 2.3.1

Статистические данные сбережений

Год

80

81

82

83

84

85

86

87

88

89

90

Y, тыс. у.е.

100

110

140

150

160

160

180

200

230

250

260

Z, %

2

2

3

2

3

4

4

3

4

5

5

S, тыс. у.е.

20

25

30

30

35

38

40

38

44

50

55

Требуется:

1.По МНК оценить коэффициенты линейной регрессии S=β01 Υ+β2 Ζ.

2.Оценить статистическую значимость найденных эмпирических коэффициентов регрессии b0, b1, b2.

3.Построить95%-едоверительныеинтервалыдля найденныхкоэффициентов.

4.Вычислить коэффициент детерминации R2 и оценить его статистическую значимость при α = 0,05.

62

5.Вычислитьстатистику Дарбина-Уотсонаиоценитьналичиеавтокорреляции.

6.Определить, увеличивается или уменьшается объем сбережений с ростом процентной ставки; будет ли ответ статистически обоснованным.

Решение:

Для наглядности изложения приведем таблицу промежуточных вычислений

(табл. 2.3.2):

Таблица 2.3.2

Расчет параметров уравнения регрессии

Год

Y

Z

S

Y2

Z2

Y×Z

Y×S

 

Z×S

80

100

2

20

10000

4

200

2000

 

40

81

110

2

25

12100

4

220

2750

 

50

82

140

3

30

19600

9

420

4200

 

90

83

150

2

30

22500

4

300

4500

 

60

84

160

3

35

25600

9

480

5600

 

105

85

160

4

38

25600

16

640

6080

 

152

86

180

4

40

32400

16

720

7200

 

160

87

200

3

38

40000

9

600

7600

 

114

88

230

4

44

52900

16

920

10120

 

176

89

250

5

50

62500

25

1250

12500

 

250

90

260

5

55

67600

25

1300

14300

 

275

Сумма

1940

37

405

370800

137

7050

76850

 

1472

Среднее

176,3636

3,3636

36,8182

33709,09

12,4546

640,9091

6986,36

 

133,8182

∑(yi-ŷ)2

∑(zi-ž)2

∑(si-ŝ)2

∑(yi-ŷ)(z

i-ž)

∑(yi-ŷ)(si-ŝ)

∑(zi-ž)(si-ŝ)

 

28654,55

12,5455

1087,636

524,5451

 

5422,727

 

109,7272

 

 

Расчет коэффициентов проводится по формулам: b0 = 2,9619423; b1 = 0,124189; b2 = 3,553841.

Таким образом, эмпирическое уравнение регрессии имеет вид: st = 2,9619423 + 0,124189 × yt + 3,553841× zt

Найденное уравнение позволяет рассчитать модельные значения ŝt зависи-

мой переменной S и вычислить отклонения еi реальных значений от модельных

(табл. 2.3.3).

Проанализируем статистическую значимость коэффициентов регрессии, предварительно рассчитав их стандартные ошибки. Дисперсия вычисляется по формуле:

S =

ei2

=

24 ,24058

= 3,03

n m 1

8

 

 

 

Таблица 2.3.3

Отклонение реальных значений от модельных

Год

S

Ŝ

еi

еi2

еi - еi-1

i - еi-1)2

80

20

22,48852

-2,48852

6,19273

-

-

81

25

23,73041

1,269594

1,61187

3,75811

14,12339

82

30

31,00991

-1,00991

1,01992

-2,27950

5,19612

83

30

28,69796

1,30204

1,69523

2,31194

5,34507

63

84

35

33,49369

1,50631

2,26896

0,20427

0,04173

85

38

37,04753

0,95247

0,90719

-0,55384

0,30674

86

40

39,53131

0,46869

0,21967

-0,48378

0,23404

87

38

38,46125

-0,46125

0,21275

-0,92994

0,86479

88

44

45,74076

-1,74076

3,03024

-1,27951

1,63714

89

50

51,77838

-1,77838

3,16263

-0,03762

0,00141

90

55

53,02027

1,97973

3,91933

3,75811

14,12332

Сумма

405

405

≈0

24,24058

-

41,87375

Среднее

36,81818

36,81818

-

-

-

-

Тогда стандартная ошибка регрессии S = 1,7407.

Следовательно, дисперсии и стандартные ошибки коэффициентов таковы:

Sb

=1,8929 ;

Sb = 0,0212 ;

Sb

=1,0146 .

 

0

1

 

2

Рассчитаем соответствующие t-статистики:

tb =1,565;

tb = 5,858;

tb = 3,503.

0

1

2

Два коэффициента имеют t-статистики, превышающие тройку, что является признаком их высокой статистической значимости.

Определяем 95%-е доверительные интервалы для коэффициентов:

2,9619423 – 2,306 × 1,8929 < β0 < 2,969423 + 2306 × 1,8929; -1,4031 <β0< 7,3270; 0,124189 – 2,306 × 0,0212 < β1 < 0,124189 + 2306 × 0,0212; 0,0753 < β1 < 0,1731;

3,553841 – 2,306 × 1,0146 < β2 < 3,553841 + 2306 × 1,0146; 1,2141 < β2 < 5,8935.

Коэффициент детерминации R2 рассчитывается по формуле:

R2 = 1 – 24,2408 / 1087,636 = 0,9777.

Анализ статистической значимости коэффициента детерминации R2 осуществляется на основе F-статистики:

F = 0,9777 / (1 – 0,9777) × 8 / 2 = 175,3732.

Для определения статистической значимости F-статистики сравним ее с соответствующей критической точкой распределения Фишера:

Fкр = F(α; m; n – m – 1) = F(0,05; 2; 8) = 4,46.

Так как Fнабл = 175,3732 > Fкр = 4,46, то статистика F, а следовательно, и коэффициент детерминации R2 статистически значимы. Это означает, что совокупное влияние переменных Y и X на переменную S существенно. Этот же вывод можно было бы сделать без особых проверок только по уровню коэффициента детерминации. Он весьма близок к единице.

Статистику DW Дарбина-Уотсона вычислим по формуле:

DW = 41,87375 / 24,24058 =1,72742.

Для проверки статистической значимости DW воспользуемся таблицей критических точек Дарбина-Уотсона. При уровне значимости α = 0,05 и числе наблюдений n = 11 имеем:

d1 = 0,658; du = 1,604.

Так как 1,604 < DW < 2,396 (du < DW < 4 – du ), то гипотеза об отсутствии автокорреляции не отклоняется, т.е. считаем, что автокорреляция остатков отсутствует. Это является одним из подтверждений высокого качества модели.

64

В силу того, что коэффициент b2 является статистически значимым, можно утверждать, что с ростом процентной ставки увеличивается объем сбережений (коэффициент b2 имеет положительный знак). Ответ будет статистически обоснованным.

Вопросы для самопроверки

1.В чем суть МНК для построения множественного линейного уравнения регрессии?

2.В чем суть коэффициента детерминации R2?

3.Как используется F-статистика в регрессионном анализе?

4.Что такое автокорреляция остатков, и каковы ее виды?

5.Близость к нулю коэффициента детерминации R2 означает его статистическую незначимость?

6.При увеличении количества объясняющих переменных всегда увеличивается коэффициент детерминации?

7.Объясните явление мультиколлинеарности. Что такое совершенная мультиколлинеарность?

Задачи для самостоятельной работы

№1. Предполагается, что объем предложения Q некоторого блага для функционирующей в условиях конкуренции фирмы зависит линейно от цены P данного блага и заработной платы W сотрудников фирмы, производящих данное благо:

Q = β0 + β1P + β2W + ε

Статистические данные собраны за 16 месяцев (табл. 2.3.4):

Таблица 2.3.4

Зависимость предложения от цены

Q

20

35

30

45

60

69

75

90

105

110

120

130

130

130

135

140

P

10

15

20

25

40

37

43

35

38

55

50

35

40

55

45

65

W

12

10

9

9

8

8

6

4

4

5

3

1

2

3

1

2

Требуется:

1.Оценить по МНК коэффициенты уравнения регрессии.

2.Проверить гипотезы: при равных условиях рост цены товара увеличивает предложение; рост заработной платы снижает предложение.

3.Определить интервальные оценки коэффициентов при уровне значимости

α= 0,1.

4.Проверить гипотезу об отсутствии автокорреляции остатков.

№2. По выборке объема n=50 для Х1, Х2, Х3 построена следующая корреляционная матрица:

 

 

1,0

0,45

0,35

R =

 

0,45

1,0

0,52

 

 

 

 

 

 

0,52

1,0

 

 

0,35

 

65

1. Найдите и оцените статистическую значимость частных коэффициентов

корреляции r12.3, r23.1, r13.2 .

2. При рассмотрении какой регрессии будет иметь место мультиколлинеарность?

№3. Имеетсявыборкаиз10 наблюдений запеременными Х1, Х2, Y (табл. 2.3.5):

Таблица 2.3.5

Исходные статистические данные

Х1

1

2

3

4

5

6

7

8

9

10

Х2

1

1,6

2,2

2,8

3,4

4

4,6

5,2

5,6

6,2

Y

0

3

6

9

12

15

18

21

24

27

1.Можно ли по этим данным по МНК оценить коэффициенты регрессии с двумя объясняющими переменными? Ответ поясните.

2.В случае отрицательного ответа предложите преобразования, которые позволят оценить коэффициенты регрессии.

№4. Пусть зависимость заработной платы (Y) от стажа работы (X) сотрудника выражена следующим уравнением регрессии:

Y = β0 + β1X + γD + ε,

где D – фиктивная переменная, отражающая пол сотрудника. Как можно проверить предположение о том, что пол сотрудника не влияет на дисперсию случайных отклонений εi?

№5. Для предприятий некоторой отрасли анализируют заработную плату

(Y) сотрудников в зависимости от масштаба (количества сотрудников предпри-

ятия (X)).

Наблюдения по 30 случайно отобранным предприятиям представлены в таблице 2.3.6:

 

 

Исходные статистические данные

Таблица 2.3.6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

X

75,5

75,5

 

77,5

 

78,5

80,0

81,0

100

 

80,5

82,0

 

84,5

 

85,0

85,5

86,5

200

 

85,5

88,5

 

90,0

 

91,0

95,0

96,0

300

 

93,0

93,5

 

97,5

 

99,0

102,5

105,0

400

 

102,5

105,5

 

107,0

 

110,5

115,0

118,5

500

 

1.Постройте уравнение регрессии Y на X.

2.Можно ли ожидать наличия гетероскедастичности в данном случае?

3.Проверьте наличие гетероскедастичности, применив тест ГолдфелдаКвандта. Использовать разбиение, при котором k = 12.

66

№6. Пусть при 50 наблюдениях и 3 объясняющих переменных статистика Дарбина-Уотсона принимает следующие значения:

а) 0,92; б) 1,38; в) 2,35; г) 3,02; д) 3,73.

Не обращаясь к таблице критических точек Дарбина-Уотсона, сделайте предположение о наличие автокорреляции. Проверьте выводы по таблице.

№7. По статистическим данным за 20 лет построено уравнение регрессии между ценой бензина и объемом продаж бензина: DW = 0,71.

1.Будет ли в этом случае иметь место автокорреляция остатков? Если да, то положительная или отрицательная?

2.Какой критерий использован?

№8. Предполагается, что ежемесячное потребление пива студентами определяется (линейно) доходом, возрастом, полом студентов, а также временем обучения «младшие курсы-старшие курсы».

1.Сколько количественных и качественных объясняющих переменных должна включать модель?

2.Как проверить предположение, что пол студента существенно влияет на количество потребляемого пива?

РАЗДЕЛ IV. ВРЕМЕННЫЕ РЯДЫ И ДИНАМИЧЕСКИЕ ПРОЦЕССЫ Тема 8. Модели временных рядов

8.1. Одномерный временной ряд

Одномерный временной ряд – ряд наблюдений (исходных статистических данных) х(t1), х(t2), ... , х(tп) анализируемой случайной величины х, проведенных в последовательные моменты времени t1,t2, ... , tп. При этом данные образуют про- странственно-временную выборку. Одномерный ряд отражает эволюцию значений только одного признака исследуемого объекта. В процессе моделирования удобно анализировать временные ряды с равноотстоящими моментами наблюдений (на-

пример: по месяцам, поквартально и т.п.), т.е. t1 t2= t2 t3=…= tп-1 tп = ∆t – временной шаг. Тогда временной ряд можно представить в виде: х(1), х(2), ... , х(п).

Каждый временной ряд состоит из двух элементов: первый – момент, или период времени t, второй – статистический показатель х, который характеризует исследуемый объект в данный момент или период времени. Соответственно, различают моментные и интервальные ряды динамики. Временной ряд имеет отличия от случайной выборки х1, х2, ... , хп, полученной для большого количества однотипных данных: члены временного ряда статистически зависимы и имеют различные распределения вероятностей. Степень тесноты статистической связи между наблюдениями временного ряда, взятыми для смежных моментов времени, определяется величиной коэффициента корреляции. Факторы, которые формируют значения временного ряда, могут быть долговременными, сезонными, цикли-

67

ческими и случайными. Долговременные факторы формируют общую тенденцию в изменении анализируемого признака х(t). Как правило, эта тенденция описывается с помощью некоторой функции ƒ(t), которая называется функцией тренда.

Сезонные факторы формируют периодически повторяющиеся в определенное время года колебания анализируемого признака. Результат действия сезонных факторов выражается какой-либо периодической функцией φ(t).

Циклические признаки формируют изменения анализируемого признака х(t), обусловленные действием долговременных экономических, демографических, природных и др. циклов, что отражается функцией ψ(t).

Случайные признаки обуславливают стохастическую природу анализируемого признака х(t). Результат воздействия случайных факторов учитывается с помощью случайной остаточной составляющей ε(t). Случайные факторы в формировании значения анализируемого признака х(t) присутствуют всегда, остальные факторы могут отсутствовать. Тогда члены временного ряда можно представить в виде разложения:

х(t) = γ(ξ)ƒ(t) + γ(ξ)φ(t)+ γ(ξ)ψ(t)+ ε(t),

(8.1)

где γ(ξ) = 1, если параметр ξ принимает значения, соответствующие эффекту действия долговременных, сезонных и циклических факторов;

γ(ξ) = 0, если параметр ξ принимает значения, соответствующие эффекту отсутствия воздействия долговременных, сезонных и циклических факторов.

Разработку модели, адекватно отражающей поведение случайных остатков ε(t) анализируемого временного ряда х(ti), проводят в рамках некоторого класса стационарных временных рядов. Свойства строго стационарного временного ря-

да не зависят от начала отсчета времени.

 

Поэтому среднее значение: Μx(t) = a = const ;

(8.2)

дисперсия: Dx(t) (x(t) a)2 =σ2 =const

(8.3)

8.2. Характеристики временных рядов

Временные ряды позволяют проводить анализ скорости и интенсивности развития исследуемого явления или объекта. С этой целью используются следующие показатели: абсолютный прирост, темп роста и прироста, абсолютное значение одного процента прироста. При этом сравниваемый уровень называют отчетным, а уровень, с которым проводят сравнение, – базисным. Показатели динамики с постоянной базой характеризуют окончательный результат всех изменений в уровнях ряда от периода базисного уровня до данного периода. Показатели динамики с переменной базой (цепные показатели) характеризуют интенсивность изменения уровня от периода к периоду в пределах изучаемого промежутка времени.

Абсолютный базисный прирост – разность между двумя статистическими показателями ряда динамики:

бi = yi – y0 ,

(8.4)

где yi уровень статистического показателя сравниваемого периода;

68

y0 – уровень статистического показателя базисного периода.

При сравнении с переменной базой абсолютный прирост (цепной прирост) определяется следующим образом:

цi = yi – yi-1 ,

(8.5)

где yi-1 уровень статистического показателя предшествующего периода. Коэффициент роста – отношение статистического показателя сравниваемо-

го периода либо со статистическим показателем базисного периода:

k iб =

y i

,

(8.6)

 

y 0

 

либо с показателем предшествующего периода:

k iб =

y i

(8.7)

y i 1

 

 

Темпы роста – коэффициенты роста, выраженные в процентах и характеризующие скорость изменения величины статистического показателя за единицу времени:

ТΡ = k ×100 0 0

(8.8)

Темпы прироста – показатель, содержащий информацию о том, на сколько процентов уровень данного периода отличается от базисного:

ΤΠ =

y

i

y

0

×100 %

(8.9)

 

 

y 0

 

 

 

 

 

 

 

При анализе относительных показателей динамики (темпов роста и темпов прироста) необходимо рассматривать их в совокупности с абсолютными показателями (величиной статистического показателя и абсолютными приростами). Чтобы правильно оценить значение полученного темпа прироста, его рассматривают в сопоставлении с показателем абсолютного прироста, для этого используя показатель абсолютного значения одного процента прироста:

Αi =

y i y i 1

(8.10)

 

ΤΠ

 

Коэффициенты опережения – показатели, представляющие собой отношения темпов роста или темпов прироста за одинаковые отрезки времени по двум динамическим рядам:

 

Τ /р

 

/

 

 

k оп =

или k оп =

Τп

,

(8.11)

//

//

 

Τ р

 

Τп

 

 

где верхние индексы / и // соответственно относятся к первому и второму динамическому ряду.

Таким образом, коэффициенты опережения используются при сопоставлении динамики развития двух явлений или объектов исследования. С помощью

69

этих коэффициентов могут сравниваться ряды одинакового содержания, но относящиеся к разным предприятиям, территориям, или ряды разного содержания, характеризующие один и тот же объект исследования.

Для обобщающей характеристики динамического ряда используются различные средние показатели: средние значения ряда и средние показатели изменения значений ряда.

8.3. Нестационарные временные ряды. Модель Бокса-Дженкинса

Как правило, временные ряды х(ti), построенные в процессе исследования реальных процессов в экономике, финансах, торговле и маркетинге, являются нестационарными. Нестационарность этих рядов проявляется в присутствии долговременных факторов, формирующих общую тенденцию ряда, которая учитывается с помощью функции тренда ƒ(t). Такой ряд называется нестационарный однородный временной ряд. Для описания таких рядов была предложена модель Бокса-Дженкинса. Сущность модели заключается в том, что анализируемый временной ряд включает составляющую ƒ(t), имеющую вид алгебраического полинома степени k-1, где параметром является время t и при этом коэффициенты этого полинома могут иметь случайную природу.

Пример решения задачи к разделу IV

На основе ежемесячных данных о числе браков (тыс.) в регионе за последние три года была построена аддитивная модель временного ряда. Скорректированные значения сезонной компоненты за соответствующие месяцы имеют следующий вид (табл. 2.4.1):

 

 

 

Таблица 2.4.1

 

Значения сезонной компоненты

 

 

 

 

Месяц

Значение сезонной компоненты

Месяц

Значение сезонной компоненты

Январь

-1,0

Июль

3,0

Февраль

2,0

Август

1,0

Март

-0,5

Сентябрь

2,5

Апрель

0,3

Октябрь

1,0

Май

-2,0

Ноябрь

-3,0

Июнь

-1,1

Декабрь

?

Уравнение тренда выглядит следующим образом:

ŷt = 2,5 + 0,03 × t

При расчете параметров тренда использовались фактические моменты вре-

мени (t = 1…36).

Требуется:

1.Определить значение сезонной компоненты за декабрь.

2.На основе построенной модели дать прогноз общего числа браков, которые будут заключены в течение первого квартала следующего года.

70

Решение:

1. Сумма значений сезонной компоненты внутри одного цикла должна быть равна нулю (в соответствии с методикой построения аддитивной модели временного ряда). Следовательно, значение сезонной компоненты за декабрь составит:

S12 = 0 – (– 1 +2 – 0,5 + 0,3 – 2 – 1,1 + 3 + 1+ 2,5 +1 – 3) = – 2,2.

2. Прогнозное значение временного ряда Ft в аддитивной модели есть сумма трендового значения Тt и соответствующего значения сезонной компоненты St.

Число браков, которые будут заключены в первом квартале следующего года, есть сумма числа браков, заключенных в январе F37 , в феврале F38 и марте F39.

Для расчета трендовых значений воспользуемся уравнением тренда, заданным в начале:

ŷt = 2,5 + 0,03 × t

Т37 = 2,5 + 0,03 × 37 = 3,61; Т38 = 2,5 + 0,03 × 38 = 3,64; Т39 = 2,5 + 0,03 × 39 = 3,67.

Соответствующие значения сезонных компонент составят:

S1= – 1 – январь;

S2= 2 – февраль;

S1= – 0,5 – март.

Таким образом,

F37 = Т37 + S1= 3,61 – 1 = 2,61;

F38 = Т38+ S2 = 3,64 + 2 = 5,64;

F39 = Т39 + S3 = 3,67 – 0,5 = 3,17.

Количество браков, которые будут заключены в первом квартале следую-

щего года, таково: 2,61 + 5,64 + 3,17 = 11,42 тыс., или 11420.

Вопросы для самопроверки

1.В чем суть временного ряда?

2.В чем различие между прогнозированием и предсказанием?

3.Перечислите основные показатели временных рядов.

Задачи для самостоятельной работы

№1. Имеются следующие данные о величине дохода на одного члена семьи и расхода на товар А.

Показатель

1990 г.

1991 г.

1992 г.

1993 г.

1994 г.

1995 г.

Расходы на товар А, руб

30

35

39

44

50

53

Доход на одного члена

100

103

105

109

115

118

семьи, % к 1990 г.

 

 

 

 

 

 

Требуется:

1. Определить ежегодные абсолютные приросты доходов и расходов и сделать выводы о тенденции развития каждого ряда.

71

2.Перечислить основные пути устранения тенденции для построения модели спроса на товар А в зависимости от дохода.

3.Построить линейную модель спроса, используя первые разности уровней исходных динамических рядов.

4.Пояснить экономический смысл коэффициента регрессии.

5.Построить линейную модель спроса на товар А, включив в нее фактор времени. Интерпретировать полученные параметры.

№2. Имеются данные об урожайности зерновых в хозяйствах области:

Год

1

2

3

4

5

6

7

8

Урожайность

10,2

10,7

11,7

13,1

14,9

17,2

20,0

23,2

Требуется:

1.Обосновать выбор типа уравнения тренда.

2.Рассчитать параметры уравнения тренда.

3.Дать прогноз урожайности на следующий год.

№3. Имеются данные об эффективности ценных бумаг Y(t):

Год

1

2

3

4

5

6

7

8

9

Эффективность

41

37

32

31

25

22

18

15

12

Требуется:

1.Проверить наличие тренда для Y(t).

2.Построить линейную модель кривой роста.

3.Оценить качество построенной модели.

№4. Пусть имеется следующий временной ряд:

t

1

2

3

 

4

 

5

6

 

7

8

xt

20

 

 

 

10

Известно также, что xt

=150 , xt2

 

n

 

 

= 8100 , xt xt1

= 7350.

 

t=2

Требуется:

1.Определить коэффициент автокорреляции уровней этого ряда первого порядка.

2.Установить, включает ли исследуемый временной ряд тенденцию.

72

РАЗДЕЛ V. СИСТЕМЫ РЕГРЕССИОННЫХ УРАВНЕНИЙ Тема 9. Системы одновременных уравнений

При использовании отдельных уравнений для экономических расчетов часто предполагается, что аргументы можно изменять независимо друг от друга. Однако в экономике практически неправдоподобно, что изменение одних переменных может происходить при неизменности других. Следовательно, отдельно взятое уравнение множественной регрессии не может характеризовать истинное влияние отдельных признаков на изменение результирующей переменной. Поэтому при моделировании достаточно сложных экономических объектов исследуемую модель описывают системой уравнений.

Различают следующие типы уравнений:

система независимых уравнений – когда каждая зависимая переменная yi, i = 1, 2, ..., п рассматривается как функция одного и того же набора факторов xj, j = 1, 2,... т:

y

 

= a

 

x

+ a

 

x

2

+K+ a

 

 

 

1

11

 

1

12

 

 

 

1m

 

y2 = a21 x1 + a22 x2 +K+ a2m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

n

= a

n1

x

+ a

n2

x

2

+K+ a

nm

 

 

 

1

 

 

 

 

xm + ε1

xm + ε2

xm + εn

Каждое уравнение системы может рассматриваться самостоятельно. Для нахождения его параметров используют метод наименьших квадратов;

система рекурсивных уравнений – когда зависимая переменная у одного уравнения выступает в виде фактора х в другом уравнении:

y1 = a11 x1 + a12 x2 +K+ a1m xm + ε1

 

 

 

 

 

 

 

 

 

 

2

= b21 y1 + a21 x1 + a22 x2 +K+ a2m xm +

ε2

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

n

= b

n1

y +K+ b

nn1

y

n1

+ a

n1

x

+ a

n2

x

2

+K+ a

nm

x

m

+ ε

n

 

 

1

 

 

1

 

 

 

 

 

Здесь каждое уравнение системы также может рассматриваться самостоятельно и для нахождения его параметров также используют метод наименьших квадратов;

система одновременных (совместных) уравнений – когда одни и те же за-

висимые переменные в одних уравнениях входят в левую часть, а в других – в правую:

y1 = b12 y2 +K+ b1n yn + a11 x1 + a12 x2 +K+ a1m xm + ε1

 

 

 

2

= b21 y1 +K+ b2n yn

+ a21 x1 + a22 x2 +K+ a2m xm + ε2

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

n

= b

n1

y +K+ b

nn1

y

n1

+ a

n1

x + a

n2

x

2

+K+ a

nm

x

m

+ ε

n

 

 

1

 

 

1

 

 

 

 

73

Система совместных, одновременных, уравнений определяет структурную форму модели. В зависимости от содержательной стороны модели в ней выделяют эндогенные и экзогенные переменные.

Эндогенные переменные – это зависимые переменные, число которых равно числу уравнений модели.

Экзогенные переменные – это предопределенные переменные, влияющие на эндогенные переменные, но не зависящие от них.

Предопределенные переменные – экзогенные и лаговые эндогенные переменные.

Коэффициенты bi, aj при переменных yi, xj называют структурными коэф-

фициентами модели.

Предполагается, что в каждом уравнении экзогенные переменные, стоящие в левых частях уравнений, некоррелированы с ошибкой. Эндогенные переменные, стоящие в правых частях уравнений, как правило, имеют ненулевую корреляцию с ошибкой в соответствующем уравнении.

Если использовать метод наименьших квадратов для оценивания параметров уравнения, входящего в систему одновременных уравнений, то полученные оценки наверняка окажутся смещенными и несостоятельными, а статистические тесты – некорректными. Причиной может быть смещение, порождаемое систе-

мой одновременных уравнений.

 

 

 

 

 

 

 

 

 

Простейшая структурная форма модели имеет вид:

 

y

= b

y

 

+ a

x

+ ε

 

,

(9.1)

1

12

 

2

11

1

 

1

y2 = b21 y1 + a22 x2 + ε

2

 

где у – эндогенные переменные; х – экзогенные переменные.

Классификация переменных на эндогенные и экзогенные зависит от теоретической концепции принятой модели. Экономические переменные могут выступать в одних моделях как эндогенные переменные, а в других – как экзогенные. Внеэкономические переменные (например, климатические условия) входят в систему как экзогенные переменные. В качестве экзогенных переменных могут рассматриваться значения эндогенных переменных за предшествующий период времени (лаговые переменные). Так, потребление текущего года (уt,) может зависеть не только от ряда экономических факторов, но и от уровня потребления в предыдущем году (yt-1).

Структурная форма модели позволяет увидеть влияние изменений любой экзогенной переменной на значения эндогенной переменной. Целесообразно в качестве экзогенных переменных выбирать такие переменные, которые могут быть объектом регулирования. Меняя их и управляя ими, можно заранее иметь целевые значения эндогенных переменных.

Структурная форма модели в правой части содержит при эндогенных и экзогенных переменных коэффициенты bi и аj (bi – коэффициент при эндогенной переменной, аj – коэффициент при экзогенной переменной), которые называют-

74

ся структурными коэффициентами модели. Все переменные в модели выражены в отклонениях от среднего уровня, т.е. под х подразумевается ( x x ) а под у – соответственно ( y y ). Поэтому свободный член в каждом уравнении системы

отсутствует.

Использование МНК для оценивания структурных коэффициентов модели дает, как принято считать в теории, смещенные и несостоятельные оценки. Поэтому обычно для определения структурных коэффициентов структурная форма модели преобразуется в приведенную форму модели.

Приведенная форма модели представляет собой систему линейных функций эндогенных переменных от экзогенных:

y)

1

= δ11 x1

+ δ12 x2

+ ... + δ1m xm

 

)

 

= δ 21 x1

+ δ 22 x2

+ ... + δ 2 m xm

 

y

2

(9.2)

 

 

 

 

 

.....

 

 

 

 

)

 

= δ n1 x1

+ δ n 2 x2

+ ... + δ nm xm

 

y n

 

По своему виду приведенная форма модели ничем не отличается от системы независимых уравнений, параметры которой оцениваются традиционным МНК. Применяя МНК, можно оценить δ, а затем оценить значения эндогенных переменных через экзогенные.

Коэффициенты приведенной формы модели представляют собой нелиней-

ные функции коэффициентов структурной формы модели. Рассмотрим это по-

ложение на примере простейшей структурной модели, выразив коэффициенты приведенной формы модели ij) через коэффициенты структурной модели (bi и аj). Для упрощения в модель не введены случайные переменные.

Для структурной модели вида:

y1 = b12 y2 + a11 x1y2 = b21 y1 + a22 x2

приведенная форма такова:

y1 =δ11 х1 +δ12 x2 ,y2 =δ21 х1 + δ22 x2

в ней y2 из первого уравнения структурной модели можно выразить следующим образом:

y2 = y1 ba11 x1

12

Тогда система одновременных уравнений будет выглядеть как:

 

 

 

 

y

a

x

 

 

 

 

 

 

y2

=

 

1

11

 

1

 

 

 

 

 

 

 

 

b12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

2

= b

21

y + a

22

x

2

 

 

 

 

 

 

 

1

 

 

 

 

 

 

Отсюда имеем:

 

 

 

a22b12

 

 

 

y =

 

 

 

a11

 

x

+

x

2

.

 

 

 

 

 

1

 

1 b12b21

 

1

 

1 b12b21

 

 

 

 

 

 

 

 

75

Таким образом, мы представили первое уравнение структурной формы мо-

дели в виде уравнения приведенной формы модели:

{y1 = δ11 х1 + δ12 x2

(9.3)

Из уравнения следует, что коэффициенты приведенной формы модели представляют собой нелинейные соотношения коэффициентов структурной формы модели, т.е.

δ11

=

 

 

a11

и

δ12

=

 

 

a22b12

1

b12b21

1

b12b21

 

 

 

 

 

Аналогично можно показать, что коэффициенты приведенной формы модели второго уравнения системы (δ21 и δ22) также нелинейно связаны с коэффициентами структурной модели. Для этого выразим переменную у1 из второго структурного уравнения модели:

y

 

= y2 a22 x2

 

 

 

 

 

1

 

 

b21

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Отсюда получаем:

 

 

 

 

y

2

=

 

a11b21

x

+

a22

x

2

,

 

 

 

 

 

1

 

1 b12b21

 

 

 

 

1 b12b21

 

 

 

что соответствует уравнению приведенной формы:

{y 2 = δ 21 х1 + δ 22 x 2

a22

δ21

=

 

 

a11b21

и δ22 =

1

 

1 b12b21

 

 

b12b21

Эконометрические модели обычно включают в систему не только уравнения, отражающие взаимосвязи между отдельными переменными, но и выражения тенденции развития явления, а также разного рода тождества. Так, в 1947 г., исследуя линейную зависимость потребления (с) от дохода (у), Т. Хавельмо предложил одновременно учитывать тождество дохода. В этом случае модель имеет вид:

с = a + by

, (9.4)

y = c + x

где х – инвестиции в основной капитал и в запасы экспорта и импорта; аиb – параметры линейной зависимости с от у.

Их оценки должны учитывать тождество дохода в отличие от параметров обычной линейной регрессии.

В этой модели две эндогенные переменные (с и у) одна экзогенная переменная (х). Система приведенных уравнений такова:

с = A0

+ A1 y

(9.5)

 

+ B1 x

y = B0

 

76

9.1. Идентифицируемость уравнений

При исследовании эконометрической модели нас в конечном счете интересует, прежде всего, поведение эндогенных переменных Yt . Из приведенной формы модели видно, что эндогенные переменные Yt являются по своей природе случайными величинами, поведение которых определяется внутренней структурой модели, а именно коэффициентами при переменных и природой случайных остатков. Возникает вопрос: а возможно ли, следуя «в обратном направлении», восстановить структурную форму по приведенной. Именно этот вопрос и отражает сущность проблемы идентифицируемости эконометрической модели.

Ответ на этот вопрос в общем случае, очевидно, отрицательный: без дополнительных ограничений на внутреннюю структуру модели (т.е. без соблюдения некоторых условий идентифицируемости) такое восстановление невозможно.

В эконометрической теории приняты следующие определения.

Уравнение структурной формы эконометрической модели называется точно идентифицируемым, если все участвующие в нем неизвестные коэффициенты однозначно восстанавливаются по коэффициентам приведенной формы без каких-либо ограничений на значения последних.

Эконометрическая модель называется точно идентифицируемой, если все уравнения ее структурной формы являются точно идентифицируемыми.

Уравнение структурной формы эконометрической модели называется сверхидентифицируемым, если все участвующие в нем неизвестные коэффициенты восстанавливаются по коэффициентам приведенной формы, причем некоторые из его коэффициентов могут принимать одновременно несколько числовых значений, соответствующих одной и той же приведенной форме.

Уравнение структурной формы эконометрической модели называется неидентифицируемым, если хотя бы один из участвующих в нем неизвестных коэффициентов не может быть восстановлен по коэффициентам приведенной формы.

Эконометрическая модель называется неидентифицируемой, если хотя бы одно из уравнений ее структурной формы является неидентифицируемым.

Проблема идентифицируемости эконометрической модели важна для выбора метода статистического оценивания параметров в моделях.

Если обозначить число эндогенных переменных в определенном уравнении системы через Н, а число предопределенных переменных, которые содержатся в системе, но не входят в данное уравнение, – через D, то необходимое условие идентифицируемости модели может быть записано в виде следующего счетного правила:

D + 1 = Н – уравнение идентифицируемо;

D + 1 < Н – уравнение неидентифицируемо;

D + I > Н – уравнение сверхидентифицируемо.

Достаточное условие идентификации: определитель матрицы, составленной из коэффициентов при переменных, отсутствующих в исследуемом уравнении, не равен нулю, и ранг этой матрицы не менее числа эндогенных переменных без единицы.

77

Для оценки параметров структурной модели система должна быть идентифицируема или сверхидентифицируема.

Для решения идентифицируемого уравнения применяют косвенный метод наименьших квадратов, для решения сверхидентифицируемого – двухшаговый метод наименьших квадратов.

Косвенный метод наименьших квадратов (КМНК)

Косвенный метод наименьших квадратов состоит в следующем:

1.Структурная модель преобразовывается в приведенную форму модели.

2.Для каждого уравнения приведенной формы модели обычным методом наименьших квадратов оцениваются приведенные коэффициенты.

3.Путем алгебраических преобразований переходим от приведенной формы к уравнениям структурной формы модели, получая тем самым численные оценки структурных параметров.

Двухшаговый метод наименьших квадратов (ДМНК)

Двухшаговый метод наименьших квадратов состоит в следующем:

1.Структурная модель преобразовывается в приведенную форму модели.

2.Для каждого уравнения приведенной формы модели обычным методом наименьших квадратов оцениваются приведенные коэффициенты.

3.Выявляют эндогенные переменные, находящиеся в правой части структурного уравнения, параметры которого определяют двухшаговым методом наименьших квадратов, и находят расчетные значения по соответствующим уравнениям приведенной формы модели.

4.Обычным методом наименьших квадратов определяют параметры структурного уравнения, используя в качестве исходных данных фактические значения предопределенных переменных и расчетные значения эндогенных переменных, стоящих в правой части данного структурного уравнения.

9.2. Модель спроса и предложения

При математическом моделировании экономических объектов часто возникает необходимость формирования таких систем уравнений, в которых одни и те же переменные могут одновременно являться и результирующими и объясняющими. В эти уравнения могут входить лаговые переменные, т.е. переменные, относящиеся к предыдущим моментам времени (t-1, t-2, …). Такие системы уравнений называют одновременными. Примером системы одновременных уравнений может быть модель спроса и предложения:

y(1)

=

a

1 × y(2) +

1 +

ε

(t1)

(9.6)

t

 

 

t

 

b

 

 

(9.7)

y(t

3)

= a2 × y(t

2) + b2 +ε(t

2)

 

 

 

yt(1) = yt(3) ,

 

 

 

(9.8)

где yt(1) спрос на товары или услуги; yt(2) цена;

78

yt(3) предложение;

εt(2) ошибки модели..

Экономическая модель, сформированная в виде системы одновременных уравнений, может быть представлена в структурной или приведенной форме. В структурной форме уравнения имеют вид, отражающий непосредственные связи между переменными (система уравнений 9.6-9.8). Приведенная форма получается после решения системы относительно эндогенных (внутренних) переменных, то есть после выражения этих переменных через экзогенные переменные и параметры модели. Приведенная форма для модели спроса и предложения выражает зависи-

мость эндогенных переменных ( yt(1) ,

yt(2) ,

yt(3) ) от параметров модели (a1 , a2 , b1 , b2 ):

yt(1)

= a1

×

b2 b1 + b1 + δ t(1)

(9.9)

 

 

 

a1 a 2

 

 

 

( 2 )

=

b 2 b 1 +

( 2 )

(9.10)

 

y t

 

a 1 a 2

δ t

 

yt(3)

= a2 × b2 b1 + b2

+ δ t(3) ,

(9.11)

 

 

a1 a2

 

 

где δ t(1) , δ t(2) , δ t( 3 ) – преобразованные ошибки модели.

Также в качестве примера системы одновременных уравнений рассмотрим систему линейных уравнений с результирующими и предопределенными переменными:

yt(1) = α 0

+α1 × ( yt(3) xt(1)) + εt(1)

(9.12)

y(2) =β

× y(3) +

β

 

t(2) +

ε

t(2)

(9.13)

t

1

 

t1

 

2 x

 

 

y(3) = y(1) + y(2) +

t(3) ,

 

 

(9.14)

t

 

t

t

 

 

x

 

 

 

где yt(1) потребление; yt(2) инвестиции;

yt(3) национальный доход; xt(1) подоходный налог;

xt(2) норма процента как инструмент государственного регулирования; x(t3) государственные закупки товаров и услуг.

В этой модели эндогенными являются переменные yt(1) , yt(2) , yt(3) , а предо-

пределенными – xt(1) , xt(2) , xt(3) , где yt(3)1 – национальный доход за предыдущий

временной период. После несложных преобразований переходим к приведенной форме:

yt(1) =

 

 

1

(α0 +α1 xt(1) +α1 β 2 xе( 2) +α1 xt(3) +α1 β1

yt(3)1) +εt(1) +

 

 

α1

εt( 2)

1

α1

1

 

 

 

 

α1

yt( 2) = β1 × yt(31) + β 2 xt( 2) + εt( 2)

79

Пример решения задачи к разделу V

Имеются данные за 1994-1998 гг. (табл. 2.5.1).

 

Исходные статистические данные

 

Таблица 2.5.1

 

 

 

 

 

 

Доход на душу на-

 

Расходы по обработ-

Год

Годовое потребление

Оптовая це-

 

 

мяса на душу насе-

на за кг.,

селения, руб., х1

 

ке мяса, % к цене, х2

 

ления, кг., у1

руб., у2

1300

 

60

1994

60

5,0

 

1995

62

4,0

1300

 

56

1996

65

4,2

1500

 

56

1997

62

5,.0

1600

 

63

1998

66

3,8

1800

 

50

Требуется:

Построить модель вида:

y1 = f (y2 , x1 )y2 = f (y1 , x2 ),

рассчитав соответствующие структурные коэффициенты. Решение:

Система одновременных уравнений с двумя эндогенными и двумя экзогенными переменными имеет вид:

y = b ×y

2

+a

11

×x

1

 

1

12

 

+a

 

1

y

2

= b21

×y1

22

×x2

2

В каждом уравнении две эндогенные и одна отсутствующая экзогенная переменная из имеющихся в системе. Каждое уравнение и система в целом идентифицированы.

Для определения параметров такой системы применяется косвенный метод наименьших квадратов.

Сэтойцельюструктурнаяформамоделипреобразуется вприведеннуюформу:

y = δ

×х

1

×x

2

 

 

1

11

 

12

 

,

y

2

= δ21

×х1

22

×x

2

в которой коэффициенты при х определяются методом наименьших квадратов.

Для нахождения значений δ11 , δ12 запишем систему нормальных уравнений:

х1y1 11 ×х12 12 ×х1x2х2 y2 11 ×х1х2 12 ×х22

При ее решении предполагается, что х и у выражены через отклонения от средних уровней, т.е. матрица исходных данных такова (табл. 2.5.2):

80

Таблица 2.5.2

Исходные данные

 

у1

у2

х1

х2

 

-3

0,6

-200

3

 

-1

-0,4

-200

-1

 

2

-0,2

0

-1

 

-1

0,6

100

6

 

3

-0,6

300

-7

0

0,0

0

0

Применительно к ней необходимые суммы оказываются следующими:

× у1х1 = 1600; ∑ у1х2 = –37;х12 = 180000; ∑ х1х2 = –1900;х22 = 96

Система нормальных уравнений составит:

1600 = δ11 ×180000 − δ

12 ×1900

 

= −δ11 ×1900

+ δ12

×96

37

Решая ее, получим: δ11 = 0,00609; δ12= – 0,26481.

Итак, имеем у1 = 0,00609 × х1 0,26481 × х2.

Аналогично строим систему нормальных уравнений для определения коэффициентов δ21 δ22 самостоятельно.

у2 = 0,00029 × х1 + 0,11207 × х2.

Приведенная форма модели имеет вид:

y1 = 0,00609 ×х1 0,26481×x 2y2 = 0,00029 ×х1 + 0,11207 ×x 2

Из приведенной формы модели определяем коэффициенты структурной модели:

y1

= 0,00609 ×х1 0,26481×x 2

 

 

 

 

у

 

0,00029 ×х

 

 

 

 

 

 

=

 

2

1

 

 

 

х2

 

 

 

 

 

 

 

 

 

 

 

 

0,11207

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у1 = 0,00609 ×х1 0,26481×

у2 0,00029 ×х1

= −2,36290 × у2 + 0,00678×х1

0,11207

 

 

 

 

 

 

 

 

 

 

 

 

y2

= 0,00029 ×х1 + 0,11207 ×x 2

 

 

 

у

 

 

+ 0,26481×х

 

 

 

 

 

 

 

=

1

2

 

 

 

 

х1

 

 

 

 

 

 

 

 

 

 

 

0,00609

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

у1 = 0,00029 × у1 + 0,26481×х21 + 0,11207 ×х2 = 0,04762 × у1 + 0,12468×х2 0,00609

Итак, структурная форма модели имеет вид:

y1 = −2,36290 × y2 + 0,00678×x1 + ε1y2 = 0,04762 × y1 + 0,12468×x 2 + ε2

81

Вопросы для самопроверки

1.Каковы основные причины использования систем одновременных урав-

нений?

2.Почему обычный МНК практически не используется для оценки систем одновременных уравнений?

3.Объясните суть ДМНК.

Задачи для самостоятельной работы

№1. Оценить следующую структурную модель на идентификацию:

 

у

1

= b

13

× y

3

+ a

11

× x

1

+ a

13

×

x

3

 

у

= b

×

y

+ b

× y

+ a

×

x

 

2

21

1

23

3

22

2

 

у 3

= b 32

×

y 2

+ a 31

× x 1

+ a 33

× x 3

 

Исходя из приведенной формы модели уравнений, найти структурные коэффициенты модели:

у1 = 2 × x1 + 4 x21 +10 × x3

 

у2

= 3 × x1 6 × x2 + 2 × x2

 

 

у3

= −5 × x3 + 8 × x2 + 5 × x3

 

№2. Ниже приводятся результаты расчета параметров некоторой эконометрической модели.

Структурная форма модели:

Y1Y2Y3

=4 + ??? ×Y2 9,4 × X 2 + ε1

=12,83 2,67 ×Y1 + ??? × X1 + ε2

=1,36 1,76 ×Y1 + 0,828 ×Y2 + ε3

Приведенная форма модели:

Y1 = 2 + 4 × X 1 3× X 2 +ν1Y2 = 7,5 + 5 × X 1 +8 × X 2 +ν2Y3 = 4 + ??? × X 1 + ??? × X 2 +ν3

1.Какими методами получены параметры структурной и приведенной форм модели? Возможно ли применить косвенный МНК для расчета структурных параметров модели?

2.Восстановите пропущенные характеристики.

№3. Строится модель вида:

Y1 = a1 + b2 ×Y2 + c1 ×X1 + ε1Y2 = a 2 + b1 ×Y1 + c2 ×X2 + ε2

82

Определить структурные коэффициенты, учитывая, что

Y1 X 1 = 2600 ;

Y1 X 2 = 4350 ; Y1 = 350; Y2

= 25; X 1 = 750;

X 2 = 350;

X 12 = 1200 ; X 22 = 1800 ; n = 30;

X 1 X 2 = 1500 ,

а также

Y2

= 2 X 1 + 3X 2 .

 

№4. Имеется следующая гипотетическая структурная модель:

у1 =b12 ×y2 +a11 ×x1 +a12 ×x2у2 =b21 ×y1 +b23 ×y3 +a22 ×x2у3 =b32 ×y2 +a31 ×x1 +a33 ×x3

Приведенная форма исходной модели имеет вид:

 

у

 

= 3× х 6

× x

2

+ 2

× x

3

 

 

1

1

 

 

 

 

 

 

 

у2 = 2 × х1 + 4 × х2 +10 × x3

 

у

3

= −5 × х +

6 × x

2

+

5 × x

3

 

 

1

 

 

 

 

 

 

1.Проверить структурную форму модели на идентификацию.

2.Определить структурные коэффициенты модели.

83