Скачиваний:
112
Добавлен:
20.04.2015
Размер:
419.45 Кб
Скачать

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

Тестов на гетероскедастичность очень много, я упомянул лишь некоторые из них, с моей точки зрения, наиболее важные. Рассказ об одном из тестов, не вошедших в это пособие, с примерами его применения может стать хорошей темой для доклада.

Устранение последствий гетероскедастичности.

Если мы обнаружили, что в модели есть гетероскедастичность, нужно постараться понять, почему она возникла и можно ли как-то перестроить модель, чтобы ее не было. Следует помнить, что часто причиной возникновения гетероскедастичности является неправильная спецификация модели. Важно, чтобы выборка, по которой мы оцениваем модель, была достаточно однородной. Например, при оценке макроэкономических моделей по cross section данным лучше переходить к величинам в расчете на душу населения, так как в этом случае различие дисперсии будет меньше, чем для валовых показателей. Иногда полезно перейти от значений переменных к их логарифмам и т.д. Следует так же обратить внимание на нетипичные наблюдения в выборке. Главная мысль следующая: при обнаружении гетероскедастичности не следует сразу ее устранять, используя FGLS, лучше сначала попытаться решить эту проблему, исходя из здравого смысла и экономической логики. Поступив так, вы получите более осмысленное и красивое решение чем, то, которое можно найти, устранив гетероскедастичность техническими средствами.

Если вы все-таки поняли, что гетероскедастичность является неотъемлемой частью модели, то у вас есть две альтернативы.

1.Устранить гетероскедастичность, используя FGLS.

2.Довольствоваться МНК оценками, пересчитав оценку их ковариационной матрицы с учетом гетероскедастичности.

Выбор между этими двумя альтернативами определяется тем, насколько точно мы можем оценить ковариационную матрицу ошибок, необходимую для вычисления оценок FGLS, и тем, позволяет ли использование FGLS получить выводы, которые содержательно отличаются о того, что было при использовании обычного МНК. Гетероскедастичность бывает часто, но устранять ее следует тогда, когда это что-то существенно меняет.

Рассмотрим теперь оба эти метода более подробно.

GLS в случае гетероскедастичности – метод взвешенных наименьших квадратов (weighted least square) WLS.

Пусть у нас есть модель множественной регрессии, в которой присутствует гетероскедастичность.

(5.25)

Yi = β1 +β2 X2i +......+βk Xki +εi

 

 

σ12

0

 

соответственно:

 

 

 

 

cov(ε)= Σ =

 

 

 

 

 

0

2

 

 

 

σn

 

Так как в случае гетероскедастичности ковариационная матрица диагональная, то вычисление Σ1 и Ψ не составляет никакого труда.

 

 

 

 

 

 

1

 

0

 

 

 

 

1

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

σ

2

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

σ1

 

 

 

(5.26)

Σ

1

=

 

 

 

 

 

 

 

 

 

 

Ψ =

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

1

 

 

 

 

 

 

0

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ

2

 

 

2

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σn

 

Как легко видеть, условие

 

Σ1 = ΨT Ψ

 

для (5.26) выполняется. Преобразование

данных (5.03)

(умножение модели (5.25)

 

на

 

Ψ ) будет в случае гетероскедастичности

11

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

состоять в том, что мы делим каждое из наблюдений, на корень из дисперсии ошибки этого наблюдения:

(5.27)

Y

 

=

Y

X

 

=

X ji

,

 

i

ji

 

 

i

 

 

σ2

 

 

σ2

 

 

 

 

 

i

 

 

 

i

 

Как было показано в главе про GLS благодаря этому преобразованию мы получим модель удовлетворяющую всем предпосылкам т. Гаусса-Маркова.

(5.28)

Yi = β1 X1i + β2 X2i +......+ βk X ki +ui

D(ui )=1 i

Обратите внимание, что в модели (5.28) отсутствует константа. Вместо нее появляется переменная X1i = σ1 i2 , так как константу мы тоже должны преобразовать, как и все

остальные переменные модели (5.25).

Сумму квадратов остатков для модели (5.28) можно выразить через сумму квадратов остатков исходной модели (5.25):

 

n

ei 2 = n

(Yi β1 X1i β2 X2i ......βk X2i )2 =

(5.29)

i=1

 

 

 

i=1

 

 

 

 

= n

1

(Yi

β1 β2 X2i ......βk Xki )2 = n

ei2

 

 

 

 

2

2

 

i=1

σ

i

i=1

σ

i

 

 

 

При выводе мы использовали (5.27).

Из (5.29) мы видим, что применение к данным GLS в случае гетероскедастичности эквивалентно минимизации суммы квадратов остатков обычной МНК (OLS) регрессии деленных на дисперсии ошибок. Поэтому GLS для случая гетероскедастичности называют взвешенным методом наименьших квадратов (weighted least squares) или сокращенно

WLS. В данном случае весами является ряд 1 .

σi2

В общем случае ковариационная матрица может быть известна с точностью до константы:

 

h1

0

 

 

(5.30)

 

 

 

 

σ

2

Σ =

 

 

 

 

 

 

0

h

 

 

 

 

 

 

n

 

 

или

 

σ2

= h σ 2

 

 

i

i

где

h

нам известны, а σ2 не известна.

 

 

i

 

 

В этом случае GLS оценки вычисляются по формулам (5.08) и (5.09). Из них следует, что, если ковариационная матрица известна нам с точностью до константы σ2 , в качестве весов для WLS нужно брать 1hi ,. После преобразования данных дисперсия

ошибки для всех наблюдений будет одинакова и равна D(ui )=σ2 i . Так как это

удовлетворяет всем условием т. Гаусса-Маркова, оценка параметра σ2 может быть найдена по обычной формуле σ2 = nRSSk .

Замечание. В WLS регрессии сумма остатков не равна нулю, так как в уравнении (5.28) нет константы. Поэтому интерпретировать коэффициент детерминации надо с осторожностью, так как не выполняется равенство TSS=ESS+RSS.

WLS реализован в EVievs для оценки с его помощью уравнения нужно выбрать

Quick/Estimate Equation/Options и поставить галочку около Weighted LS, в графе Weight

написать названия переменной, которая состоит из значений 1hi , нажать OK. Далее в

12

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

графе Equation Specification ввести уравнение так, как оно выглядит до преобразования, то есть написать модель (5.25) и оценить ее, нажав OK еще раз. =)

Вспомним пример гетероскедастичности в модели для сгруппированных данных, который был рассмотрен на странице 5. В этом примере ковариационная матрица ошибок имела вид:

 

 

σ2

0

 

 

1

0

 

 

 

 

n

 

 

 

 

 

 

 

 

 

n

 

(5.29)

 

1

 

 

 

 

1

 

 

 

 

σ2

Σ =

 

 

 

=

 

 

 

 

 

 

 

 

σ2

 

 

 

0

 

1

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

nN

 

 

 

 

 

nN

 

В этом случае в качестве весов нужно использовать

ni . Преобразованная модель (5.28)

для этого случая будет иметь вид:

ni Yi

= β1

ni +β2

ni X2i +......+βk ni Xki +ui .

FGLS при гетероскедастичности.

Обычно мы не знаем, чему именно равна дисперсия даже с точностью до константы. Поэтому нам необходимо оценить hi . Как правило, предполагается, что они

зависят от одной или нескольких известных нам переменных. Тогда (5.30) будет выглядеть следующим образом:

(5.31) σi2 =σ2 h(γ, Zi )

Правую часть (5.31) иногда называется skedastic function, то есть функция, которая описывает дисперсию. Zi -это вектор переменных, от которых эта функция зависит, γ -

вектор параметров этой функции.

Формула (5.30) дает достаточно широкий простор для эконометрической фантазии, единственное ограничение при выборе функции h(γ, Zi ) состоит в том, что она не должна

принимать отрицательных значений.

Доступный обобщенный метод наименьших квадратов FGLS состоит в том, что мы сначала оцениваем (5.31) получаем γ , а затем используем hi = h(γ , Zi ) для оценки исходного уравнения с помощью WLS. Для того чтобы оценить (5.31), нужно сделать предположение о том, как конкретно выглядит h(γ, Zi ), и заменить неизвестные нам величины σi2 на их оценки σi2 = ei2 . ei2 -это остатки из обычной МНК регрессии.

Как правило, рассматриваются самые простые функциональные зависимости. Например, если у нас есть одна переменная, которая предположительно влияет на дисперсию, то (5.31) можно представить как

(5.32) σi2 =σ2 Ziγ

где γ обычно принимает значения 2; 1; 1; 2 . Выбрать, какая степень лучше подходит

можно исходя из результатов теста Парка и теста Глейзера (смотри 5.23 и 5.22). Проделав их для различных γ . Например, если из всех вариантов Теста Глейзера наибольшее

значение t-статистика получилось в уравнении ei =α +γ Zi +νi , значит γ = 2 , в качестве весов нужно использовать 1Zi2 . Такой вывод был мы сделали, так как результаты теста означают, что ei = σ2 пропорционален Zi , значит σi2 пропорциональна Zi2 . Чтобы составить общее представление о том, как зависят остатки от Zi можно начать с построения графика остатков, упорядочив перед этим наблюдения по возрастанию Zi . Выбор целых степеней γ позволяет даже в преобразованном уравнении получать переменные, имеющие какой-то смысл. Важно помнить, что переменная Zi не должна

13

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

принимать отрицательных значений. В нашем примере со сгруппированными данными логичным выбором Zi является ni , а γ = −1.

Однако, по-моему, более разумный подход состоит в том, чтобы оценивать (5.32) непосредственно с помощью метода наименьших квадратов, а не на основе результатов других тестов. Этот подход будет работать даже в случае, если дисперсия ошибки зависит от большого числа переменных. Для того чтобы гарантировать выполнение условия

h(γ, Zi )> 0 используется экспоненциальная спецификация. В этом случае (5.31) можно

записать, так:

σi2 =σ2 exp(α0 +α1Zi1 +......+αp Zip )

(5.33)

Чтобы оценить это уравнение с помощью МНК его нужно прологарифмировать. Кроме

того, подставить вместо σ2

ее оценку. e2

. Получаем.

i

i

 

(5.34)

ln (ei2 )=α0 +α1Zi1 +......+αp Zip +νi

Константу σ2 в (5.34) мы опустили, так как для нас на этом этапе важно оценить только h(γ, Zi ). Уравнение (5.34) ничем не отличается от уравнения теста Парка (5.22), который

мы критиковали за то, что в уравнении этого теста не соблюдаются предпосылки теоремы Гаусса-Маркова, статистики неправильно распределены и т.д. Почему же мы возражали против использования логарифмической модели для проверки гетероскедастичности, а теперь используем эту модель для устранения гетероскедастичности? Может лучше взять обычную линейную модель из теста Breusch-Pagan? «Linear alternatives such as (5.14) are fine when testing for heteroskedasticity, but they can be problematic when correcting for heteroskedasticity using weighted least squares. We have encountered the reason for this problem before: linear models do not ensure that predicted values are positive, and our estimated variances must be positive in order to perform WLS». (Wooldridge p.267)

Алгоритм устранения гетероскедастичности с помощью FGLS для спецификации гетероскедастической функции (5.33) (Использовать только, если до этого с помощью

тестов было установлено, что гетероскедастичность есть)

1.Оцениваем методом наименьших квадратов уравнение (5.34). В качестве объясняющих переменных (Zi ) используем те факторы, по которым в ходе тестирования исходной модели была выявлена гетероскедастичность. ei2 -это остатки исходной модели.

2.Вычисляем hi = exp(α0 +α1Zi1 +......+αp Zip )

3.Применяем WLS, в качестве весов берем 1hi

Примечание. На первом шаге можно использовать в качестве объясняющих

переменных Y и Y 2 из исходной модели.

Подведем итоги. Если в модели обнаружена гетероскедастичность, то ее можно устранить с помощью FGLS. Из первой главы мы знаем, что оценки этого метода будут состоятельны и асимптотически эффективнее, чем оценки обычного метода наименьших квадратов. На практике все зависит от того, насколько точно мы можем оценить дисперсию ошибок наблюдений. Если мы нашли переменные, которые хорошо их описывают, то FGLS будет работать.

При применении FGLS возникает две технические проблемы. Во-первых, в преобразованной регрессии не будет константы, поэтому коэффициент детерминации перестает быть хорошим измерителем качества регрессии. Во-вторых, мы делим все переменные в уравнении регрессии на одну и ту же переменную hi , это может привести к

возникновению ложных связей и мультиколлинеарности. Ведь даже если две независимых величины поделить на hi , они станут коррелированными.

14