Скачиваний:
112
Добавлен:
20.04.2015
Размер:
419.45 Кб
Скачать

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

Пример 1. Если мы строим зависимость дохода человека от различных факторов, то можно предположить, что для богатых людей дисперсия ошибки будет больше, так как их доходы характеризуются большим разбросом.

Пример 2. Предположим, что мы строим зависимость среднего роста в группе от

среднего

веса. Пусть для каждого индивида

эта зависимость имеет вид:

height j =α+β weight j +εj , при этом выполняются все предпосылки т. Гаусса-Маркова, в

том числе

D (εj )=σ2 , j . Однако, у нас данные,

усредненные по группам. Число

индивидов в группах может различаться. Дисперсия ошибки для i -той группы будет

равна

σ

2

 

, где n - число индивидов в i -той группе i =1.......N , N - число групп, а

 

 

i

 

ni

следовательно, и число наблюдений. Ковариационная матрица ошибки для таких данных будет иметь вид.

 

σ2

0

 

 

 

n

 

 

 

1

 

 

 

Σ =

 

 

 

Обратите внимание на то, что она известна нам с точностью до

 

 

σ2

 

 

 

0

 

 

 

 

 

 

 

 

nN

 

константы σ2 .

Гетероскедастичность часто наблюдается в финансовых временных рядах с высокой периодичностью (дневные и внутридневные данные). Имеются в виду биржевые котировки. Гетероскедастичность для этих данных обусловлена тем, что в зависимости от режима, в котором функционирует рынок, дисперсия котировок может сильно отличаться. Так появление новой негативной или позитивной информации может вызвать сильное увеличение дисперсии. Кроме того, смена состояний рынка происходит постепенно, поэтому дисперсия будет зависеть от своих значений в предыдущие периоды времени. Большие объемы данных, которые доступны при анализе финансовых временных рядов (число наблюдений измеряется тысячами), позволяют оценивать сложные модели гетероскедастичности, которые учитывают не симметричное влияние позитивных и негативных шоков, а то, что реакция на шоки не пропорциональная и т.д. К сожалению, моделирование гетероскедастичности в финансовых временных рядах не входит в программу нашего курса. Интересующимся этой темой могу порекомендовать книгу

Franses P. H. and D. van Dijk (2000) «Non-Linear Time Series Models in Empirical Finance».

В предыдущей главе про GLS подробно обсуждались последствия нарушения предпосылки о том, что cov(ε)= Inσ2. Гетероскедастичность - это частный случай

нарушения этой предпосылки, поэтому если она имеет место, (1) оценки метода наименьших квадратов перестают быть эффективными, (2) формулы для вычисления дисперсий коэффициентов и статистик, используемых при проверке гипотез, становятся неверными. Далее мы обсудим, как проверить наличие гетероскедастичности, и какие существуют методы устранения ее последствий.

Выявление гетероскедастичности.

Общим для всех тестов на наличие гетероскедастичности в модели регрессии является то, что нулевая гипотеза предполагает отсутствие гетероскедастичности в модели. Если мы ее не отвергаем, не стоит обольщаться. Просто, как было правильно отмечено при обсуждении этих тестов: «However, remember that we never accept H0 ; we

simply fail to reject it» (Wooldridge p.256).

Почти все тесты на гетероскедастичность выполняются, используя квадраты остатков, полученные из обычной МНК регрессии. Задача теста состоит в том, чтобы

5

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

проверить зависит ли D(εi )=σi2 от как-то другой переменной или набора переменных.

Если зависит, то очевидно гетероскедастичность есть. Если не зависит, то возможно, мы просто не смогли подобрать факторы, от которых зависит дисперсия. Мы не знаем σi2 (это

не наблюдаемая величина), поэтому для выполнения тестов мы берем ее оценку σi2 = ei2 , где ei - это остатки из МНК регрессии. Это не очень хорошая оценка, так как фактически

параметр оценивается по одному наблюдению. В финансовых временных рядах решение проблемы может быть красивее. Например, можно дисперсию для дневных данных, оценивать по внутридневным данным. В cross section данных приходиться довольствоваться тем, что мы имеем.

Существует два типа тестов на гетероскедастичность. Первый тип - это тесты, где рассматривается зависимость дисперсии ошибок от большого числа факторов, фактически проверяется гетероскедастичность произвольной формы. Кроме того они тестируют не только наличие гетероскедастичность, но и просто правильность спецификации модели. Второй тип – это тесты где проверяется, зависит ли дисперсия ошибки от одной отдельно взятой переменной. Результаты второго типа тестов проще интерпретировать, а выявленную с их помощью гетероскедастичность проще устранять. Однако, первый тип тестов более универсальный и надежный, так как с их помощью можно проверить большее число потенциально возможных типов гетероскедастичности.

Тесты для проверки гетероскедастичности произвольной формы.

В этих тестах строиться регрессионная зависимость ei2 от набора факторов, а потом

проверяется адекватность этой регрессии. Для этого иногда используется F - статистика, а иногда статистика теста множителей Лагранжа. В эконометрике существует три основных способа проверки ограничений в моделях: тест отношения правдоподобия, тест Вальда и тест множителей Лагранжа. Подробнее об этом можно прочитать, например, в Greene Ch.4.9.3. Преимущество теста множителей Лагранжа состоит в том, что для него достаточно оценить модель при выполнении ограничений и не нужно оценивать модель, для которой ограничения не выполняются. В нашем случае ограничение состоит в том, что в модели нет гетероскедастичности. Поэтому мы и оцениваем обычную МНК регрессию, из которой и берем остатки ei . А модель с гетероскедастичностью нам

оценивать не нужно. Статистика теста множителей Лагранжа для нашего случая будет вычисляться по формуле:

(5.13)

n R22 ,

 

e

n - число наблюдений; Re22 - коэффициент детерминации в регрессии, где объясняемой переменной являются ei2 . Если выполняется нулевая гипотеза, она будет асимптотически (при большой выборке) распределена как χ2 (m), m - это число объясняющих переменных в регрессии, где объясняемой переменной являются ei2 . Рассмотрим теперь

каждый из тестов более подробно.

Тест Breusch-Pagan 1980.

В тесте проверяется зависимость дисперсии σ2

от набора факторов Z ......Z

m

-

i

1

 

этими факторами могут быть как переменные входящие в исходную регрессию, так и любые другие переменные. Алгоритм проведения теста следующий:

1.

Оцениваем обычную МНК регрессию Yi = β1 +β2 Xi2 +

......+βk Xik +ei

2.

Используя полученные на первом шаге

 

остатки

e i оцениваем регрессию

 

(5.14)

e2 =α

0

+α

1

Z

i1

+......+α

m

Z

im

+ξ

i

 

 

 

i

 

 

 

 

 

 

6

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

3.

Используя

коэффициент

детерминации

R22

из

 

(5.14)

вычисляем статистику

 

 

 

 

 

 

 

 

e

 

 

 

 

 

 

 

(5.15)

 

n R22

 

 

 

 

 

 

 

 

 

 

 

 

 

e

 

 

 

 

 

 

 

 

4.

Если

выполняется H0 α1 =α2 =..... =αm = 0 ,

статистика

(5.15)

будет

иметь

 

распределение χ2 (m).

 

 

 

 

 

 

 

 

 

 

 

5.

Если

H0

не отвергается,

делаем вывод об отсутствии гетероскедастичности по

 

переменным Z1......Zm .

 

 

 

 

 

 

 

 

 

 

 

 

Примечание 1. Вместо (5.15) допустимо использовать F статистику для проверки

адекватности регрессии (5.14).

 

 

 

 

 

 

 

 

 

 

 

 

Примечание 2. Изначально в статье Breusch-Pagan 1980 была предложена

статистика:

 

 

 

ESS

 

 

 

 

 

 

 

 

 

 

(5.16)

 

 

 

 

 

 

 

 

 

 

 

 

 

2σ4

 

 

ei2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

ESS

берется из регрессии (5.14), а σ

2

=

.

Статистики

(5.16) и

(5.15)

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

асимптотически эквивалентны. Статистика (5.15) была предложена чуть позже (Koenker 1983). Статистика (5.16) лучше работает в случае, если εi имеют нормальное

распределение, а статистика (5.15) основана на предположении о большой выборке (Wooldridge p.257). Другим важным преимуществом (5.15) является то, что она вычисляется по общей формуле статистик теста множителей Лагранжа (5.13), которые широко используются для проверки гетероскедастичности, автокорреляции и т.д., поэтому ее легче запомнить и понять.

Примечание 3. Для вычисления статистики (5.16) в большинстве учебников рассматривается следующий метод. В регрессии (5.14) вместо объясняющих переменных

e2

используется

p

=

 

ei2

, где σ2 =

ei2

, тогда статистика (5.16) будет вычисляться по

σ2

i

 

i

 

 

n

 

формуле ESS2 .

Тест White 1980.

Для вывода формул статистик, которыми мы пользуемся для проверки гипотез в модели регрессии, мы использовали предположение т. Гаусса-Маркова о гомоскедастичности ошибок ε . Однако предположение о гомоскедастичности можно

заменить на более слабое, а именно на предположение о том, что ε2 не коррелирован с

X j , X 2j , X j Xl j l .

В этом случае все статистики будут асимптотически верны, даже если есть гетероскедастичность. Поэтому White предложил проверять зависимость ei2 от этих

факторов. Таким образом, тест White проверяет только те формы гетероскедастичности, которые могут сделать выводы, полученные при использовании МНК, неверными.

 

Алгоритм выполнения теста следующий

 

1.

Оцениваем обычную МНК регрессию Yi = β1 +β2 Xi2 +......+βk Xik +ei

2.

Используя

полученные

на первом

шаге остатки

ei , оцениваем регрессию

 

 

 

k

k l= j

 

 

(5.17)

ei2

= a0 +αj Xij

+∑∑δjl Xij Xil

+ξi

 

 

 

j=2

j=2 l=2

 

Уравнение регрессии (5.17) – это зависимость квадратов остатков от всех объясняющих переменных, квадратов объясняющих переменных и всех парных произведений объясняющих переменных.

7

Материалы по курсу эконометрика-1. Подготовил Выдумкин Платон

3.Проверяем гипотезу об адекватности регрессии (5.17). Для этого можно использовать либо обычную F статистику, либо статистику теста множителей

Лагранжа (5.13) n R2 χ2 (m),

где m -

это число

объясняющих

переменных в

регрессии (5.17).

 

 

 

 

 

 

 

4. В

случае если

гипотеза

не

отвергается, то

есть зависимости e2 от

X j ,

X 2j , X j Xl j l

не

выявлено,

делаем

вывод

об

отсутствии

гетероскедастичности.

Тест White реализован в EViews. Чтобы выполнить его нужно в объекте Equation

выбрать view\residual tests\ White Heteroskedasticity. EViews выводит обе статистики этого теста и p-value для них. В EViews доступно два варианта выполнения теста White: White Heteroskedasticity (cross terms) и White Heteroskedasticity (no cross terms). Вариант (cross terms)- это описанный выше тест. Однако число объясняющих переменных в уравнении

регрессии (5.17) достаточно большое k 1+

(k 1) (k 2)

, поэтому не всегда число

 

2

 

наблюдений позволяет выполнить тест. Иногда уравнение (5.17) не удается оценить еще и из-за большой корреляции между произведениями иксов, поэтому существует упрощенный вариант теста White. В этой модификации в уравнении (5.17) оставлены

только X j , X 2j , поэтому он и называется (no cross terms). В этом случае уравнение будет иметь вид:

 

k

k

(5.18)

ei2 = a0 +αj Xij

+γ j Xij2 +ξi

 

j=2

j=2

Тестовые статистики будут те же самые, что и в обычном тесте White, только число степеней свободы измениться, так как число объясняющих переменных в уравнении регрессии (5.18) меньше чем в (5.17).

 

Еще одни способ решить проблему большого числа объясняющих переменных в

уравнении (5.17) состоит в том, чтобы просто заменить эти

k + (k 1) (k 2)

переменную

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

всего на две Y , Y 2 . Так как

Y = β +β

2

X

i2

+......+β

k

X

ik

, то включение переменных

 

i i

i

1

 

 

 

 

 

 

 

 

 

 

 

 

Y , Y 2

в уравнение регрессии будет означать, что e2

зависит от X

j

,

X 2 ,

X

j

X

l

j l .

i i

 

 

 

 

 

 

i

 

 

 

 

 

j

 

 

 

Таким образом, в этом случае уравнение теста White будет иметь вид:

(5.19)

e2 = a +α

1

Y +α

2

Y 2

+ξ

i

 

 

i

0

i

 

i

 

 

Как и в обычном тесте White проверяется H0 α1 =α2

= 0 . Можно использовать F-

статистику или статистику

теста

множителей

Лагранжа

n R2 χ2 (2). Если нулевая

гипотеза не отвергается, то делается вывод об отсутствии гетероскедастичности.

Важное замечание по поводу тестов White и Breusch-Pagan.

Выше мы писали, что в случае если нулевая гипотеза не отвергается, то мы делаем вывод об отсутствии гетероскедастичности. Если она отвергается, то делаем вывод, что гетероскедастичность есть. Важно понимать, что это так только, если выполняются остальные предположения теоремы Гаусса-Маркова. В частности модель должна быть правильно специфицирована, если это условия не выполнено, то даже при гомоскедастичности, тесты White и Breusch-Pagan могут указывать на гетероскедастичность. Это может произойти, если в модель не включены значимые переменные или неправильно выбрана функциональная форма. Кроме того, ложный вывод о гетероскедастичности может быть получен, если в выборке есть несколько нетипичных наблюдений.

8