книги / Эконометрика. Начальный курс
.pdf6.1. Гетероскедастичность |
181 |
объему. В первую группу попадают наблюдения с LOGLIVSP > 3.8 (155 наблюдений), во вторую — с LOGLIVSP < 3.35 (149 наблюде ний).
Из-за возникновения dummy trap проблемы в первом случае пришлось «выбросить» переменную R1, а во втором —переменные R2, R3 и R4, таким образом, количество регрессоров в обоих случа ях отличалось от первоначального числа 13. Соответственно число степеней свободы равнялось 143 = 155 —12 и 139 = 149 —10 (12 и 10 — это количество регрессоров соответственно в первой и во второй регрессии). Здесь использовано очевидное обобщение теста Голдфелда-Куандта на случай разного количества регрессоров.
После прогонки регрессий в каждой из групп получены следу ющиезначения сумм квадратовостатков: e\ei = 6.80 и е^вг = 3.76.
Таким образом, F = « 1.7. Вероятность того, что случай
ная величина с распределением Фишера F(143,139) принимает зна чение меньше единицы, равна 95%. Полученная величина F = 1.7 превышает Foos(143,139), и гипотеза гомоскедастичности остатков должна быть отвергнута.
Замечание
Отметим отдельно, что надо внимательно относиться к интерпре тации результатов тестов на гетероскедастичность. Дело в том, что неверная спецификация функциональной формы модели мо жет привести к тому, что тест отвергает гипотезу гомоскеда стичности. Поясним это на простейшем примере. Пусть истин ная модель имеет вид exp(yt) = а + (3xt + с гомоскедастиины ми ошибками, т. е. V(et) = а2, а мы оцениваем линейную модель yt = а + (3xt + et. В результате мы получим картину, похожую на приведенную на рис. 6.1.
Мы видим, что квадраты остатков регрессии е2, которыми опе рируют тесты на гетероскедастичность, зависят от значения пере менной xt, и, соответственно, тесты отвергают гипотезу гомоске дастичности, что в данном случае является следствием ошибки спецификации модели.
Рассмотрим пример, в котором мы встречаемся с данной си туацией.
182 |
Гл. 6. Гетероскедастичность и корреляция по времени |
Рис. 6.1
Пример. Зарплата в Нидерландах (Arthur van Soest). Продол жение 1 (см. начало —п. 4.4, стр. 134).
Попробуем исследовать на этих данных зависимость зарпла ты от возраста. Мы ожидаем, что до некоторого возраста зарпла та растет (идет накопление опыта), а далее —убывает. Простей ший способ учесть этот эффект —включить в уравнение как AGE так и AGE2. Мы ожидаем получить положительный коэффициент при AGE и отрицательный при AGE2. Результаты регрессии W на остальные переменные приведены в таблице 6.3.
|
|
|
|
Таблица 6.3 |
Dependent Variable: W____________________________________ |
||||
Variable |
Coefficient |
Std.Error |
t-Statistic |
Probability |
const |
8.0110 |
6.7978 |
1.1785 |
0.2405 |
SEX |
-3.6826 |
1.2275 |
-3.0000 |
0.0032 |
EDU |
3.3468 |
0.5511 |
6.0726 |
0.0000 |
AGE |
0.1707 |
0.3687 |
0.4631 |
0.6400 |
AGE2 |
0.0036 |
0.0048 |
0.7433 |
0.4585 |
R-sqitared |
0.5173 |
|
|
|
White Heteroscedasticity Test: |
|
|
||
F-statistic |
|
6.4422 |
Probability |
0.0000 |
Obs*R-squared |
31.9177 |
Probability |
0.0000 |
6.1. Гетероскедастичность |
183 |
Из таблицы видно, что коэффициенты при интересующих нас переменных AGE и AGE2 не значимы. Тест Уайта пока зывает наличие гетероскедастичности. Прежде чем начать кор рекцию гетероскедастичносги, вспомним, что тест может да вать такой результат при ошибке спецификации функциональ ной формы. В самом деле, поскольку, как правило, все над бавки к зарплате формулируются в мультипликативной фор ме («увеличение на 5%»), то более естественно взять в каче стве зависимой переменной логарифм зарплаты In W. Резуль таты регрессии In W на остальные переменные приведены в таблице 6.4.
Dependent Variable: In W |
|
|
Таблица 6.4 |
|
Std.Error |
|
|
||
Variable |
Coefficient |
t-Statistic |
Probability |
|
const |
1.4217 |
0.2585 |
5.5001 |
0.0000 |
SEX |
-0.1447 |
0.0467 |
-3.0005 |
0.0023 |
EDU |
0.1244 |
0.0210 |
5.9367 |
0.0000 |
AGE |
0.0660 |
0.0140 |
4.7045 |
0.0000 |
AGE2 |
-0.00061 |
0.0002 |
-3.3225 |
0.0011 |
R-squared |
0.6098 |
|
|
|
White Heteroscedasticity Test: |
|
0.1625 |
||
F-statistic |
|
1.5619 |
Probability |
|
Obs*R-squared |
9.2254 |
Probability |
0.1613 |
Теперь оба коэффициента значимо отличаются от нуля и име ют «правильные знаки». Тест Уайта показывает отсутствие гетеро скедастичности. Из последнего уравнения можно также получить, что возраст, при котором достигается максимальная зарплата, ра вен примерно 54 годам, что согласуется со здравым смыслом. По водимому следует заключить, что в первом уравнении резуль тат теста указывал на ошибку спецификации. Пример показыва ет, что при эконометрическом анализе полезна любая дополни тельная информация (в нашем случае — механизм формирования зарплаты).
184 |
Гл. 6. Гетероскедастичность и корреляция но времени |
6.2.Корреляция по времени
Авторегрессионный процесс первого порядка
При анализе временных рядов часто приходится учитывать стати стическую зависимость наблюдений в разные моменты времени. Иными словами, для многих временных рядов предположение о некоррелированности ошибок не выполняется. В этом разделе мы рассмотрим наиболее простую модель, в которой ошибки образу ют так называемый авторегрессионный процесс первого порядка (точное определение будет дано ниже). Как было показано ранее (глава 5), применение обычного метода наименьших квадратов к этой системе дает несмещенные и состоятельные оценки парамет ров, однако можно показать (см., например, Johnston and DiNardo, 1997), что получаемая при этом оценка дисперсии оказывается смещенной вниз, что может отрицательно сказаться при проверке гипотез о значимости коэффициентов. Образно говоря, МНК ри сует более оптимистичную картину регрессии, чем есть на самом деле.
Как и раньше, рассмотрим модель
у = Х 0 + е , |
(6.5) |
где t-я компонента вектора у представляет значение зависимой переменной в момент времени t, t = 1 ,...,п . Будем для опре деленности считать, что первым регрессором в X является кон станта. Запишем подробнее уравнение для наблюдения в момент времени t:
Vt = А + / % а ;* 2 Н----------- Ь P k ^ tk + в * = + £ «> ( 6 . 6 )
где х[ = (1,Х(2, • • • ,xtk) — t-я строка матрицы X .
Один из наиболее простых способов учета коррелированности ошибок (в разные моменты времени) состоит в предположе нии, что случайная последовательность {е*, t — 1 ,... ,п} образу ет авторегрессионный процесс первого порядка. Это означает, что ошибки удовлетворяют рекуррентному соотношению
£t = p£t-1 + |
(6.7) |
6.2. Корреляция по времени |
185 |
где {14, t = 1,...,п } — последовательность независимых нор мально распределенных случайных величин с нулевым средним и постоянной дисперсией <т2, а р — некоторый параметр, называе мый коэффициентам авторегрессии (|р| < 1). Строго говоря, для полного описания модели надо определить £о- Будем считать, что £о ~ нормальная случайная величина с нулевым средним и дис персией а2 = <х£/(1 - р2), не зависящая от {i/t, t = 1 ,... ,п}. Из дальнейшего станет ясно, почему у £о именно такие параметры. Взяв математическое ожидание от обеих частей (6.7), получим Б £( = р Е £(_i, откуда следует, что Е ££ = 0, t = 1 , ... ,« . По скольку £t_i выражается через v\ , ... , vt- i (см. (6.7)), то £t_i и щ независимы. Поэтому
Умножая (6.7) на £t_i и вновь пользуясь независимостью £t_i и i получим
E(£t £t_l) = COV(£*,£*_!) = p V (£t_i) = p o 2. |
(6.9) |
Аналогично Cov (££)££_г) = (Per2 и вообще
Cov(£t,£t_m) = рто\. |
(6.10) |
Таким образом, последовательность {£*} образует стационар ный1 случайный процесс. Именно этим обстоятельством дикто вался выбор параметров начальной величины £о- На самом деле, с течением времени зависимость ££ от £о быстро уменьшается, по этому в большинстве книг по эконометрике проблему начальных условий для {£t} просто не рассматривают, неявно подразумевая, что процесс (6.7) при любом начальном значении быстро сходит ся к стационарному. Отметим также, что условие \р\ < 1 является необходимым для стационарности.
'Более подробно понятие стационарности будет рассмотрено в главе 11.
186 |
Гл. 6- Гетероскедастичность и корреляция по времени |
Из (6.9) следует, что
Р = Cov (et,et_г)/<т2 = Cov (et,et_i)/(V (et)1/2V ( ^ . i ) 1/2),
т. e. p есть в точности коэффициент корреляции между двумя со седними ошибками. Пользуясь (6.10), можно выписать ковариаг ционную матрицу случайного вектора е:
|
■ 1 |
р |
р2 ... |
|
„1 |
р |
1 |
р ... |
РП" 2 |
П = 11 - р г2 |
р2 |
р |
1 ... |
рп_3 |
|
|
рП-Э ... |
|
|
|
L>n_i |
рп- 2 |
1 |
Оценивание в модели с авторегрессией
Проблему оценивания системы (6.5) рассмотрим отдельно для случая, когда коэффициент р известен, и отдельно — когда неиз вестен.
1. Значение р извест но. В этом случае для оценивания систе мы (6.5) можно применить обобщенный метод наименьших квад ратов. В данном случае нетрудно найти матрицу Р , для которой Р ' Р = ГГ1 (см. (5.5)). Здесь весьма просто догадаться, какое линейное преобразование исходной системы (6.5) надо провести, чтобы получить классическую модель. Напишем (6.6) для момен та времени t —1 (t > 2)
Vt-1 = x't-\ P + e*-i,
умножим обе части на р и вычтем почленно из (6.6). Тогда с уче том (6.7) получим
V i ~ P V t - i = (* t - p x t - i Y P + |
(6.11) |
При t = 1 достаточно обе части уравнения (6.6) умножить на л/1 —Р2'
\ Л - Р22/1 = л /1 — Д2 х ' ф + y / i - Р2£ \ . |
(6.12) |
6.2. Корреляция по времени |
187 |
В системе (6.11), (6.12) ошибки удовлетворяют условиям уже обычной регрессионной модели. Действительно, в (6.11) случай
ные величины {i/t, |
t = |
2 ,...,п } независимы и имеют постоян |
ную дисперсию |
а в |
(6.12) ошибка у/1 — р2£i не зависит от |
{i/t, t = 2 ,... ,п} и, согласно (6.8), также имеет дисперсию а2. На практике часто опускают преобразование (6.12), игнори
руя тем самым первое наблюдение. С одной стороны, благодаря этому, преобразование исходной модели (6.5) становится единооб разным. В частности, для получения оценки параметра (3\ доста точно оценку свободного члена в (6.11) разделить на (1-р). С дру гой стороны, отбрасывание первого наблюдения может привести к потере важной информации, особенно в выборках небольшого размера.
2. Значение р неизвест но. Ситуации, когда параметр авто регрессии р известен, встречаются крайне редко. Поэтому возни кает необходимость в процедурах оценивания при неизвестном р. Как правило, они имеют итеративный характер. Опишем три наи более употребительные. Мы не будем устанавливать сходимость этих процедур, практика их применения показала, что они доста точно эффективны.
Процедура К охрейна-О ркат т а {C ochrane-O rcutt). На чальным шагом этой процедуры является применение обычного метода наименьших квадратов к исходной системе (6.5) и получе ние соответствующих остатков е = (e i,... ,е„)'. Далее,
1)в качестве приближенного значения р берется его МНКоценка г в регрессии et = де4_j + vt\
2) проводится преобразование (6.11) (или (6.11), (6.12)) при
р = г, и находятся МНК-оценкн /3 вектора параметров /3;
3)строится новый вектор остатков е = у — X /3;
4)процедура повторяется, начиная с п. 1).
Процесс обычно заканчивается, когда очередное приближение р мало отличается от предыдущего. Иногда просто фиксируется
188 Гл. 6. Гетероскедастичность и корреляция по времени
количество итераций. Процедура Кохрейна-Оркатта реализована в большинстве эконометрических компьютерных программ.
Процедура Х илд рет а -Л у (H ildreth-Lu). Суть процедуры достаточно проста. Из интервала (—1,1) возможного изменения коэффициента р берутся последовательно некоторые значения (например, числа с постоянным шагом 0.1 или 0.05) и для каждо го из них проводится оценивание преобразованной системы (6.11). Определяется то значение этого параметра, для которого сумма квадратов отклонений в (6.11) минимальна. Затем в некоторой окрестности этого значения устраивается более мелкая сетка и процесс повторяется. Итерации заканчиваются, когда будет до стигнута желаемая точность. Время работы процедуры, очевидно, сокращается, если есть априорная информация об области изме нения параметра р.
Процедура Д арвина (Durbin). Преобразованная система (6.11) переписывается в следующем виде:
Vt = P i (1 - р ) + p y t- 1+ 02Xt2 - p fh x t - 12 + • • ■+ PkXtk - p fa x t - 1k + Vt,
T. e. yt-i включается в число регрессоров, а р — в число оцени ваемых параметров. Для этой системы строятся обычные МНКоценки г и Bj параметров р и pPj соответственно. В качестве оцен ки 0j берут Bj/r. Можно улучшить качество оценок /3, подста вив полученное значение г в систему (6.11), и найти новые МНКоценки параметров (3.
Тест Дарбина-Уотсона на наличие или отсутствие корреляции по времени
Большинство тестов на наличие корреляции по времени в ошиб ках системы (6.5) используют следующую идею: если корреляция есть у ошибок е, то она присутствует и в остатках е, получаемых после применения к (6.5) обычного метода наименьших квадра тов. Здесь мы рассмотрим только одну реализацию этого подхода. Пусть нулевая гипотеза состоит в отсутствии корреляции, т. е. HQ:
6.2. Корреляция по времени |
189 |
р = 0. В качестве альтернативной может выступать либо просто Hi: «не Но», либо односторонняя гипотеза, например, Hi: р > 0.
Наиболее широко используется тест Дарбина-Уотсона (Dur bin-Watson). Он основан на статистике
(6.13)
Будем считать, что постоянный член включен в число регрес соров. Тогда нетрудно проверить, что эта статистика тесно свя зана с выборочным коэффициентом корреляции между et и et_i. Действительно, проводя элементарные выкладки, имеем
Предполагая число наблюдений достаточно большим, можно считать, что приближенно выполнены следующие равенства: sir £ ?= 2 е« = - e i/(n - 1) ~ о и £Г=2 et_i = -е „ /(п - 1) « О
(поскольку выполнено точное равенство £ Г =1 е£ = 0 в силу нали чия постоянного регрессора). Поэтому выборочный коэффициент корреляции г между е£ и et_i можно приближенно представить в виде
£ £ ■ 2 e t £ t - \ ЕГ=2 e«et - i
Наконец, пренебрегая в (6.14) слагаемыми е\ и |
по сравне |
нию с общей суммой ]СГ=1 et ) окончательно получим |
|
DW « 2(1 - г). |
(6.15) |
190 |
Гл. 6. Гетероскедастичность и корреляция по времени |
Понятен и содержательный смысл статистики DW: если меж ду е£ и et- \ имеется достаточно высокая положительная корреля ция, то в определенном смысле et и et_i близки друг к другу и величина статистики DW мала. Это согласуется с (6.15): если ко эффициент г близок к единице, то величина DW близка к нулю. Отсутствие корреляции означает, что DW близка к 2. Таким об разом, если бы распределение статистики DW было известно, то для проверки гипотезы Но: р = 0 против альтернативы Hi: р > О можно было бы для заданного уровня значимости (например, для 5%-ного уровня) найти такое критическое значение d*, что если DW > d*, то гипотеза Но не отвергается, в противном случае она отвергается в пользу Hi. Проблема, однако, состоит в том, что распределение DW зависит не только от числа наблюдений п и количества регрессоров А:, но и от всей матрицы X , и, значит, практическое применение этой процедуры невозможно, посколь ку нельзя же составить таблицу критических значений d* для всех матриц Х \ Тем не менее, Дарбин и Уотсон доказали (Durbin, Wat son, 1951), что существуют две границы, обычно обозначаемые <2ц и di, du > di (и = upper — верхняя, l = low — нижняя), кото рые зависят лишь от п, к и уровня значимости (а следовательно, могут быть затабулированы) и обладают следующим свойством: если DW > du, то DW > d* и, значит, гипотеза Но не отвергается, а если DW < d|, то DW < d*, и гипотеза Но отвергается в пользу H i. В случае di < DW < d„ ситуация неопределенна, т. е. нельзя высказаться в пользу той или иной гипотезы. Если альтернатив ной является гипотеза об отрицательной корреляции Hi: р < 0, то соответствующими верхними и нижними границами будут 4 —d[ и 4 —d„. Целесообразно представить эти результаты в виде таблицы (см. таблицу 6.5).
Наличие зоны неопределенности, конечно, представляет опре деленные трудности при использовании теста Дарбина-Уотсона. Ее ширина может быть довольно значительной. К примеру, при п = 19, к = 3 она образует интервал (0.97, 1.68). Отметим, что некоторые компьютерные пакеты, например SHAZAM, численно вычисляют точные критические значения (зависящие от Л -).