Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Глава2.doc
Скачиваний:
7
Добавлен:
20.04.2019
Размер:
850.94 Кб
Скачать

2.7. Проблема гетероскедастичности

Одной из важных предпосылок МНК является постоянство дисперсии случайных отклонений  при всех наблюдениях:

для всех i, j=1,2,…,n.

Выполнимость данной предпосылки называют гомоскедастичностью, а невыполнимость предпосылки – гетероскедастичностью.

Проблема гетероскедастичности в большей степени характерна для перекрестных данных, чем для временных рядов. Дело в том, что при перекрестных данных учитываются экономические субъекты или объекты (потребители, домохозяйства, фирмы, отрасли, страны и т.д.), имеющие различные доходы, размеры, потребности и т.д. В этом случае возможны проблемы, связанные с эффектом масштаба. Отсюда неоднородность разброса точек наблюдений и соответственно непостоянство дисперсии.

Последствия гетероскедастичности

Если в модели присутствует гетероскедастичность, то оценки коэффициентов, полученные обычным МНК, по-прежнему остаются состоятельными и несмещенными, однако перестают быть эффективными, и, следовательно, являются неточными.

Дисперсии и стандартные ошибки регрессии и ее параметров, напротив, являются смещенными. Поэтому все выводы, получаемые на основе t- и F-статистик по статистической значимости параметров и регрессии в целом, являются недостоверными. То же самое относится и к доверительным интервалам параметров. Поэтому ухудшаются прогнозные качества модели.

Обнаружение гетероскедастичности

Для определения наличия гетероскедастичности в модели существует множество методов.

Наиболее простым методом является графический анализ остатков. В рамках этого метода в прямоугольной системе координат по оси абсцисс откладываются значения какой-либо объясняющей переменной xi, либо линейной комбинации объясняющих переменных, а по оси ординат – либо эмпирические отклонения ei, либо их модули, либо их квадраты.

На рис. 2.1(а) отражена типичная картина гомоскедастичных остатков, а на рис. 2.1(б,в) показаны различные варианты гетероскедастичности.

Таким образом, при наличии гетероскедастичности регрессионные остатки уже не могут рассматриваться, как не зависящие от значений объясняющих переменных, а обнаруживают некоторую систематическую зависимость.

Рис. 2.1. Графическая иллюстрация проблемы гетероскедастичности

Графический анализ остатков является удобным в случае парной регрессии. При множественной регрессии графический анализ возможен для каждой из объясняющих переменных в отдельности. Однако чаще в данном случае по оси абсцисс откладывают значения , получаемые из эмпирического уравнения регрессии.

Из формальных методов обнаружения гетероскедастичности рассмотрим тест ранговой корреляции Спирмена и тест Глейзера.

Тест ранговой корреляции Спирмена основан на предположении, что дисперсия случайных отклонений будет либо повышаться, либо понижаться с увеличением объясняющей переменной х. Далее порядок действий следующий:

  • значения xi и ei ранжируются (упорядочиваются по возрастанию); в результате каждому значению xi и каждому значению ei ставятся в соответствие определенные ранги rang(xi) и rang(ei);

  • определяется коэффициент ранговой корреляции Спирмена:

,

где di – разность между рангами xi и ei;

  • рассчитывается наблюдаемое значение t-статистики:

;

полученное значение по модулю сравнивается с tтабл=t(, n2) – критической точкой распределения Стьюдента для двусторонней критической области с заданным уровнем значимости  и числом степеней свободы k=n2. Если , то гипотеза о равенстве нулю коэффициента ранговой корреляции и соответственно гомоскедастичности модели отвергается. Следовательно, в модели присутствует гетероскедастичность.

Если в модели имеется несколько объясняющих переменных, то проверка гипотезы может осуществляться для каждой из них отдельно или в целом для расчетных значений .

Тест Глейзера основан на анализе регрессионной зависимости модулей эмпирических отклонений ei от значений одной из объясняющих переменных или от теоретических значений . При этом рассматриваемая зависимость моделируется следующими уравнениями:

или ,

где k=…,1, , , 1,…; - новая случайная компонента, предположительно обладающая свойством гомоскедастичности.

Параметры уравнения оцениваются с помощью МНК и проверяются на их статистически значимое отличие от нуля. При этом статистическая значимость коэффициента в каждом конкретном случае (для каждого k) фактически означает наличие гетероскедастичности. Если данный коэффициент статистически значим для нескольких регрессий, то ориентируются на лучшую из них.

Устранение гетероскедастичности

При установлении гетероскедастичности возникает необходимость преобразования исходной модели. При этом вид преобразования зависит от того, известны или нет дисперсии случайных отклонений , i=1,2,…,n.

При известных для каждого наблюдения значениях применяется так называемый метод взвешенных наименьших квадратов, суть которого сводится к делению каждого наблюдаемого значения на среднеквадратическое отклонение . Проиллюстрируем этот метод на примере модели парной регрессии:

,

где i – номер наблюдения.

Разделим обе части этого уравнения на известные i:

Вводя обозначения , , , , получим новую регрессионную модель без свободного члена, но с дополнительной объясняющей переменной z и с преобразованным случайным отклонением :

. (2.17)

Нетрудно проверить, новая случайная компонента удовлетворяет условию постоянства дисперсии, т.е. гомоскедастичности. Действительно,

В ходе доказательства использовались известные свойства дисперсии. Параметры уравнения (2.17) могут быть определены с помощью обычного МНК, поскольку для него уже соблюдаются все предпосылки.

Предположим, что дисперсии регрессионных остатков заранее не известны, но установлено, что гетероскедастичность присутствует. Если для обнаружения гетероскедастичности использовался критерий Глейзера, то можно воспользоваться его результатами.

Например, если имеет место статистическая значимость модели

,

определяемая статистической значимостью параметра , при некотором k, то дисперсия случайных остатков может рассматриваться как пропорциональная значениям . Тогда при делении обеих частей множественной регрессии на выражение получается модель с гомоскедастичными случайными остатками.

Пример 2.2.

При изучении взаимосвязи затрат на научные разработки x с продажами продукции y для различных отраслей промышленности были получены следующие данные:

1

2

3

4

5

6

7

8

9

10

11

x

11,63

14,66

21,87

26,41

32,41

35,11

40,3

70,76

80,55

95,29

101,31

y

92,9

178,3

258,4

494,7

1083

1620

421,7

509,2

6620,1

3918,6

1595,3

Определяя зависимость переменных в виде модели парной регрессии , получим параметры данного уравнения и оценим их значимость с помощью критерия Стьюдента (при уровне 0,05 критическое значение tтабл=2,26):

;

Отметим, что коэффициент является незначимым, а коэффициент - значимым. Рассчитав регрессионные остатки, проверим их на гомоскедастичность с помощью критерия Глейзера. Предположим, что зависимость остатков может быть представлена, например, следующим образом: . Рассчитывая значения коэффициентов уравнения и определяя их качество с помощью критерия Стьюдента, можно сделать вывод о значимости коэффициента ( ).

Таким образом, регрессионные остатки являются гетероскедастичными, а их дисперсии пропорциональны . Для преодоления гетероскедастичности разделим обе части регрессионного уравнения на x:

.

Вводя новые переменные , получим регрессионную модель, удовлетворяющую требованиям МНК:

.

Рассчитаем параметры данного уравнения и показатели качества:

; .

Сравнивая данные значения с полученными ранее, можно сделать вывод о том, что, применяя МНК к скорректированной регрессионной модели, удалось получить оценки ее параметров, близкие к ранее найденным, но обладающие лучшим статистическим качеством.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]