Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Бардасов - Эконометрика.pdf
Скачиваний:
358
Добавлен:
06.03.2016
Размер:
2.47 Mб
Скачать

Выбор правильной формы модели регрессии является в данной ситуации достаточно серьезной проблемой, так как вполне вероятны ошибки спецификации. Наиболее рациональной практической стратегией выбора модели является следующая схема.

Вначале рассматривается модель (7.4). Определяется статистическая значимость коэффициентов. Если дифференциальные угловые коэффициенты оказываются статистически незначимыми, то переходят к модели (7.3). Если в этой модели дифференциальные свободные члены оказываются статистически незначимыми, то делают вывод, что квартальные (сезонные) изменения несущественны для рассматриваемой зависимости.

§ 3. Сравнение двух регрессий

Выше предполагалось, что изменение значения качественного фактора влияет лишь на изменение свободного члена. Но это, безусловно, не всегда так. Изменение качественного фактора может привести к изменению как свободного члена уравнения, так и наклона прямой регрессии.

Обычно это характерно для временных рядов экономических данных при изменении институциональных условий, введении новых правовых или налоговых ограничений. Например, можно предположить, что до некоторого года в стране обменный курс валют был фиксированным, а затем плавающим, или налог на ввозимые автомобили был одним, а затем существенно изменился. В этом случае зависимость может быть выражена так:

 

Y = β0 1X 1D2DX ,

(7.5)

 

0, до изменения условий

 

гдеD =

 

 

1, после изменения условий.

 

 

 

 

В этой ситуации ожидаемое значение зависимой переменной определяется следующим образом:

 

 

M (Y

 

D =0)= β0 1X .

(7.6)

 

 

M (Y

 

D =1)=(β0 1)+(β12)X .

(7.7)

 

 

139

Фиктивная переменная D в уравнении (7.5) используется как в

аддитивном виде ( γ1D ), так и в мультипликативном ( γ2DX ), что

позволяет фактически разбивать рассматриваемую зависимость на две части, связанные с периодами изменения некоторого рассматриваемого в модели качественного фактора. Уравнение регрессии (7.5) достаточно хорошо моделирует ситуацию, изображенную на рис. 7.1-7.2.

Рис. 7.1. Модель с учетом изменений

На рис. 7.1 в модели учитываются изменения, произошедшие с некоторого момента времени в характере расположения точек наблюдений.

Имеет ли смысл строить сложную регрессию с фиктивными переменными (рис. 7.1) или ограничиться «обычной регрессией» (рис. 7.2)? На этот вопрос можно ответить с помощью теста Чоу. Пусть выборка имеет объем n. Через S0 обозначим сумму квадра-

n

тов отклонений ei2 значений yi от общего уравнения регрессии

i=1

(рис. 7.2).

140

Рис. 7.2. Модель без учета изменений

Пусть есть основание предполагать, что целесообразно общую выборку разбить на две подвыборки объемами n1 и n2 соответст-

венно (n =n1+n2) и построить для каждой из выборок уравнение

регрессии (рис. 7.1). Через S1 и S2 обозначим суммы квадратов отклонений значений yi, каждой из подвыборок от соответствующих уравнений регрессии. Очевидно, равенство S 0 =S1+S 2 возможно

лишь при совпадении коэффициентов регрессии для всех трех уравнений (7.5-7.7). Разность S 0 (S1+S 2) может быть интерпретирована как улучшение качества модели при разбиении интервала наблюдений на два подынтервала. Дробь S 0 (S1+S 2) (m+1)

определяет оценку уменьшения дисперсии регрессии за счет построения двух уравнений вместо одного. При этом число степеней

свободы сократится на (m+1), так как вместо (m+1) параметра объединенного уравнения теперь необходимо оценивать (2m+2) параметра двух регрессий. Дробь (S1+S 2)(n2m2)

необъясненная дисперсия зависимой переменной при использовании двух регрессий. Общую выборку целесообразно разбить на две подвыборки только в случае, если уменьшение дисперсии будет значимо больше оставшейся необъясненной дисперсии. Данный анализ осуществляется по стандартной процедуре сравнения дисперсий на основе F-статистики, которая в этом случае имеет вид:

141

F =

S 0 S1S 2

×

n2m2

.

(7.8)

S1S 2

 

 

 

m+1

 

Если уменьшение дисперсии статистически не отличается от необъясненной дисперсии, то построенная F-статистика имеет распределение Фишера с числами степеней свободы ν1 =m+1 и

ν2 =n2m2 . Здесь m-число количественных объясняющих пе-

ременных в уравнениях регрессии (m — одинаково для всех трех уравнений регрессии).

Тогда, если Fнабл, рассчитанное по формуле (7.8), окажется при выбранном уровне значимости α меньше соответствующей критической точки распределения Фишера F крит=F α; m+1; n2m2 , то

считается, что различие между S0 и S1+S 2 статистически незна-

чимо и нет смысла разбивать уравнение регрессии на части. В противном случае разбиение на подынтервалы целесообразно с точки зрения улучшения качества модели. Это фактически означает необходимость введения в уравнение регрессии соответствующей фиктивной переменной.

Тест Чоу вполне достаточен, если требуется установить, что зависимости в подвыборках различаются.

Резюме

Фиктивные (бинарные) переменные принимают значения 0 или 1. Их «фиктивность» состоит только в том, что они количественным образом описывают качественный признак. Количество бинарных переменных на одну единицу меньше числа альтернатив качественного признака (правило следует применять для каждого признака отдельно).

Если качественный признак входит в модель аддитивно, то это приводит к параллельному сдвигу графика вдоль оси зависимой переменной. Если качественный признак входит в модель мультипликативно, то это приводит к изменению угла наклона прямой линии.

Вопросы для самопроверки

1. Какие значения могут принимать объясняющие фиктивные переменные?

142

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]