- •Модуль 5. Развитие регрессионной модели
- •5.1. Мультиколлинеарность
- •5.2. Проверка значимости исключенных и добавленных переменных
- •5.3. Линейные регрессионные модели с переменной структурой (фиктивные переменные)
- •Пример 5.1
- •Конец примера
- •5.4. Проверка гипотезы о совпадении уравнений регрессии для отдельных групп наблюдений (критерий Чоу)
- •Лабораторная работа № 5.4. Фиктивные переменные
- •Выполнение
- •5.5. Нелинейная регрессия
- •Пример 5.2.
- •5.5.1. Подбор линеаризующего преобразования (подход Бокса – Кокса)
- •5. Вопросы
Пример 5.1
Рассмотрим ситуацию детально на очень простом примере потребительской функции для военного и для мирного времени. Предположим, что в военное время уровень потребления С и уровень доходов Y связаны следующим соотношением:
С=0+1Y+ (5.1)
а в мирное время -
С=0/+1Y+ (5.2)
Где 0/>0. Заметим, что в модели предполагается общая предельная склонность к потреблению для обоих периодов1. Если же параметр1не будет общим, то нам ничего не удастся сделать с помощью фиктивных переменных, а останется лишь одно — подогнать с помощью уравнения (5.1) данные для военных лет, а с помощью уравнения (5.2) — данные для мирного времени. Однако предположив параметр1общим, мы делаем тем самым осмысленным использованиевсехимеющихся данных для получения эффективной (насколько это возможно) оценки этого параметра. Мы можем объединить уравнения (1) и (2) в одно соотношение -
С=0X+0/X/+1Y+ (5.3)
где XиX/— фиктивные переменные, такие, что
Очевидно, что уравнение (5.3) в мирный год преобразуется к виду (5.2) (X=0), а в военный - к виду (5.1) (X/=0). Так что первый коэффициент уравнения (5.3) служит оценкой свободного члена только для военного времени, а второй — только для мирного, третий коэффициент есть общая для всего периода предельная склонность к потреблению.
В матрице данных (5.4) мы предположили, что выбранный период включает в себя два мирных года, затем три года войны, и, наконец, снова годы мирного времени.
(5.4)
Ловушка, возникающая при введении фиктивных переменных. Если объясняющие переменные такие, как и в правой части уравнения (5.3), то применение для этого уравнения обычной процедуры вычисления регрессии, которая автоматически определяет величину свободного члена, приведет к нарушению процесса оценивания. В самом деле, включение указанных фиктивных переменных эквивалентно использованию матрицы данных с четырьмя столбцами (см. п.4.1.1), из которых первый целиком состоит из единиц, а три оставшихся определены в (5.4). Тогда существует линейная зависимость между столбцами, поскольку первый равен сумме второго и третьего. Следовательно, матрица (ХTХ) вырождена.
Однако когда прочие объясняющие переменные комбинируются с фиктивными, то в результате ошибок округления в ЭВМ определитель матрицы (ХTХ) может оказаться не равным нулю, так что вычисления будут выполнены и будут найдены оценки коэффициентов,R2и прочих статистических показателей. Эти оценки будут противоречить априорным соображениям и неосторожный исследователь придет к выводам, не имеющим ничего общего с реальностью.
Если вычислительная процедура предусматривает получение свободного члена, то единственный способ воспользоваться ею для наших целей — это переписать уравнение (5.3) в виде
С=+/X/+1Y+ (5.5)
где
Очевидно, что уравнение (5.5) в мирный год преобразуется к виду (5.2) С=+/+1Y+ , а в военный - к видуС=+1Y+
Сопоставляя результат с предыдущим, мы видим, что
=0 = свободному члену для военного времени;
+/=0/ = свободному члену для мирного времени.
/=0/ -0 = разности между свободными членами, соответствующими мирному и военному времени.