Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
econometrika / econometrika / Модуль 5.doc
Скачиваний:
44
Добавлен:
27.03.2016
Размер:
135.68 Кб
Скачать

5.2. Проверка значимости исключенных и добавленных переменных

Исключение некоторых переменных из рассмотрения позволяет устранить мультиколлинеарность. Распределение Фишера может быть использовано не только для проверки гипотезы об одновременном равенстве нулю всех коэффициентов линейной регрессии, но и гипотезы о равенстве нулю части этих коэффициентов. Это особенно важно при развитии линейной регрессионной модели, так как позволяет оценить обоснованность исключения отдельных переменных или их групп из числа объясняющих переменных, или же, наоборот, включения их в это число.

Пусть, например, вначале была оценена множественная линейная регрессия у =a0+a1х1+a2х2+ ... +amхmпопнаблюдениям ст объясняющими переменными, и коэффициент детерминации равенR12. Затем последниеkпеременных исключены из числа объясняю­щих, и по тем же данным оценено уравнениеу =b0+b1х1+b2х2+ ... +bmхm, для которого коэффициент детерминации равенR22(он обязательно уменьшился, поскольку каждая дополнительная переменная объясняет часть, пусть небольшую, вариации зависимой пе­ременной). Для того чтобы проверить гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при исключенных переменных, рассчитывается величина, имеющая распределение Фишера с (k,п-т-k-1)степенями свободы. По таблицам, при заданном уровне значимости, находится критическое значениеF-статистики, и если ее рассчитанное значение превосходит критическое, то нулевая гипотеза отвергается. В таком случае исключать сразу из числа объясняющих всеkпеременных некорректно.F-статистика оказывается относительно большой, если велика разность (R12-R22). В этом случае исключение данного набораk объясняющих переменных приводит к слишком большому сокращению доли объясненной дисперсии зависимой переменной, и поэтому недопустимо. Если, наоборот, эта доля сокращается незначительно, тоF-статистика невелика, нулевая гипотеза не отвергается, и указанныеkпеременных могут быть исключены из уравнения регрессии.

Аналогичные рассуждения могут быть проведены и по поводу обоснованности включения в уравнение регрессии одной или нескольких (k) новых объясняющих переменных. В этом случае рассчитываетсяF-статистика , имеющая распределениеF(k,п-т-k-1),и если она превышает критический уровень, то включение новых переменных объясняет существенную часть необъясненной ранее дисперсии зависимой переменнойу.Отметим лишь, что добавлять новые переменные целесообразно, как правило, по одной.

В вопросе о добавлении объясняющих переменных в уравнение регрессии полезным может оказаться рассмотрение R2с поправкой на число степеней свободы:

Обычный R2(без поправки) всегда растет при добавлении новой переменной; вR2-с поправкой растет величинат,уменьшающая его. Если увеличение доли объясненной дисперсии при добавлении новой переменной мало, тоR2с поправкой может уменьшиться. Если это так, то добавлять переменную нецелесообразно.

5.3. Линейные регрессионные модели с переменной структурой (фиктивные переменные)

До сих пор мы предполагали, что в общую линейную модель у = a0+a1х1 +a2х2 + ... +amхm+e по п наблюдениям с т объясняющими переменными входят лишь переменные, существенные для экономи­ческой теории. Некоторые из них в свою очередь могут быть функция­ми, возможно и не линейными, других переменных. Например, и т. д. Однако модель должна при этом оставаться линейной относительно параметров {a0, a1, a2, ... ,am} и удовлетворять всем свойствам, необходимым для применения обыкновенного метода наименьших квадратов. Тем не менее, мы можем существенно расши­рить сферу применения линейных моделей, допустив включение фиктивных переменных. Это специальным образом сконструи­рованные переменные для отражения изменений в таких факторах, как эффект сдвига во времени или в пространстве, воздействие качественных переменных или большого числа количественных переменных.

  • Эффект сдвига во времени. Мы иногда предполагаем неизменными соотношения, объясняющие поведение объекта, перенося их из одного периода времени в другой. Например, можно ожидать, что потребительская функция во время войны окажется сдвинутой вниз по сравнению с ее значениями в мирное время; уравнение, определяющее заработную плату, может испытать импульсное воздействие в результате смены политической власти; можно ожидать, что многие уравнения будут подвержены сезонным возмущениям, если мы имеем дело с квартальными или недельными данными.

  • Пространственные сдвиги мы наблюдаем, анализируя одни и те же экономические зависимости для регионов страны, различающихся экономической структурой или перспективами на будущее.

  • Качественные переменные, такие, как пол, семейный статус, принадлежность к социальным или профессиональным группам, нередко также играют важную роль в определении экономического поведения и поэтому они должны быть введены в процесс оценивания.

  • Наконец, мы иногда можем располагать существенными переменными, такими, как доход или возраст, однако для достижения поставленной цели необходимо использовать эти данные в сильно агрегированном виде.

Во всех этих случаях целесообразно ввести подходящим образом выбранные фиктивные переменные.

Соседние файлы в папке econometrika