5.2. Проверка значимости исключенных и добавленных переменных

Исключение некоторых переменных из рассмотрения позволяет устранить мультиколлинеарность. Распределение Фишера может быть использовано не только для проверки гипотезы об одновременном равенстве нулю всех коэффициентов линейной регрессии, но и гипотезы о равенстве нулю части этих коэффициентов. Это особенно важно при развитии линейной регрессионной модели, так как позволяет оценить обоснованность исключения отдельных переменных или их групп из числа объясняющих переменных, или же, наоборот, включения их в это число.

Пусть, например, вначале была оценена множественная линейная регрессия у =a₀+a₁х₁+a₂х₂+ ... +a_mх_mпопнаблюдениям ст объясняющими переменными, и коэффициент детерминации равенR₁². Затем последниеkпеременных исключены из числа объясняющих, и по тем же данным оценено уравнениеу =b₀+b₁х₁+b₂х₂+ ... +b_mх_m, для которого коэффициент детерминации равенR₂²(он обязательно уменьшился, поскольку каждая дополнительная переменная объясняет часть, пусть небольшую, вариации зависимой переменной). Для того чтобы проверить гипотезу об одновременном равенстве нулю всех коэффициентов регрессии при исключенных переменных, рассчитывается величина, имеющая распределение Фишера с (k,п-т-k-1)степенями свободы. По таблицам, при заданном уровне значимости, находится критическое значениеF-статистики, и если ее рассчитанное значение превосходит критическое, то нулевая гипотеза отвергается. В таком случае исключать сразу из числа объясняющих всеkпеременных некорректно.F-статистика оказывается относительно большой, если велика разность (R₁²-R₂²). В этом случае исключение данного набораk объясняющих переменных приводит к слишком большому сокращению доли объясненной дисперсии зависимой переменной, и поэтому недопустимо. Если, наоборот, эта доля сокращается незначительно, тоF-статистика невелика, нулевая гипотеза не отвергается, и указанныеkпеременных могут быть исключены из уравнения регрессии.

Аналогичные рассуждения могут быть проведены и по поводу обоснованности включения в уравнение регрессии одной или нескольких (k) новых объясняющих переменных. В этом случае рассчитываетсяF-статистика , имеющая распределениеF(k,п-т-k-1),и если она превышает критический уровень, то включение новых переменных объясняет существенную часть необъясненной ранее дисперсии зависимой переменнойу.Отметим лишь, что добавлять новые переменные целесообразно, как правило, по одной.

В вопросе о добавлении объясняющих переменных в уравнение регрессии полезным может оказаться рассмотрение R²с поправкой на число степеней свободы:

Обычный R²(без поправки) всегда растет при добавлении новой переменной; вR²-с поправкой растет величинат,уменьшающая его. Если увеличение доли объясненной дисперсии при добавлении новой переменной мало, тоR²с поправкой может уменьшиться. Если это так, то добавлять переменную нецелесообразно.

5.3. Линейные регрессионные модели с переменной структурой (фиктивные переменные)

До сих пор мы предполагали, что в общую линейную модель у = a₀+a₁х₁ +a₂х₂ + ... +a_mх_m+e по п наблюдениям с т объясняющими переменными входят лишь переменные, существенные для экономической теории. Некоторые из них в свою очередь могут быть функциями, возможно и не линейными, других переменных. Например, и т. д. Однако модель должна при этом оставаться линейной относительно параметров {a₀, a₁, a₂, ... ,a_m} и удовлетворять всем свойствам, необходимым для применения обыкновенного метода наименьших квадратов. Тем не менее, мы можем существенно расширить сферу применения линейных моделей, допустив включение фиктивных переменных. Это специальным образом сконструированные переменные для отражения изменений в таких факторах, как эффект сдвига во времени или в пространстве, воздействие качественных переменных или большого числа количественных переменных.

Эффект сдвига во времени. Мы иногда предполагаем неизменными соотношения, объясняющие поведение объекта, перенося их из одного периода времени в другой. Например, можно ожидать, что потребительская функция во время войны окажется сдвинутой вниз по сравнению с ее значениями в мирное время; уравнение, определяющее заработную плату, может испытать импульсное воздействие в результате смены политической власти; можно ожидать, что многие уравнения будут подвержены сезонным возмущениям, если мы имеем дело с квартальными или недельными данными.
Пространственные сдвиги мы наблюдаем, анализируя одни и те же экономические зависимости для регионов страны, различающихся экономической структурой или перспективами на будущее.
Качественные переменные, такие, как пол, семейный статус, принадлежность к социальным или профессиональным группам, нередко также играют важную роль в определении экономического поведения и поэтому они должны быть введены в процесс оценивания.
Наконец, мы иногда можем располагать существенными переменными, такими, как доход или возраст, однако для достижения поставленной цели необходимо использовать эти данные в сильно агрегированном виде.

Во всех этих случаях целесообразно ввести подходящим образом выбранные фиктивные переменные.

<<< < Предыдущая 12 / 62 3 4 5 6 > Следующая >>>

Соседние файлы в папке econometrika

#
27.03.201645.57 Кб28Модуль 1.doc
#
27.03.2016306.18 Кб51Модуль 3.doc
#
27.03.2016218.11 Кб48Модуль 4.doc
#
27.03.2016135.68 Кб44Модуль 5.doc
#
27.03.2016148.48 Кб30Модуль 9.doc
#
27.03.2016223.23 Кб37Модуль2_1.doc
#
27.03.2016311.3 Кб90Модуль2_2.doc
#
27.03.2016153.6 Кб34Модуль6.doc
#
27.03.2016100.86 Кб31Модуль7 .doc