Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Voprosy_po_ekonometrike_2012_1.doc
Скачиваний:
28
Добавлен:
21.09.2019
Размер:
2.99 Mб
Скачать

Неприменимость статистических тестов

Другим серьезным следствием невключения переменной, которая на самом деле должна присутствовать в регрессии, является то, что формулы для стан­дартных ошибок коэффициентов и тестовые статистики, вообще говоря, ста­новятся неприменимыми. Это, разумеется, означает, что, основываясь на по­лученных результатах оценки регрессии, в принципе нельзя заниматься провер­кой каких-либо гипотез.

Влияние включения в модель переменной, которая не должна быть включена

Допустим, что истинная модель представляется в виде:

а вы считаете, что ею является

и рассчитываете оценку величины b1, используя формулу

вместо выра­жения Cov (x1, y)/D1).

В целом проблемы смещения здесь нет, даже если b1, будет рассчитана непра­вильно. Величина M(b1) остается равной β1, но в общем оценка будет неэффек­тивной. Она будет более неустойчивой, в смысле наличия большей дисперсии относительноβ1, чем при правильном вычислении.

Это можно легко объяснить интуитивно. Истинная модель может быть записана в виде:

Таким образом, если вы строите регрессионную зависимость у от х1, и хг, то b1 будет являться несмещенной оценкой величины β1, а β2 будет несмещенной оценкой нуля (при выполнении условий Гаусса—Маркова). Практически вы обнаруживаете для себя, что β2, равно нулю. Если бы вы заранее поняли, что β2 равно нулю, то могли бы использовать эту информацию для исключения и применить парную регрессию, которая в данном случае является более эффективной.

Утрата эффективности в связи со включением х2 в случае, когда она не дол­жна была быть включена, зависит от корреляции между х1, и х2.

Сравните дис­персии величины β1 при построении парной и множественной регрессии.

Парная регрессия

Множественная регрессия

Дисперсия в общем окажется большей при множественной регрессии, и разница будет тем большей, чем ближе коэффициент корреляции к единице или -1. Единственным исключением в связи с проблемой утраты эффективности яв­ляется вариант, когда коэффициент корреляции точно равен нулю. В этом случае оценка b1 для множественной регрессии совпадает с оценкой для парной

регрессии. Доказательство этого опустим.

  1. Замещающие переменные. Фиктивные переменные.

Часто бывает, что вы не можете найти данных по переменной, которую хо­телось бы включить в уравнение регрессии. Некоторые переменные, относящи­еся к социально-экономическому положению или к качеству образования, имеют такое расплывчатое определение, что их в принципе даже невозможно изме­рить. Другие могут поддаваться измерению, но оно требует столько времени и энергии, что на практике их приходится отбрасывать. Иногда вы можете быть расстроены тем, что пользуетесь какими-то данными, собранными другим человеком, в которых (с вашей точки зрения) опущена важная переменная.

Независимо от причины обычно бывает полезно вместо отсутствующей пе­ременной использовать некоторый ее заменитель (proxy), а не пренебрегать ею совершенно. В качестве показателя общего социально-экономического положе­ния вы можете использовать его заменитель — показатель дохода, если данные о нем имеются. В качестве показателя качества образования можно использовать отношение числа преподавателей и сотрудников к числу студентов или расхо­ды на одного студента. Вместо переменной, опущенной в каком-либо обзоре, вы можете обратиться к другим, уже фактически собранным данным, если в них имеется подходящая замещающая переменная.

Имеются две причины для поиска такой переменной. Во-первых, если вы просто опустите важную переменную, то регрессия может пострадать от сме­щения оценок, описанного выше, и статистическая проверка будет не­полноценной. Во-вторых, результаты оценки регрессии с включением замеща­ющей переменной могут дать косвенную информацию о той переменной, ко­торая замещена данной переменной.

Иногда случается, что вы используете замещающую переменную, не осоз­навая этого. Вы полагаете, что у зависит от z, а в действительности эта величи­на зависит от х.

Если корреляция между величинами z и х незначительна, то результаты бу­дут плохими, и вы поймете, что тут что-то неладно. Но если корреляция тес­ная, то результаты окажутся удовлетворительными (коэффициент R2 будет бли­зок к желаемому уровню и т. п.), и вы можете даже не подозревать, что полу­ченное соотношение неверно.

Имеет ли это какое-то значение? Это, во-первых, зависит от того, с какой целью вы строите данную регрессию. Если целью оценивания регрессии явля­ется предсказание будущих значений величины у, то использование замещаю­щей переменной не будет иметь большого значения при условии, конечно, что корреляция тесная и не является в то же время статистической счастливой слу­чайностью. Однако если вы намерены использовать объясняющую переменную в качестве инструмента экономической политики для оказания влияния на по­ведение зависимой переменной, то последствия могут оказаться катастрофи­ческими. Если только не будет функциональной связи между замещающей пе­ременной и истинной объясняющей переменной, манипулирование замещаю­щей переменной не окажет никакого влияния на зависимую переменную. Если мотивом построения регрессии является чисто научное любопытство, то исход будет столь же неудовлетворительным.

Непреднамеренное использование замещающих переменных особенно рас­пространено при анализе временных рядов, в частности в макроэкономических моделях. Если истинная объясняющая переменная имеет временной тренд, то вы, вероятно, получите хорошую оценку формулы, если замените (преднаме­ренно или нет) ее на любую другую переменную с временным трендом. Даже если вы связываете приращения зависимой переменной с приращениями объяс­няющей переменной, вы, вероятно, получите аналогичные результаты незави­симо от того, используется ли правильная объясняющая переменная или же замещающая переменная, поскольку макроэкономические переменные обыч­но изменяются взаимосвязанно, в соответствии с экономическим циклом.

Фиктивная переменная – это атрибутивная или качественная, факторная переменная, которая представлена с помощью определенного цифрового кода.

При исследовании влияния качественных признаков в модель следует вводить фиктивные переменные, принимающие, как правило два значения: 1, если данный признак присутствует в наблюдении; 0 — при его отсутствии.

Если включаемый в рассмотрение качественный признак име­ет не два, а несколько значений, то используют несколько фиктив­ных переменных, число которых должно быть на единицу меньше числа значений признака. При назначении фиктивных переменных исследуемая совокупность по числу значений качественного при­знака разбивается на группы. Одну из групп выбирают как эталон­ную и определяют фиктивные переменные для остальных.

Если качественный признак имеет 2 значения, то это можно отразить, введя 1 фиктивную переменную. Например, строится модель, характеризующая показатели предприятий двух отраслей промышленности: электроэнергетики и газовой промышленности. Вводится фиктивная переменная, которой присваивается значе­ние 0, если данные относятся к предприятиям электроэнергети­ки, и значение 1, если данные относятся к предприятиям газовой промышленности.

Если качественный признак имеет 3 значения, то это можно отразить, введя 2 фиктивных переменных. Например, строится модель, характеризующая показатели предприятий 3 регионов. Вводится 1 фиктивная переменная, которой присваивается значе­ние 0, если данные относятся к предприятиям первого региона, и значение 1, если данные относятся к предприятиям двух других регионов. Второй фиктивной переменной присваивается значение О, если данные относятся ко второму региону, и 1, если данные относятся к первому и третьему регионам.

Введение в регрессию фиктивных переменных существенно улучшает качество оценивания.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]