Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Ekonometr 1-25.doc
Скачиваний:
38
Добавлен:
21.09.2019
Размер:
1.46 Mб
Скачать

22. Замещающие переменные. Фиктивные переменные.

Часто бывает, что вы не можете найти данных по переменной, которую хо­телось бы включить в уравнение регрессии (например, относящи­еся к социально-экономическому положению или к качеству образования). Независимо от причины обычно бывает полезно вместо отсутствующей пе­ременной использовать некоторый ее заменитель (proxy), а не пренебрегать ею совершенно. В качестве показателя общего социально-экономического положе­ния вы можете использовать его заменитель — показатель дохода, если данные о нем имеются. В качестве показателя качества образования можно использовать отношение числа преподавателей и сотрудников к числу студентов или расхо­ды на одного студента. Имеются две причины для поиска такой переменной. Во-первых, если вы просто опустите важную переменную, то регрессия может пострадать от сме­щения оценок, описанного выше, и статистическая проверка будет не­полноценной. Во-вторых, результаты оценки регрессии с включением замеща­ющей переменной могут дать косвенную информацию о той переменной, ко­торая замещена данной переменной. Всё зависит от того, с какой целью вы строите данную регрессию. Если целью оценивания регрессии явля­ется предсказание будущих значений величины у, то использование замещаю­щей переменной не будет иметь большого значения при условии, что корреляция тесная и не является в то же время статистической счастливой слу­чайностью. если вы намерены использовать объясняющую переменную в качестве инструмента экономической политики для оказания влияния на по­ведение зависимой переменной, то последствия могут оказаться катастрофи­ческими. Непреднамеренное использование замещающих переменных особенно рас­пространено при анализе временных рядов, в частности в макроэкономических моделях.

Фиктивная переменная – это атрибутивная или качественная, факторная переменная, которая представлена с помощью определенного цифрового кода. При исследовании влияния качественных признаков в модель следует вводить фиктивные переменные, принимающие, как правило два значения: 1, если данный признак присутствует в наблюдении; 0 — при его отсутствии.

Если включаемый в рассмотрение качественный признак име­ет не два, а несколько значений, то используют несколько фиктив­ных переменных, число которых должно быть на единицу меньше числа значений признака. При назначении фиктивных переменных исследуемая совокупность по числу значений качественного при­знака разбивается на группы. Одну из групп выбирают как эталон­ную и определяют фиктивные переменные для остальных.

Если качественный признак имеет 2 значения, то это можно отразить, введя 1 фиктивную переменную. Если качественный признак имеет 3 значения, то это можно отразить, введя 2 фиктивных переменных. Введение в регрессию фиктивных переменных существенно улучшает качество оценивания.

  1. Мультиколлинеарность. Влияние мультиколлинеарности на оценки параметров уравнения регрессии.

По величине парных коэффициентов корреляции обнаружи­вается лишь явная коллинеарность факторов. Наибольшие труд­ности в использовании аппарата множественной регрессии воз­никают при наличии мультиколлинеарноспш факторов, когда более чем два фактора связаны между собой линейной зависимос­тью, т. е. имеет место совокупное воздействие факторов друг на друга. Наличие мультиколлинеарности факторов может озна­чать, что некоторые факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полно­стью независимой, и нельзя оценить воздействие каждого факто­ра в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов (МНК).

Включение в модель мультиколлинеарных факторов нежела­тельно в силу следующих последствий:

  • затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированы; параметры линейной регрессии теряют экономический смысл;

  • оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель неприигодной для анализа и прогнозирования.

Причинные мультиколлинеарности:

  1. Ошибочное включение в уравнение двух и более линейно независимых переменных

  2. Две или более объясняющие переменные, в нормальной ситуации слабо коррелированные, становятся в конкретных условиях выборки сильно коррелированными;

  3. В модель включается переменная, сильно коррелирующая с зависимой переменной (такая независимая переменная называется доминантой).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]