Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Модуль 2.docx
Скачиваний:
67
Добавлен:
13.02.2015
Размер:
92.96 Кб
Скачать

Тема 9. Отбор факторных признаков при построении множественной регрессии. Мультиколлинеарность1

Отбор факторов является важнейшей проблемой при построении множественных регрессионных моделей. Он проводится на основе качественного и количественного анализа социально-экономических явлений с использованием статистических и математических критериев.

Проводят три стадии отбора факторов в модель множественной регрессии:

  1. Предварительное определение перечня факторов, оказывающих влияние на переменную у.

  2. Сравнительная оценка и отсев факторов.

  3. Окончательный отбор факторов в процессе построения разных вариантов моделей и оценки значимости их параметров.

Для сравнительной оценки и отсева части факторов составляют матрицу парных коэффициентов корреляции, измеряющих тесноту линейной связи каждого фактора с результативным признаком и с каждым из остальных факторных признаков.

Матрица парных коэффициентов корреляции– симметричная матрица (rij=rji), на главной диагонали которой расположены характеристики силы связи признаков с самими собой все другие элементы являются парными коэффициентами корреляцииi-го иj-го признаков.Следующая таблица

где y– результативный признак;

x1,x2...,xk -факторные признаки;

rij – парный коэффициент корреляции между признакамиxi , xj .

Корреляционная матрица позволяет выявить факторы, которые находятся в тесной линейной корреляционной взаимосвязи, близкой к функциональной.

Понятие мультиколлинеарности

Если в модель включаются два или более тесно взаимосвязанных фактора, то наряду с уравнением регрессии появляется и другая линейная зависимость. Подобное явление, называемое мультиколлинеарностью, искажает величину коэффициентов регрессии, затрудняет их экономическую интерпретацию.

Мультиколлинеарность – это тесная зависимость между факторными признаками, включенными в модель.

Мультиколлинеарность:

  • искажает величины параметров модели, которые имеют тенденцию к завышению;

  • приводит к изменению смысла экономической интерпретации коэффициентов регрессии;

  • вызывает слабую обусловленность системы нормальных уравнений;

  • осложняет процесс определения наиболее существенных факторных признаков.

В решении проблемы мультиколлинеарности можно выделить несколько этапов:

  • Установление наличия мультиколлинеарности;

  • Определение причин возникновения мультиколлинеарности;

  • Разработка мер по устранению мультиколлинеарности.

Причины возникновения мультиколлинеарности:

  • Изучаемые факторные признаки характеризуют одну и ту же сторону явления или процесса (например, показатели объема — произведенной продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как оба характеризуют размер предприятия);

  • Использование в качестве факторных признаков, суммарное значение которых представляет собой постоянную величину (например, коэффициент годности и коэффициент износа основных фондов);

  • Факторные признаки, являющиеся элементами друг друга (например, затраты на производство продукции и себестоимость единицы продукции);

  • Факторные признаки, по экономическому смыслу дублирующие друг друга (например, прибыль и рентабельность продукции)

Существуют следующие способы определения наличия или отсутствия мультиколлинеарности:

  1. Анализ матрицы коэффициентов парной корреляции– факторыхiихj, могут быть признаны коллинеарными, если>0,8;

  2. Исследование матрицы Х -если определитель матрицыXXблизок к нулю, то это свидетельствует о наличии мультиколлинеарности.

Устранение мультиколлинеарности возможно посредством исключения из корреляционной модели одного или нескольких линейно связанных факторных признаков или преобразование исходных факторных признаков в новые, укрупненные факторы. Вопрос о том, какой из факторов следует отбросить, решается на основе качественного и логического анализа изучаемого явления.

Далее укажем методы устранения или уменьшения мультиколлинеарности.

  1. Сравнение значений линейных коэффициентов корреляции

При отборе факторов предпочтение отдается тому фактору, который более тесно, чем другие факторы, связан с результативным признаком, причем желательно, чтобы связь данного факторного признака с убыла выше, чем его связь с другим факторным признаком, т.е.и.

  1. Метод включения факторов

Метод заключается в том, что в модель включаются факторы по одному в определенной последовательности. На первом шаге в модель вводится тот фактор, который имеет наибольший коэффициент корреляции с зависимой переменной.

На втором и последующих шагах в модель включается фактор, который имеет наибольший коэффициент корреляции с остатками модели.

После включения каждого фактора в модель рассчитывают ее характеристики, и модель проверяют на достоверность.

Построение модели заканчивается, если модель перестает удовлетворять определенным условиям (например, k<n/3, S,k-l - S,k >l, где

n– число наблюдений;

k – число факторных признаков, включаемых в модель;

l– некоторое заданное малое число;

S,k – среднеквадратическая ошибка;

S,k-l – среднеквадратическая ошибка модели, полученная на предыдущем шаге и включающаяk-l переменных.

  1. Метод исключения факторов

Метод состоит в том, что в модель включаются все факторы. Затем после построения уравнения регрессии из модели исключают фактор, коэффициент при котором незначим и имеет наименьшее значение t-критерия. После этого получают новое уравнение регрессии и снова проводят оценку значимости всех оставшихся коэффициентов регрессии.

Процесс исключения факторов продолжается до тех пор, пока модель не станет удовлетворять определенным условиям и все коэффициенты регрессии не будут значимы.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]