Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Шпоры с 11 по 20.doc
Скачиваний:
16
Добавлен:
21.09.2019
Размер:
426.5 Кб
Скачать

17. Мнк для множественной регрессии. Мультиколлинеарность ее последствия.

Наибольшие трудности в использовании аппарата множ. регрессии возникают при наличии мультиколлинеарности факторов, когда более чем 2 фактора связаны между собой лин. зависимостью, т.е. имеет место совокупное воздействие факторов друг на др. Наличие мультикол-сти факторов может означать, что некот. факторы будут всегда действовать в унисон. В результате вариация в исходных данных перестает быть полностью независимой, и нельзя оценить воздействие каждого фактора в отдельности. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью МНК.

Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий:

  • затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, и пар-ры лин. регрессии теряют экономический смысл;

  • оценки пар-тров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений, что делает модель непригодной для анализа и прогнозирования.

Для оценки мультикол-сти факторов может использоваться опр-ль матрицы парных коэф-тов корреляции между факторами.

Если бы факторы не коррелировали между собой, то матрица парных коэф-тов корреляции между факторами была бы единичной матрицей, поскольку все не диагональные элементы rxixj (xi≠ xj) были бы =0. Так, для включающего три объясняющих переменных уравнения у=а+b1х1+b2х2+b3х3+ε, матрица коэф-тов корреляции между факторами имела бы определитель=1.

Если же, наоборот, между факторами существует полная линейная зависи-мость и все коэф-ты корреляции =1, то определитель такой матрицы=0.

Чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии и наоборот.

Оценка значимости мультикол-сти факторов может быть проведена методом испытания гипотезы о независимости переменных H0:Det|R|=1. Док-но, что величина

имеет приближенное распределение χ2 с n(n-1)/2 степенями свободы. Если фактическое значение χ2 превосходит табличное (критическое), то гипотеза Н0 отклоняется.

МНК

Параметры уравнения множественной регрессии оцениваются, как и для парной регрессии с помощью МНК. Так для уравнения множественной регрессии строится система уравнений

,

которая решается относительно неизвестных параметров , любым известным способом.

Возможен и иной подход к определению параметров множественной регрессии. Строится регрессия в стандартизированном масштабе.

,

где — стандартизованные переменные , , для которых среднее значение равно нулю, а дисперсия равна единице.

Применяя МНК к уравнению в стандартизированном масштабе получим

.

Решая ее найдем параметры — стандартизированные коэффициенты регрессии ( -коэффициенты). Стандартизированные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результат, если соответствующий фактор изменится на 1 сигму при низменном уровне других факторов. Поскольку все переменные центрированные, нормированные и безразмерные, стандартизованные коэффициенты регрессии сравнимы между собой. Сравнивая их друг с другом, можно ранжировать факторы по силе их воздействия на результат. В этом основное достоинство стандартизированных коэффициентов регрессии в отличие от коэффициентов «чистой» регрессии.

18. Множественная регрессия в стандартизированном масштабе Возможен и иной подход к определению параметров множественной регрессии. Строится регрессия в стандартизированном масштабе.

,

где — стандартизованные переменные , , для которых среднее значение равно нулю, а дисперсия равна единице.

Применяя МНК к уравнению в стандартизированном масштабе получим

.

Решая ее найдем параметры — стандартизированные коэффициенты регрессии ( -коэффициенты). Стандартизированные коэффициенты регрессии показывают, на сколько сигм изменится в среднем результат, если соответствующий фактор изменится на 1 сигму при низменном уровне других факторов. Поскольку все переменные центрированные, нормированные и безразмерные, стандартизованные коэффициенты регрессии сравнимы между собой. Сравнивая их друг с другом, можно ранжировать факторы по силе их воздействия на результат. В этом основное достоинство стандартизированных коэффициентов регрессии в отличие от коэффициентов «чистой» регрессии.

В парной регрессии стандартизированный коэффициент регрессии это линейный коэффициент корреляции . Откуда можно получить формулу связи чистой регрессии и стандартизированными коэффициентами регрессии  .

.

Это позволяет уравнение регрессии в стандартизированном масштабе привести к уравнению регрессии в натуральном масштабе. Параметр определяется как

Рассмотренный смысл стандартизированных коэффициентов регрессии позволяет использовать их при отсеве факторов. Из модели исключаются факторы с наименьшим значением .

При нелинейной зависимости признаков, приводимой к линейному виду, параметры множественной регрессии также определяются МНК, но для преобразованных данных.