- •«Исследование зависимости уровня инфляции потребительских цен от макроэкономических показателей»
- •1)Введение
- •Перечень условных обозначений и терминов
- •2)Исходные данные и их преобразования
- •3)Регрессионный анализ
- •4)Вариабельность факторов
- •5)Проверка данных на мультиколлинеарность
- •6) Последующее преобразование данных. Избавление от мультиколлинеарности
- •7) Выбор лучшей модели по j-тесту
- •8)Тест Чоу на однородность данных
- •9)Введение Dummy-наклона
5)Проверка данных на мультиколлинеарность
Проблема мультиколлинеарности-это нарушение одного из условий теоремы Гаусса-Маркова, а именно условия независимости объясняющих переменных. Чтобы выявить сильные парные линейные связи (т.е. больших парных коэффициентов корреляции, >0,7),необходимо вычислить матрицу парных коэффициентов корреляции между всеми переменными, используемыми в исследовании, и значимые парные коэффициенты корреляции. После ее построения можно увидеть, что имеется множество высоких корреляционных связей.
По исходным данным для проверки мультиколлинеарности строим матрицу корреляции факторов (тест Фаррара-Глобера для длинной модели). После проведения теста была получена статистика FG набл=168,09,затем показатель Fкрит=32,7.Делаем вывод, что FG набл >FG крит, значит H0 отвергается, факторы линейно зависимы, мультиколлинеарны.
По данным короткой модели также проводим тест Фаррара-Глобера. После проведения теста была получена статистика FG набл=144,5,затем показатель Fкрит=12,6.Делаем вывод, что FG набл >FG крит, значит H0 отвергается, факторы линейно зависимы, мультиколлинеарны. Результаты этого теста оказались хуже, чем предыдущего по длинной модели. Необходимо дальнейшее преобразование данных с целью уменьшения линейной зависимости между факторами.
6) Последующее преобразование данных. Избавление от мультиколлинеарности
Так как после построения первой регрессии «длинная_1»,обнаружились незначимые коэффициенты Х2,Х4,Х7,то первым шагом для решения проблемы с мультиколлинеарностью стало исключение этих факторов (ДАННЫЕ короткая_1) и построение регрессии «короткая_1»,которая дала нам следующие результаты:
1)оставшиеся коэффициенты X1,X3,X5,X6 значимы
2) R-квадрат =0,45,что ниже, чем в длинной (=0,47)
3)значимость модели в целом также снизилось
Итак, у нас выиграла короткая модель, по результатам теста на «длинную-короткую», и после проведения теста Фаррара-Глобера на короткую модель, выяснилось, что наблюдаемое значение статистики этого теста превышает критическое более чем в 11,5 раза, что гораздо больше чем по результатам в длинной (в 5 раз),естественно это намного хуже. Следовательно, мы должны будем уменьшить линейную связь между факторами Х5,Х6, экспортом и импортом. Для создания лучшей модели мы сделали следующие шаги:
-
Включаем в модель макроэкономический показательно «Чистый экспорт», то есть разница между экспортом и импортом(X5’=X5-X6)-лист «Данные чистый экспорт».
-
Далее включаем показательно Товарооборот, то есть сумму экспорта и импорта (X5’=X5+X6),лист «Данные товарооборот»
-
После каждого из них строим соответствующие регрессии и проводим тесты Фаррара-Глобера
-
После проведения теста, мы видим, что Fнабл=4,6<Fкрит=12,6,следовательно, значит H0 принимается, факторы линейно независимы, det R -определитель матрицы парных коэффициентов корреляции равен 1.
-
Результаты этого теста намного лучше, чем результаты предыдущих тестов (наблюдаемое значение превышается критическое чуть более чем в 0,4 раза)
-
А регрессия по товарообороту немного хуже Fнабл=8,5<Fкр=12,6, значит H0 принимается, факторы нелинейно зависимы, и наблюдаемое значение превышает критическое в 0,7 раз)