- •2015Г. Содержание
- •Глава 1. Выбор экономических факторов, построение модели.
- •Глава 2. Проверка качества модели.
- •2.6.Построение расширенной матрицы выборочных коэффициентов корреляции. Вычислениечастных коэффициентов корреляциимежду факторами
- •2.7.Пошагоый отбор наиболее существенных переменных в модели множественной линейной регрессии с использованием скорректированных коэффициентов детерминациии частныхF- статистики.
- •Глава 3. Анализ результатов эконометрического исследования и построение прогноза.
- •3.1.Вычисление стандартизованных коэффициентов регрессии и частных коэффициентов эластичности.
Глава 2. Проверка качества модели.
2.1. Вычисление множественного коэффициента детерминации и скорректированного (исправленного) коэффициента детерминации, сделать вывод об адекватности модели.
Множественный коэф. Детерминации и скорректированный коэф. Детерминации имеют значения, близкие к единице, что говорит об адекватной модели. (см. приложение 1 п.2.1)
2.2. Вычисление остатков и проверка гипотезы о нормальном законе распределения остатков. (см. приложение 1. П.2.2)
2.3. Вычисление средней ошибки аппроксимации . (в п.1.4)
=0,26%
Ошибка аппроксимации имеет очень низкое значение, что говорит о хорошо подобранной модели уравнения. (см. приложение 1, п.2.3)
2.4. Проверка статистической значимости коэффициентов множественной регрессии и уравнения регрессии в целом пройдена. Все коэф. Регрессии статистически значимы (см. приложение 1, п.2.4)
2.5. Построение доверительных интервалов для статистически значимых коэффициентов регрессии.
Доверительные интервалы для параметров a и b с заданным уровнем доверия, в качестве которого на практике обычно выбирают вероятность 0,95 (соответствующую уровню значимости 0.05 или 5%).
–стандартная ошибка коэффициента регрессии ;
–критическое значение для заданного уровня значимости и заданного числа степеней свободы n 2.
;
–стандартная ошибка коэффициента регрессии .
2.6.Построение расширенной матрицы выборочных коэффициентов корреляции. Вычислениечастных коэффициентов корреляциимежду факторами
Вычисление выборочных коэффициентом частной корреляции между зависимой переменной y и объясняющей переменной xj – .
(Выполнено в п.1.3)
Вывод. На основании анализа пунктов 4 – 10 можно сделать выводы о том, что модель адекватна, но присутствовала мультиколлинеарность, вследствие чего пришлось выполнить отбор факторов исключением одного из них (с сильной межфакторной корреляционной зависимостью).
2.7.Пошагоый отбор наиболее существенных переменных в модели множественной линейной регрессии с использованием скорректированных коэффициентов детерминациии частныхF- статистики.
Т.к. в исследовании осталось всего 2 факторных переменных, и в первую очередь была включена та, которая имеет наибольшую корреляцию с результирующим признаком, проводить отбор нецелесообразно, потому что. в любом случае, второй фактор, который в наименьшей степени влияет на результирующий, будет включён после включения первого. (см. приложение 1, п.2.7)
2.8. Проверка гипотезы о гомоскедастичности наблюдений по методу Голдфелда-Квандта и теста Спирмена.
Теоретические предпосылки.
Постоянство дисперсии случайных ошибок регрессионной модели независимо от наблюдения называется гомоскедастичностью.
Гетероскедастичность свойство дисперсии случайных ошибок регрессионной модели противоположное гомоскедастичности. Гетероскедастичность означает неоднородность наблюдений, выражающуюся в неодинаковой (непостоянной) дисперсии случайной ошибки регрессионной (эконометрической) модели.
Гетероскедастичность существенно снижает качество оценок неизвестных параметров.
Теста Голдфелда-Квандта предполагает:
- возмущения являются нормально распределенными случайными величинами;
- отсутствует автокорреляция возмущений;
- средние квадратические отклонения возмущений прямо пропорциональны значениям объясняющей переменной , что часто встречается на практике и означает постоянствоотносительного разброса возмущений (а не абсолютного, как предполагается в классической модели).
Тест состоит в следующем.
1. Все наблюдения упорядочиваются в порядке возрастания значения объясняющей переменной.
2. Полученная упорядоченная выборка разбивается на три части:
первая и последняя части содержат по l наблюдений, средняя часть состоит из m = n - 2l
наблюдений.
Далее рассматриваются только две части: первая часть l наблюдений (с небольшими значениями объясняющей переменной) и третья часть l последних наблюдений (с большими значениями объясняющей переменной), а m центральных наблюдений исключаются из рассмотрения.
3. Оцениваются отдельные регрессии для первой ( l первых наблюдений) и второй ( l последних наблюдений) частей. В этом случае гипотеза гомоскедастичности равносильна тому, что значения остатков для первых и последних наблюдений представляют выборку значений нормально распределенных случайных величин, имеющих одинаковые дисперсии. Но, если верно предположение о пропорциональности дисперсий значениям объясняющей переменной (т.е. предположение о гетероскедастичности), то дисперсия (сумма квадратов остатков) для первой части будет существенно меньше дисперсии (суммы квадратов остатков) для второй части наблюдений.
4. Для сравнения дисперсий строится статистика
5. Если гипотеза гомоскедастичности верна, то F – статистика имеет распределение Фишера со степенями свободы . Для заданного уровня значимости по таблицам распределения Фишера-Снедекора определяется значение как критическая точка, соответствующая степеням свободы (k – число факторов).
Тогда:
1. Если , то гипотеза об отсутствии гетероскедастичности отклоняется;
2. Если , то гипотеза об отсутствии гетероскедастичности не отклоняется.
Для парной регрессии обычно предлагаются следующие размеры подвыборок:
для n = 30 значение l = 11;
для n = 60 значение l = 22 .
Тест Голдфелда-Квандта может использоваться и в случае предположения об обратной пропорциональности между дисперсией возмущений и значениями объясняющей переменной, при этом статистика F имеет вид
В случае множественной регрессии данный тест может проводиться для каждой объясняющей переменной по отдельности.
Проверка гипотезы о гомоскедастичности с помощью теста Спирмена.
Идея теста состоит в том, что в случае гетероскедастичности абсолютные величины остатков (которые являются оценками возмущений) будут коррелировать со значениями объясняющей переменной .
Для проверки этого факта значения и , упорядочиваются по величине (ранжируются) и для каждого значения определяется ранг — его номер в ранжированном ряде. Далее находится коэффициент ранговой корреляции .
Вычислите коэффициент ранговой корреляции Спирмена по формуле
,
где
Проверьте статистическую значимость коэффициента ранговой корреляции с помощью выборочной статистики
Статистика распределена по закону Стьюдента сn – 2 степенями свободы.
Для выбранного уровня значимости = 0,05 по таблице распределения
Стьюдента с n – 2 степенями свободы определяется , как критическая точка, соответствующая двусторонней критической области.
Тогда:
1) Если , то гипотезу о равенстве нулю коэффициента
ранговой корреляции отклоняется, коэффициент корреляции статистически значим и, следовательно, отклоняется гипотеза об отсутствии гетероскедастичности, наблюдения гетероскедастичны;
2) Если , то гипотеза об отсутствии гетероскедастичности не отклоняется, коэффициент корреляции статистически незначимо отличается от нуля, наблюдения гомоскедастичны.
Если в модели несколько объясняющих переменных, то проверка гипотезы может осуществляться для каждой из них по отдельности.
(см. приложение 1, п.2.8)