Анализ качества модели
Проверим качество модели в целом. Принимается гипотеза Н0: о том, что факторы совместно не влияют на изменениеy. Альтернативная гипотеза Н1 подразумевает обратное. Проверка осуществляется на основе критерия Фишера. .R2 – коэффициент детерминации. Найдем его с помощью программы Eviews в данных по нашей модели.
Или R2=0,45
F набл = =4,9
F табл (=0,05; n-k-1=30; k=5)=2,5
Таким образом, Fнабл>Fтабл . Следовательно, отвергаем Н0, факторы совместно оказывают статистически значимое влияние на y.
Модель считается хорошей, когда в ней нет статистически незначимых коэффициентов регрессии и соответственно, по F- критерию она тоже адекватна. То есть нашу последнюю модель можно считать хорошей по этому критерию.
Еще одним из этапов анализа качества модели является анализ качества остатков. Остатки – разница между фактическими данными и модельными для каждого периода.
, где ei – остаток в период i.
Остатки должны быть случайными, независимыми величинами, распределенными по нормальному закону. Только если эти требования выполняются, можно переходить к другим методам проверки качества модели.
Существует графический и аналитический способ анализа остатков.
Графический способ подразумевает построение графика остатков. Eviews автоматически показывает график остатков, когда мы считаем теоретический y и остатки.
На графике остатков приложения 3 видно, что выбросов нет, т.е. нет остатков, которые в 4-6 раз больше других. Следовательно, в первоначальных данных нет нетипичных наблюдений, дисперсия остатков постоянна. Такие остатки называются гомоскедастичными.
Поскольку математическое ожидание остатков равно 0, можно сделать вывод о том, что остатки распределены по нормальному закону.
Одним из аналитических методов является проверка на наличие автокорреляции в остатках.
Автокорреляция – это корреляция между уровнями ряда и его последующими значениями. Наличие автокорреляции может свидетельствовать о том, что в остатках отражается какой-либо фактор, значительно влияющий на результирующий признак, однако не включенный в модель. Проверка на наличие автокорреляции осуществляется на основе критерия Дарбина-Уотсона. Но поскольку у нас не временной ряд, мы не можем применять этот метод.
Также наличие гетероскедастичности модели регрессии можно проверить с помощью теста Голдфелда-Куандта и теста Уайта.
Тест Голдфелда-Куандта (Goldfeld-Quandt)
Тест Голдфелда-Куандта проводится следующим образом:
1 шаг. Упорядочиваем все наблюдения в соответствии с увеличением значений переменной x2
2 шаг. Весь ряд наблюдений делим на 3 части, при этом в первой и третьей части находится одинаковое число наблюдений.
3 шаг. Для первой и третьей части строим регрессию и определяем RSSI и RSSIII.
RSSI=RSSIII=
4 шаг. Принимаем гипотезу о том, что у нас дисперсия (разброс остатков) не зависит от значения x2.
Ho: δ=δ,i≠j (дисперсия постоянна, гомоскедастичность)
H1: δ≠δ,i≠j (дисперсия непостоянна, гетероскедастичность)
Разброс измеряется дисперсией. По условиям Гаусса-Маркова дисперсия остатков должна быть постоянной (не зависящей от номера x).
Гипотеза проверяется с помощью критерия Фишера:
Fнабл=
Fтабл(α=0,05; k-m-1;k-m-1), где k-m-1 – число степеней свободы, k - число наблюдений в первой и третьей части, m - число переменных (факторов), 1 – из-за наличия константы.
Нарисуем графики распределения Фишера.
Fтабл
Если Fнабл≥Fтабл принимается гипотеза Н1 о наличии гетероскедастичности. Если Fнабл≤Fтабл, принимается гипотеза Н0 о постоянстве дисперсии, гомоскедастичности.
Тест Уайта (White)
Используя Eviews, можно провести проверку качества модели регрессии с помощью теста Уайта. Идея этого теста заключается в том, что если в остатках есть гетероскедастичность, то в остатках остались какие-то нелинейные зависимости от исследованных факторов. Целью данного теста является проверка наличия в остатках нелинейной зависимости от факторов.
Шаг 1. Строим модель регрессии ŷ= + *X2+ *d1+ *R1+ *R2+ *R3.Находим остатки для регрессии.
Шаг 2. Строится модель квадрата остатков от факторов, квадратов факторов и пересечений факторов (фиктивные переменные не рассматриваем)
Шаг 3. Если остатки гетероскедастичны, то квадраты факторов влияют на остатки, то есть коэффициенты регрессии ai статистически значимы, и мы можем проверить совместное влияние всех факторов на квадраты остатков с помощью критерия Фишера. Принимаем гипотезу о том, что все факторы совместно не влияют на квадраты остатков.
Н0: ai =ak=0
Альтернативная гипотеза H1 утверждает, что это не так.
В критерии Уайта nR2 сравнивается с χ2(N-1), где n – число наблюдений, N – число факторов.
Для расчетов воспользуемся Eviews.
Так как probability=0,157911 и больше уровня значимости α=0,05, следовательно, в данной модели регрессии гетероскедастичность отсутствует и дисперсия является постоянной.
Тест Чоу
1) У нас есть модель регрессии для 36 наблюдений:
ŷ= 6159,4+5149,9*X2+12223,8*d1+15094,6*R1+ 13561,2*R2+ 4106,7*R3
Ошибка 4818756651
2) Выделим 2 группы. Первая – с весом ноутбука до 2,5 кг (x2<2,5), а вторая – с весом ноутбука больше или равно 2,5 кг (x2≥2,5).
С помощью Eviews для первой группы строим модель:
ŷ= 9823,8+3379,9*X2+14466,8*d1+15548,3*R1+ 17975,6*R2+ 4296,4*R3
Ошибка 1730742750
3) Модель регрессии для второй группы:
ŷ= -23270,2+15266,4*X2+11503,9*d1+13020,6*R1 + 6207,6*R2 - 3823,7*R3
Ошибка 1989652784
4) Принимаем гипотезу H0 о том, что не произошло никаких изменений в этих двух группах (при =0,05)
Н0: ,i=0…k
H1:
5) Проверяем гипотезу с помощью критерия Фишера
Fнабл=1,18
Fтабл(=0,05;n-2*(k+1)=24;k+1=6)=2,5
Таким образом, Fнабл<Fтабл. Следовательно, принимаем гипотезу Н0 о том, что существенных изменений в двух группах нет.