- •Классическая модель линейной регрессии Задания:
- •Порядок выполнения работы в системе Excel
- •1. Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов по данным в соответствии с вариантом.
- •2. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.
- •3. Оцените с помощью f-критерия Фишера-Снедекора значимость уравнения линейной регрессии и показателя тесноты связи.
- •4. Оцените статистическую значимость коэффициентов регрессии с помощью t- критерия Стьюдента.
- •5. Оцените качество уравнения через среднюю ошибку аппроксимации.
- •6. Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.
- •7. Постройте модель в естественной форме только с информативными факторами и оцените ее параметры.
- •8. Постройте модель в стандартизованном масштабе и проинтерпретируйте ее параметры.
- •9. Рассчитайте прогнозное значение результата, если прогнозное значение факторов составляют 80% от их максимальных значений.
- •10. Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости .
- •11. По полученным результатам сделайте экономический вывод.
4. Оцените статистическую значимость коэффициентов регрессии с помощью t- критерия Стьюдента.
Выдвигаем две гипотезы:
Н0: коэффициенты регрессии статистически не значимы, т.е. равны о;
Н1: коэффициенты регрессии статистически значимы, т.е. отличны от нуля.
Значения случайных ошибок параметров с учетом округления равны (рисунок 3):
Они показывают, какое значение данной характеристики сформировались под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента (рисунок 3):
.
Если значения t-критерия больше 2,13, можно сделать вывод о существенности параметра, который формируется под воздействием неслучайных причин. Здесь параметр b4 является статистически значимым при уровне значимости 5%, а все остальные параметры являются статистически не значимыми.
На это же указывает показатель вероятности случайных значений параметров регрессии (Р – значимость): если α меньше принятого нами уровня (обычно 0,1; 0,05 или 0,01), делают вывод о неслучайной природе данного значения параметра, т.е. о том, что он статистически значим и надежен. В противном случае принимается гипотеза о случайной природе значения коэффициентов уравнения.
5. Оцените качество уравнения через среднюю ошибку аппроксимации.
Рассчитаем среднюю ошибку аппроксимации по формуле :
Таблицу расчета средней ошибки аппроксимации представим на рисунке 6.
Рисунок 6 – Таблица расчета среднего коэффициента аппроксимации
- множественная модель регрессии обладает хорошим аппроксимирующим качеством.
6. Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.
О коллинеарности факторов можно судить о величине парного коэффициента корреляции ( ) между факторными признаками.
Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого:
1) в главном меню последовательно выберете пункты Сервис / Анализ данных / Корреляция. Щелкните по кнопке ОК;
2) заполните диалоговое окно ввода данных и параметров вывода (рисунок 7);
3) результаты вычислений – матрица парных коэффициентов корреляции – представлены на рисунке 8.
Рисунок 7. Диалоговое окно ввода параметров инструмента Корреляция
Рисунок 8 – Матрица парных коэффициентов корреляции
Cвязь у с фактором х3 можно охарактеризовать как умеренную, с остальными факторами, как слабую. Однако, , и указывают на тесную связь между факторами.
При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. Из трех факторов х1, х2, х3 из анализа, на наш взгляд, можно удалить факторы х1, х2, как наиболее коррелируемые с факторами х4, х5. Таким образом, информативными являются факторы х3, х4, х5.
7. Постройте модель в естественной форме только с информативными факторами и оцените ее параметры.
Алгоритмические шаги нахождения параметров множественного уравнения регрессии с отобранными факторами и его параметров выполняются соответственно с пунктом 1 лабораторной работы.
Результаты анализа представлены на рисунке 9.
Рисунок 9 – Результат применения инструмента Регрессия для переменных х3, х4, х5
Уравнение регрессии имеет вид (в скобках, под коэффициентами, обычно указывают t-статистику):
(10,69) (2,27) (2,97) (-0,68)
Уравнение в целом и его параметры статистически значимы, кроме b5. Отрицательный знак b5 не поддается экономической интерпретации, из чего следует, что повышение насыщенности средствами оздоровления растений отрицательно сказывается на урожайности.
Если в результате получается, что некоторые коэффициенты не значимы, как в нашем случае незначим b5, то необходимо вернуться к пункту 6 и исключить его из анализа.
Результаты регрессионного анализа с факторными переменными х3, х4 представлены на рисунке 10.
Рисунок 10 – Результат применения инструмента Регрессия для переменных х3, х4
Получаем уравнение вида:
(11,01) (2,20) (3,22)
Уравнение в целом и его параметры статистически значимы. При этом можем наблюдать, что коэффициент детерминации R2=0,47 незначительно снизился, зато скорректированный увеличился по сравнению с результатами регрессии с полным перечнем факторов. Что свидетельствует об улучшении качества модели.