Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лр 2. Множественная регрессия.doc
Скачиваний:
28
Добавлен:
31.08.2019
Размер:
2.18 Mб
Скачать

4. Оцените статистическую значимость коэффициентов регрессии с помощью t- критерия Стьюдента.

Выдвигаем две гипотезы:

Н0: коэффициенты регрессии статистически не значимы, т.е. равны о;

Н1: коэффициенты регрессии статистически значимы, т.е. отличны от нуля.

Значения случайных ошибок параметров с учетом округления равны (рисунок 3):

Они показывают, какое значение данной характеристики сформировались под влиянием случайных факторов. Эти значения используются для расчета t-критерия Стьюдента (рисунок 3):

.

Если значения t-критерия больше 2,13, можно сделать вывод о существенности параметра, который формируется под воздействием неслучайных причин. Здесь параметр b4 является статистически значимым при уровне значимости 5%, а все остальные параметры являются статистически не значимыми.

На это же указывает показатель вероятности случайных значений параметров регрессии (Р – значимость): если α меньше принятого нами уровня (обычно 0,1; 0,05 или 0,01), делают вывод о неслучайной природе данного значения параметра, т.е. о том, что он статистически значим и надежен. В противном случае принимается гипотеза о случайной природе значения коэффициентов уравнения.

5. Оцените качество уравнения через среднюю ошибку аппроксимации.

Рассчитаем среднюю ошибку аппроксимации по формуле :

Таблицу расчета средней ошибки аппроксимации представим на рисунке 6.

Рисунок 6 – Таблица расчета среднего коэффициента аппроксимации

- множественная модель регрессии обладает хорошим аппроксимирующим качеством.

6. Рассчитайте матрицу парных коэффициентов корреляции и отберите информативные факторы в модели. Укажите коллинеарные факторы.

О коллинеарности факторов можно судить о величине парного коэффициента корреляции ( ) между факторными признаками.

Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого:

1) в главном меню последовательно выберете пункты Сервис / Анализ данных / Корреляция. Щелкните по кнопке ОК;

2) заполните диалоговое окно ввода данных и параметров вывода (рисунок 7);

3) результаты вычислений – матрица парных коэффициентов корреляции – представлены на рисунке 8.

Рисунок 7. Диалоговое окно ввода параметров инструмента Корреляция

Рисунок 8 – Матрица парных коэффициентов корреляции

Cвязь у с фактором х3 можно охарактеризовать как умеренную, с остальными факторами, как слабую. Однако, , и указывают на тесную связь между факторами.

При отборе факторов в модель предпочтение отдается фактору, который при достаточно тесной связи с результатом имеет наименьшую тесноту связи с другими факторами. Из трех факторов х1, х2, х3 из анализа, на наш взгляд, можно удалить факторы х1, х2, как наиболее коррелируемые с факторами х4, х5. Таким образом, информативными являются факторы х3, х4, х5.

7. Постройте модель в естественной форме только с информативными факторами и оцените ее параметры.

Алгоритмические шаги нахождения параметров множественного уравнения регрессии с отобранными факторами и его параметров выполняются соответственно с пунктом 1 лабораторной работы.

Результаты анализа представлены на рисунке 9.

Рисунок 9 – Результат применения инструмента Регрессия для переменных х3, х4, х5

Уравнение регрессии имеет вид (в скобках, под коэффициентами, обычно указывают t-статистику):

(10,69) (2,27) (2,97) (-0,68)

Уравнение в целом и его параметры статистически значимы, кроме b5. Отрицательный знак b5 не поддается экономической интерпретации, из чего следует, что повышение насыщенности средствами оздоровления растений отрицательно сказывается на урожайности.

Если в результате получается, что некоторые коэффициенты не значимы, как в нашем случае незначим b5, то необходимо вернуться к пункту 6 и исключить его из анализа.

Результаты регрессионного анализа с факторными переменными х3, х4 представлены на рисунке 10.

Рисунок 10 – Результат применения инструмента Регрессия для переменных х3, х4

Получаем уравнение вида:

(11,01) (2,20) (3,22)

Уравнение в целом и его параметры статистически значимы. При этом можем наблюдать, что коэффициент детерминации R2=0,47 незначительно снизился, зато скорректированный увеличился по сравнению с результатами регрессии с полным перечнем факторов. Что свидетельствует об улучшении качества модели.