- •Основы регрессионного анализа. Множественная регрессия
- •4. Вычислить коэффициент детерминации и проверить на значимость построенное регрессионное уравнение. Сделать выводы.
- •5. Построить 95%-ый доверительный интервал для уравнения регрессии на всём диапазоне исходных данных.
- •6. Изобразить в одной системе координат исходные данные, линию регрессии, 95%-ый доверительный интервал.
- •Выводы:
- •Рекомендации:
Министерство образования и науки Российской Федерации
Федеральное агентство по образованию
Новосибирский Государственный Технический Университет
Кафедра теории рынка
Практическое занятие №4
По предмету «эконометрика».
Основы регрессионного анализа. Множественная регрессия
Вариант №7.
Факультет: ФЭН
Группа: ЭК-91
Студенты: Владимирова О.А.
Клевцова В.В.
Преподаватель:
Щеколдин В.Ю.
Новосибирск 2011г.
Ситуация 2: «Орехи и виноград».
В соответствии с рекомендациями книги о вкусной и здоровой пище, спасённой Робинзоном с корабля, он решил разнообразить своё меню. Для этого кроме охоты на уток Робинзон стал заниматься сбором дикого винограда и орехов. В период сбора урожая он с утра выходил в лес с большой корзиной, собирал орехи с виноградом и к обеду возвращался. Со временем Робинзон заметил, что вес собранного (Y, фунты) зависит от количества обобранных кустов винограда (X1, шт) и количества обобранных кустов орешника (X2, шт). Необходимо построить модель этой зависимости и помочь Робинзону избавиться от алкогольной зависимости.
Цель:ознакомиться с основными положениями, понятиями и методами анализа линейных моделей множественной регрессии.
Исходные данные:
x1 |
x2 |
y |
11 |
7 |
38 |
4 |
10 |
29 |
15 |
7 |
44 |
4 |
10 |
37 |
6 |
6 |
36 |
6 |
10 |
39 |
5 |
10 |
43 |
3 |
10 |
30 |
8 |
10 |
50 |
14 |
6 |
42 |
10 |
10 |
50 |
15 |
7 |
35 |
7 |
10 |
41 |
8 |
10 |
51 |
3 |
7 |
31 |
14 |
5 |
39 |
11 |
7 |
39 |
8 |
8 |
39 |
7 |
8 |
37 |
13 |
9 |
52 |
14 |
10 |
45 |
9 |
10 |
45 |
12 |
8 |
43 |
14 |
9 |
48 |
9 |
8 |
31 |
Задание №1. Записать уравнение зависимости веса собранного урожая от количества обобранных кустов винограда и орешника. Пояснить введенные обозначения.
Уравнение парной регрессии выглядит следующим образом:
– значение признака Y (выходной переменной ) в i-том наблюдении – вес собранного урожая в фунтах.
– значение признака X1 (входной переменной ) в i-том наблюдении – количество обобранных кустов винограда.
– значение признака X2 (входной переменной ) в i-том наблюдении – количество обобранных кустов орешника.
-случайная величина (ошибка наблюдения).
- неизвестные параметры
Основные предположения модели:
, - детерминированные величины
- вектор значений отклика
- вектор неизвестных параметров модели
- вектор случайных ошибок
- матрица значений независимых переменных в Nэкспериментах
- вид модели
При этом:
;
;
.
Задание №2. С помощью метода наименьших квадратов найти оценки всех неизвестных параметров уравнения регрессии. Проинтерпретировать результаты.
Вычислим оценки неизвестных параметров, используя технику метода наименьших квадратов.
Техника МНК состоит в решении системы нормальных уравнений:
Вычислим величину остаточной суммы квадратов
,
Где .
Найдем оценки неизвестных параметров с помощью метода наименьших квадратов.
Определим матрицу значений неизвестных параметров, исходя из того, что:
, отсюда .
Таким образом, , , . Уравнение линейной множественной регрессии имеет вид:
= 8.855+1.208
Интерпретируем полученные коэффициенты регрессии для этой зависимости:
Так как >0, то сделаем вывод: относительное изменение веса собранного урожая происходит,быстрее чем изменение количества обобранных кустов винограда и орешника. Значение оценки 8,855означает вес собранного при случае, когда не обобрано ни одного куста. Но интерпретация этого параметра не имеет экономического содержания.
Так как, при изменении количества обобранных кустов винограда на 1 штуку, общий вес собранного урожая изменяется в среднем на 1,208 фунтов, т.е. с увеличением количества обобранных кустов винограда, общий вес собранного Робинзоном урожая увеличивается.
Так как, при изменении количества обобранных кустов орешника на 1 штуку, общий вес собранного урожая изменяется в среднем на 2,428 фунтов, т.е. с увеличением количества обобранных кустов орешника, общий вес собранного Робинзоном урожая увеличивается.
Задание №3. Проверить значимость параметров уравнения по критерию Стьюдента. Для значимых коэффициентов построить доверительные интервалы. Сделать выводы.
Проверим на значимость параметр :
Уровень значимости: =0,05.
Вычислим – несмещенную оценку дисперсии ошибок, равную
= 32.79247
Найдём – среднеквадратическое отклонение оценки по формуле , где – соответствующий элемент матрицы .
= 32.79247 × 0.0033 = 0,108215151
Критическая статистика: . Предельное распределение критической статистики стремится к t-распределению Стьюдента с N-3 числом степеней свободы.
t=4,31
Основная гипотеза отвергается, если , где – критическое значение, найденное по таблицам квантилей распределения Стьюдента.
=2,074.
Сравнив, видим 4,31> 2,074, т.е. гипотеза о незначимости параметра отвергается при данном уровне значимости оценка параметра подходит для описания скорости изменения веса собранного урожая при изменении количества обобранных кустов винограда.
Проверим на значимость параметр :
Уровень значимости: =0,05.
Найдём – среднеквадратическое отклонение оценки по формуле , где – соответствующий элемент матрицы .
= 32.79247 × 0,0196=0,642732412
Критическая статистика: . Предельное распределение критической статистики стремится к t-распределению Стьюдента с N-3 числом степеней свободы.
t=3,54
Основная гипотеза отвергается, если , где – критическое значение, найденное по таблицам квантилей распределения Стьюдента.
=2,074.
Сравнив, видим 3,54>> 2,074, т.е. гипотеза о незначимости параметра отвергается при данном уровне значимости оценка параметра подходит для описания скорости изменения веса собранного урожая при изменении количества обобранных кустов орешника.
Проверим на значимость параметр :
Уровень значимости: =0,05.
Найдём – среднеквадратическое отклонение оценки по формуле , где – соответствующий элемент матрицы .
= 32.79247 × 2,253=73,88143491
Критическая статистика: . Предельное распределение критической статистики стремится к t-распределению Стьюдента с N-3 числом степеней свободы.
t=1.20
Основная гипотеза отвергается, если , где – критическое значение, найденное по таблицам квантилей распределения Стьюдента.
=2,074.
Сравнив, видим 1,2< 2,074, т.е. гипотеза о незначимости параметра не отвергается при данном уровне значимости оценка параметра не является корректной для использования в данной модели.
Заметим, что для расчётное значение статистики Стьюдента превосходит критическое в 2,078 раза, для - в 1,706 раза. Исходя из этого, можно сказать, что сильнее отвергается гипотеза о незначимости параметра. . Гипотеза о незначимости параметра не отвергается, причём критическое значение статистики Стьюдента превосходит расчётное в 1,73 раза.
Для значимых параметров построим доверительные 95% интервалы:
Для параметра
Параметр с 95% вероятностью может принимать значения, лежащие в диапазоне от 0,53до 1,88
0,53
1,88
Истинное значение параметра с 95%-ой вероятностью не будет отклоняться от значения оценки этого параметра более чем на 61% от её значения.
Для параметра
П араметр с 95% вероятностью может принимать значения, лежащие в диапазоне от 0,77 до 4,08
0,77
4,08
Истинное значение параметра с 95%-ой вероятностью не будет отклоняться от значения оценки этого параметра более чем на 54% от её значения.
Выводы:
Проверив на значимость параметры модели, получили, что параметры и значимы, а для параметра гипотеза об отсутствии значимости не отвергается.
Значит, независимые переменные оказывают влияние на отклик. Т.е. влияние количества обобранных кустов винограда и орешника на вес собранного существенно. Построенные интервалы позволяют говорить о том, что при увеличении количества обобранных кустов винограда на 1 ожидаемое изменение веса собранного (с вероятностью 95%) может принимать любые значение в диапазоне от 0,53 до 1,88 фунтов. А при увеличении количества обобранных кустов орешника на 1 ожидаемое изменение веса собранного (с вероятностью 95%) может принимать любые значение в диапазоне от 0,77до 4,08фунтов.