- •Министерство образования республики беларусь
- •Содержание
- •Задание 1 Простая (парная) линейная регрессия (плр). Классические предположения моделей
- •Задание 2
- •Обработка данных с помощью мнк:
- •Остатки:
- •Проверка значимости рассчитанных коэффициентов
- •Теперь построим прогноз, взяв соответствующие задаче х:
- •Задание 3
- •Построение зависимости с помощью инструмента Анализ данных/регрессия
- •Проверка значимости мнк-коэффициентов (Стьюдент)
- •Проверка значимости коэффициента детерминации (Критерий Фишера)
- •Доверительные интервалы:
- •Список использованных источников
Проверка значимости рассчитанных коэффициентов
Для проверки значимости коэффициентов необходимо рассчитать фактические коэффициенты Стьюдента и сравнить их значения с табличным для заданного уровня надежности (95%). Для фактического коэффициента необходимо рассчитать стандартные ошибки коэффициентов:
Результаты вычислений:
Se |
1,916523521 |
c.o.(a) |
1,73799492 |
c.o.(b) |
0,149166804 |
tфакт(а) |
0,131170569 |
tфакт(b) |
6,579878386 |
Значимость полученных коэффициентов проверяется сравнением фактического значения коэффициента Стьюдента (t) и табличного (для уровня доверия 90%) по условию (1,86). Для коэффициента b при Х фактический коэффициент больше, - значит, он статистически значим для рассматриваемого уровня точности. Свободный член a не значим статистически и образовался случайно, так как tфакт(а) меньше табличного значения.
Коэффициент детерминации и проверка уравнения на значимость (тест Фишера-Синекдора):
Коэффициент детерминации дает оценку качества построенной модели. Он показывает, насколько вариация результата зависит от вариации переменных:
R2 = 0,844. Следовательно, связь между изучаемыми показателями достаточно сильная.
Следующим шагом при помощи коэффициента Фишера-Синекдора проверяется значимость коэффициента детерминации.
, Fфакт= 43,295
Фактический коэффициент Фишера больше табличного (3,46). Это позволяет судить о статистической значимости коэффициента детерминации, т.е. уравнение было сформировано не случайно.
Доверительные интервалы для заданного уровня точности:
Строим таблицу:
|
Предел. ошибка () |
Нижняя граница |
Верхняя граница |
a |
3,232670551 |
-3,460644333 |
3,00469677 |
b |
0,277450256 |
0,704049175 |
1,258949686 |
Запишем уравнение в интервальной форме на основании этих данных можно, составим уравнения верхней и нижней границы:
y = (0,99±0,28)x – (0,23±3,23), Р=90%
yнижн=0,70x-3,46
yверх=1,25х+3
Теперь построим прогноз, взяв соответствующие задаче х:
x пр |
y пр мин |
y пр |
y пр макс |
16 |
7,804142 |
15,47602 |
23,14789175 |
17 |
8,508192 |
16,45752 |
24,40684144 |
18 |
9,212241 |
17,43902 |
25,66579112 |
19 |
9,91629 |
18,42052 |
26,92474081 |
20 |
10,62034 |
19,40201 |
28,1836905 |
21 |
11,32439 |
20,38351 |
29,44264018 |
22 |
12,02844 |
21,36501 |
30,70158987 |
23 |
12,73249 |
22,34651 |
31,96053955 |
24 |
13,43654 |
23,32801 |
33,21948924 |
25 |
14,14059 |
24,30951 |
34,47843893 |
Эти же данные на графике:
Выводы:
В ходе анализа была выведена следующая зависимость между переменными: y = (0,99±0,28)x – (0,23±3,23). Согласно тестам Стьюдента и Фишера, коэффициент детерминации значим, коэффициент B при Х значим, свободный член A сформировался случайно, автокорреляция отсутствует. Значения коэффициентов детерминации и корреляции позволяют говорить о высокой точности модели и прогнозной силе.
Задание 3
По статистическим данным построить линейную эконометрическую модель зависимости объема продукции Y, производимой некоторым предприятием, от величин X1, X2, …,XN (например, от объема затраченного сырья, от количества рабочих, занятых в производстве, от установочной мощности оборудования и т.д.). Построение вести в следующем порядке:
По методу наименьших квадратов оценить коэффициенты линейного уравнения регрессии; проверить статистическую значимость каждого коэффициента уравнения регрессии с помощью t-статистики.
Проверить общее качество уравнения регрессии с помощью коэффициента детерминации R2.
Проверить отсутствие автокорреляции остатков с помощью статистики Дарбина – Уотсона DW.
Сделать выводы по качеству построенной модели и ее возможному совершенствованию.
T=15, N=3
t |
Y |
X1 |
X2 |
X3 |
1 |
145167 |
0,086393 |
114987 |
0,432066 |
2 |
170192 |
0,09674 |
120501 |
0,439669 |
3 |
247506 |
0,1415 |
121908 |
0,488932 |
4 |
309391 |
0,169715 |
127220 |
0,484181 |
5 |
354338 |
0,173805 |
209405 |
0,529925 |
6 |
373941 |
0,164272 |
263148 |
0,532723 |
7 |
420915 |
0,170906 |
316724 |
0,549067 |
8 |
474017 |
0,17784 |
363598 |
0,55714 |
9 |
532590 |
0,192248 |
389436 |
0,611377 |
10 |
676771 |
0,242469 |
547376 |
0,645319 |
11 |
880438 |
0,256505 |
850418 |
0,611734 |
12 |
1052020 |
0,249657 |
1011170 |
0,580884 |
13 |
1193680 |
0,273923 |
951934 |
0,572047 |
14 |
1303390 |
0,371131 |
881323 |
0,59457 |
15 |
1436970 |
0,421411 |
831374 |
0,585525 |
Таблица со табличными коэффициентами (n=15, k1=3, k2=11):
Уровень надежности |
90% |
95% |
99% |
Стьюдент |
1,80 |
2,20 |
2,72 |
Фишер-Синекдор |
|
3,59 |
|
Дарбин-Уотсон |
|
Dн =0,82 Dв=1,75 |
|
Графики зависимости:
Графики позволяют судить о нелинейной зависимости между переменными. Поэтому эффективность оценки МНК сомнительна.