- •Министерство образования республики беларусь
- •Содержание
- •Задание 1 Простая (парная) линейная регрессия (плр). Классические предположения моделей
- •Задание 2
- •Обработка данных с помощью мнк:
- •Остатки:
- •Проверка значимости рассчитанных коэффициентов
- •Теперь построим прогноз, взяв соответствующие задаче х:
- •Задание 3
- •Построение зависимости с помощью инструмента Анализ данных/регрессия
- •Проверка значимости мнк-коэффициентов (Стьюдент)
- •Проверка значимости коэффициента детерминации (Критерий Фишера)
- •Доверительные интервалы:
- •Список использованных источников
Задание 2
Предполагается, что объем Y предложения некоторого товара зависит линейно от цены данного товара Х: y=a0+a1x+. Статистические данные, собранные за T периодов, приведены в таблицах по вариантам. Требуется построить регрессионную модель Построение модели вести в следующей последовательности:
Построить корреляционное поле
Оценить параметры модели по методу наименьших квадратов
Вычислить коэффициент детерминации R2
Проверить, используя критерии Стьюдента и Фишера, адекватность линейной модели
Установить с помощью статистики Дарбина – Уотсона (DW) наличие (отсутствие) автокорреляции
Данные: =0,9 (=0,1); T=10
t |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
x |
4,4 |
12,9 |
5,5 |
15,5 |
13,9 |
15,3 |
14,2 |
11,2 |
5,5 |
10,8 |
y |
2,6 |
10,9 |
6,2 |
16 |
16,1 |
14,7 |
11,1 |
12,7 |
6,2 |
8,4 |
Табличные значения для исследуемой зависимости (n=10, k1=1, k2=n-k-1=8):
Коэффициент Стьюдента, (tтабл) |
1,86 |
При 90% надежности и K2=8 |
Коэффициент Фишера-Синекдора, (Fтабл) |
3,46
|
K1=1, K2=8, =0,1 |
Дарбин-Уотсон |
Dн=0,88 |
Dв=1,32 |
Судя по графику, между х и у существует прямая зависимость (т.е. а1>0). А а0<0, т.к. пресечение прямой с осью у произойдет в области отрицательных значений у.
Обработка данных с помощью мнк:
Для расчетов была построена следующая таблица:
t |
x |
y |
x*y |
x^2 |
y^2 |
x-xср |
(x-xср)^2 |
1 |
4,4 |
2,6 |
11,44 |
19,36 |
6,76 |
-6,52 |
42,5104 |
2 |
12,9 |
10,9 |
140,61 |
166,41 |
118,81 |
1,98 |
3,9204 |
3 |
5,5 |
6,2 |
34,1 |
30,25 |
38,44 |
-5,42 |
29,3764 |
4 |
15,5 |
16 |
248 |
240,25 |
256 |
4,58 |
20,9764 |
5 |
13,9 |
16,1 |
223,79 |
193,21 |
259,21 |
2,98 |
8,8804 |
6 |
15,3 |
14,7 |
224,91 |
234,09 |
216,09 |
4,38 |
19,1844 |
7 |
14,2 |
11,1 |
157,62 |
201,64 |
123,21 |
3,28 |
10,7584 |
8 |
11,2 |
12,7 |
142,24 |
125,44 |
161,29 |
0,28 |
0,0784 |
9 |
5,5 |
6,2 |
34,1 |
30,25 |
38,44 |
-5,42 |
29,3764 |
10 |
10,8 |
8,4 |
90,72 |
116,64 |
70,56 |
-0,12 |
0,0144 |
сумма |
109,2 |
104,9 |
1307,53 |
1357,54 |
1288,81 |
|
165,076 |
среднее |
10,92 |
10,49 |
130,753 |
135,754 |
128,881 |
|
16,5076 |
После проведения расчетов были получены данные:
xcp*ycp |
114,5508 |
cov(x,y) |
16,2022 |
var(x) |
16,5076 |
var(y) |
18,8409 |
b |
0,981499 |
a |
-0,22797 |
rxy |
0,918716 |
Полученное линейное уравнение парной регрессии: y=0,98x-0,23
Значение коэффициента корреляции (rxy) близко к 1 (0,92), что говорит о достаточно высокой взаимосвязи переменных.
Остатки:
Для проверки на автокорреляцию строится таблица остатков e. Остатки – разность между эмпирическими Y и Y, полученными для тех же Х с помощью функции, полученной через МНК.
Фактический коэффициент Дарбина-Уотсона вычисляется по формуле:
где e – остатки. Далее с помощью табличных значений строятся интервалы:
Для нахождения коэффициента Дарбина-Уотсона строим таблицу:
y~ |
e |
e^2 |
Еt-Еt-1 |
(Еt-Еt-1)^2 |
4,090624 |
-1,49062 |
2,221959 |
|
|
12,43337 |
-1,53337 |
2,35122 |
-0,04274516 |
0,0018271 |
5,170273 |
1,029727 |
1,060338 |
2,563095786 |
6,56946 |
14,98527 |
1,014733 |
1,029682 |
-0,014994306 |
0,0002248 |
13,41487 |
2,685132 |
7,209932 |
1,670399089 |
2,7902331 |
14,78897 |
-0,08897 |
0,007915 |
-2,774099203 |
7,6956264 |
13,70932 |
-2,60932 |
6,808541 |
-2,520350626 |
6,3521673 |
10,76482 |
1,93518 |
3,744922 |
4,544498292 |
20,652465 |
5,170273 |
1,029727 |
1,060338 |
-0,905453246 |
0,8198456 |
10,37222 |
-1,97222 |
3,889652 |
-3,001946982 |
9,0116857 |
сумма |
|
29,3845 |
|
53,893535 |
С помощью полученных данных находим d=1,83. Теперь подставляем значение в таблицу для нахождения автокорреляции.
от 0 до 0,88 |
|
Положительная АК |
от 0,88 до 1,32 |
|
Неопределенность |
От 1,32 до 2,68 |
1,83 |
Отсутствие АК |
от 2,68 до 3,12 |
|
Неопределенность |
От 3,12 до 4 |
|
Отрицательная АК |
Т.к. d находится в промежутке от 1,32 до 2,68, автокорреляция отсутствует. Это подтверждается также хаотичным характером знаков и упорядоченности остатков на графике: