- •4. Оцените качество модели через коэффициент детерминации, среднюю ошибку аппроксимации и f-критерий Фишера.
- •Проверка условия гомоскедастичности случайной составляющей (возмущения).
- •3. Оценка качества построенной модели.
- •1) Оценка адекватности
- •4. Оценка точности модели.
- •5. Построение точечного и интервального прогноза.
- •Список литературы
Проверка условия гомоскедастичности случайной составляющей (возмущения).
Для обнаружения гетероскедастичности используется метод Гольдфельда – Квандта, который включает в себя следующие шаги:
упорядочить n наблюдений по мере возрастания переменной Х;
исключить d средних наблюдений, где , d=10;
разделить совокупность на две группы (соответственно с малыми и большими значениями фактора х) и определить по каждой из групп уравнения регрессии;
определить остаточную сумму квадратов для первой регрессии:
и второй регрессии групп:
нахождение расчетного критерия Фишера:
Если Fрасч >Fтабл (α; k1; k2) - гетероскедастичность имеет место, свойство не выполняется.
В таблице 12. Приведены упорядоченные наблюдения по мере возрастания фактора х3, d средних наблюдений выделены жирным шрифтом.
Таблица 12. Упорядоченные наблюдения по мере возрастания фактора х3
t |
х3 |
y |
t |
х3 |
y |
1 |
29 |
38 |
21 |
71,3 |
80 |
2 |
32 |
67 |
22 |
72,9 |
125 |
3 |
32 |
39 |
23 |
75 |
105 |
4 |
32,8 |
45 |
24 |
75 |
90 |
5 |
32,8 |
40 |
25 |
80 |
98 |
6 |
34 |
40 |
26 |
80 |
105 |
7 |
35 |
41 |
27 |
81 |
132 |
8 |
36 |
42 |
28 |
81 |
123 |
9 |
41,9 |
38 |
29 |
81,1 |
82 |
10 |
47 |
67 |
30 |
85 |
85 |
11 |
57 |
100 |
31 |
89,9 |
92,5 |
12 |
57,2 |
93 |
32 |
90 |
170 |
13 |
58,1 |
61,1 |
33 |
97 |
86,9 |
14 |
58,1 |
70,3 |
34 |
104 |
128 |
15 |
60 |
85 |
35 |
107 |
118 |
16 |
60 |
60 |
36 |
108 |
130,5 |
17 |
67 |
125 |
37 |
108,4 |
200 |
18 |
69 |
62,2 |
38 |
147 |
227 |
19 |
69,5 |
83 |
39 |
150 |
235 |
20 |
70 |
160 |
40 |
155 |
280 |
В таблицах 13,14,15,16 приведен вывод итогов по первым 15 значениям (n1=15).
Таблица 13. Регрессионная статистика
-
Множественный R
0,814
R-квадрат
0,663
Нормированный R-квадрат
0,637
Стандартная ошибка
13,039
Наблюдения
15
Таблица 14. Дисперсионный анализ
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
4352,695 |
4352,695 |
25,600 |
0,0002 |
Остаток |
13 |
2210,341 |
170,026 |
|
|
Итого |
14 |
6563,036 |
|
|
|
Таблица 15.
|
Коэффи-циенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y-пересе-чение |
-5,474 |
12,943 |
-0,423 |
0,679 |
-33,437 |
22,488 |
X3 |
1,475 |
0,292 |
5,060 |
0,000 |
0,845 |
2,105 |
Таблица 16. Вывод остатка
Наблюдение |
Yi |
Предсказанное Y |
Остатки ei=yi-ŷi |
|
|
1 |
38 |
37,311 |
0,689 |
0,474 |
|
2 |
67 |
41,737 |
25,263 |
638,196 |
|
3 |
39 |
41,737 |
-2,737 |
7,494 |
|
4 |
45 |
42,918 |
2,082 |
4,336 |
|
5 |
40 |
42,918 |
-2,918 |
8,513 |
|
6 |
40 |
44,688 |
-4,688 |
21,979 |
|
7 |
41 |
46,164 |
-5,164 |
26,663 |
|
8 |
42 |
47,639 |
-5,639 |
31,798 |
|
9 |
38 |
56,344 |
-18,344 |
336,489 |
|
10 |
67 |
63,868 |
3,132 |
9,809 |
|
11 |
100 |
78,622 |
21,378 |
457,029 |
|
12 |
93 |
78,917 |
14,083 |
198,336 |
|
13 |
61,1 |
80,245 |
-19,145 |
366,518 |
|
14 |
70,3 |
80,245 |
-9,945 |
98,896 |
|
15 |
85 |
83,048 |
1,952 |
3,811 |
|
|
0,000 |
Ʃ=2210,341 |
Уравнение регрессии для первых 15 значений имеет вид:
= -5,474+1,475х3
В таблицах 17,18,19,20 приведен вывод итогов по последним 15 значениям (n2=15).
Таблица 17. Регрессионная статистика
-
Множественный R
0,872
R-квадрат
0,760
Нормированный R-квадрат
0,741
Стандартная ошибка
31,536
Наблюдения
15
Таблица 18. Дисперсионный анализ
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
1 |
40925,992 |
40925,992 |
41,152 |
2,29E-05 |
Остаток |
13 |
12928,718 |
994,517 |
|
|
Итого |
14 |
53854,709 |
|
|
|
Таблица 19.
Переменная |
Коэффи-циенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Верхние 95% |
Y-пересе-чение |
-69,323 |
34,589 |
-2,004 |
0,066 |
-144,047 |
5,402 |
X 3 |
2,068 |
0,322 |
6,415 |
0,000 |
1,371 |
2,764 |
Таблица 20. Вывод остатков
Наблюдение |
Yi |
Предсказанное Y |
Остатки ei=yi-ŷi |
|
|
1 |
38 |
96,095 |
8,905 |
79,302 |
|
2 |
67 |
98,163 |
33,837 |
1144,971 |
|
3 |
39 |
98,163 |
24,837 |
616,897 |
|
4 |
45 |
98,369 |
-16,369 |
267,956 |
|
5 |
40 |
106,433 |
-21,433 |
459,393 |
|
6 |
40 |
116,565 |
-24,065 |
579,138 |
|
7 |
41 |
116,772 |
53,228 |
2833,214 |
|
8 |
42 |
131,246 |
-44,346 |
1966,576 |
|
9 |
38 |
145,720 |
-17,720 |
314,003 |
|
10 |
67 |
151,923 |
-33,923 |
1150,790 |
|
11 |
100 |
153,991 |
-23,491 |
551,828 |
|
12 |
93 |
154,818 |
45,182 |
2041,404 |
|
13 |
61,1 |
234,632 |
-7,632 |
58,249 |
|
14 |
70,3 |
240,835 |
-5,835 |
34,050 |
|
15 |
85 |
251,174 |
28,826 |
830,947 |
|
|
0,000 |
Ʃ=12928,718 |
Уравнение регрессии для последних 15 значений имеет вид:
= -69,323+2,068х3
Расчетный критерий Фишера:
т.к. , то Fрасч.= =
Табличное значение критерия Фишера:
Fтабл(α; k1; k2), где k1=n1-m=15-2=13, m- количество параметров (m=2);
k2 =n-n1-m=40-15-2=23.
Fтабл(0,05; 13; 23)=2,175
Т.к. Fрасч > Fтабл, имеет место гетероскедастичность, поэтому последнее свойство не выполняется → модель нужно уточнять.
Для оценки влияния факторов на результат используют коэффициент эластичности (Э) и β-коэффициент, которые соответственно рассчитываются по формулам:
Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора на один процент.
=1,147% , т.е. цена квартиры увеличится на 1,147%, если фактор х3 (общая площадь квартиры) увеличится на 1%.
Данные для а3=1,592 - берем из табл.5; для =72,925 – из табл.7;
для =101,238 – из табл.11.
, где
- среднеквадратическое отклонение фактора хj и y.
β-коэффициент показывает, на какую часть своего среднего квадратического отклонения (СКО) изменяется в среднем значение зависимой переменной (y), если один из факторов (хj) увеличить на величину СКО.
Для расчета β-коэффициента (для фактора х3) необходимо рассчитать первоначально среднеквадратическое отклонение переменных x и y, значения для которых приведены в таблице 21.
Таблица 20. Значения для расчета среднеквадратического отклонения х и y
№ |
|
|
yt |
|
№ |
|
|
yt |
|
|
||||||
1 |
41,9 |
962,551 |
38 |
3998,981 |
21 |
60 |
167,056 |
60 |
1700,531 |
|
||||||
2 |
69 |
15,406 |
62,2 |
1523,926 |
22 |
35 |
1438,306 |
41 |
3628,556 |
|
||||||
3 |
67 |
35,106 |
125 |
564,656 |
23 |
75 |
4,306 |
90 |
126,281 |
|
||||||
4 |
58,1 |
219,781 |
61,1 |
1611,019 |
24 |
69,5 |
11,731 |
83 |
332,606 |
|
||||||
5 |
32 |
1674,856 |
67 |
1172,206 |
25 |
32,8 |
1610,016 |
45 |
3162,656 |
|
||||||
6 |
57,2 |
247,276 |
93 |
67,856 |
26 |
32 |
1674,856 |
39 |
3873,506 |
|
||||||
7 |
107 |
1161,106 |
118 |
280,981 |
27 |
97 |
579,606 |
86,9 |
205,564 |
|
||||||
8 |
81 |
65,206 |
132 |
946,331 |
28 |
32,8 |
1610,016 |
40 |
3750,031 |
|
||||||
9 |
89,9 |
288,151 |
92,5 |
76,344 |
29 |
71,3 |
2,641 |
80 |
451,031 |
|
||||||
10 |
75 |
4,306 |
105 |
14,156 |
30 |
147 |
5487,106 |
227 |
15816,206 |
|
||||||
11 |
36 |
1363,456 |
42 |
3509,081 |
31 |
150 |
5940,556 |
235 |
17892,406 |
|
||||||
12 |
72,9 |
0,001 |
125 |
564,656 |
32 |
34 |
1515,156 |
40 |
3750,031 |
|
||||||
13 |
90 |
291,556 |
170 |
4728,281 |
33 |
47 |
672,106 |
67 |
1172,206 |
|
||||||
14 |
29 |
1929,406 |
38 |
3998,981 |
34 |
81 |
65,206 |
123 |
473,606 |
|
||||||
15 |
108 |
1230,256 |
130,5 |
856,294 |
35 |
57 |
253,606 |
100 |
1,531 |
|
||||||
16 |
60 |
167,056 |
85 |
263,656 |
36 |
80 |
50,056 |
105 |
14,156 |
|
||||||
17 |
80 |
50,056 |
98 |
10,481 |
37 |
58,1 |
219,781 |
70,3 |
957,129 |
|
||||||
18 |
104 |
965,656 |
128 |
716,231 |
38 |
81,1 |
66,831 |
82 |
370,081 |
|
||||||
19 |
85 |
145,806 |
85 |
263,656 |
39 |
155 |
6736,306 |
280 |
31956,031 |
|
||||||
20 |
70 |
8,556 |
160 |
3453,031 |
40 |
108,4 |
1258,476 |
200 |
9754,031 |
|
||||||
|
|
Ʃ=40189,255 |
|
Ʃ=128008,994 |
|
|
|
|
|
9754,031 |
Т.е. при увеличении общей площади квартиры на 0,892 кв.м цена на квартиру увеличится на 51,104 тыс.долл. (0,892*57,291).
Долю влияния фактора в суммарном влиянии всех факторов показывает
Δ – коэффициент: , где — коэффициент парной корреляции между фактором j (j = 1,...,m) и зависимой переменной (табл.2), R2 – коэффициент детерминации (табл.3).
=(0,892*0,892)/0,792=1
Вывод: на 100% изменение результата Y (цена квартиры) происходит под влиянием фактора х3 (общая площадь квартиры), включенного в модель.
Задача 2. Исследовать динамику экономического показателя на основе анализа одномерного временного ряда
В течение девяти последовательных недель фиксировался спрос Y(t) (млн.руб.) на кредитные ресурсы финансовой компании. Временной ряд Y(t) этого показателя приведен ниже:
Номер варианта |
Номер наблюдения (t=1,2,…,9) |
||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
|
6 |
12 |
15 |
16 |
19 |
17 |
20 |
24 |
25 |
28 |
Требуется:
проверить наличие аномальных наблюдений;
построить линейную модель (t)= , параметры которых оценить МНК ( (t)- расчетные, смоделированные значения временного ряда);
оценить адекватность построенных моделей, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения (при использовании R/S- критерия взять табулированные границы 2,7-3,7);
оценить точность моделей на основе использования средней относительной ошибки аппроксимации;
по построенной модели осуществить прогноз спроса на следующие две недели (доверительный интервал прогноза рассчитать при доверительной вероятности р=70%);
фактические значения показателя, результаты моделирования и прогнозирования представить графически.
Вычисления провести с одним знаком в дробной части.
РЕШЕНИЕ:
1.Выявление аномальных наблюдений является обязательной процедурой этапа предварительного анализа данных. Так как наличие аномальных наблюдений приводит к искажению результатов моделирования, то необходимо убедиться в отсутствии аномалий данных. Используя метод Ирвина вычислим величину λt по формуле:
Результаты расчетов по методу Ирвина приведены в табл. 1
Таблица 1. Выявление аномальных наблюдений
|
A |
B |
C |
D |
||
1 |
t |
Y(t) |
(yt-ȳ)2 |
λ(t) |
||
2 |
1 |
12 |
57,1 |
|
||
3 |
2 |
15 |
20,8 |
0,6 |
||
4 |
3 |
16 |
12,6 |
0,2 |
||
5 |
4 |
19 |
0,3 |
0,6 |
||
6 |
5 |
17 |
6,5 |
0,4 |
||
7 |
6 |
20 |
0,2 |
0,6 |
||
8 |
7 |
24 |
19,8 |
0,8 |
||
9 |
8 |
25 |
29,6 |
0,2 |
||
10 |
9 |
28 |
71,3 |
0,6 |
||
Ʃ = 176 |
Ʃ= 218,2 |
|
В нашем примере
Полученные расчеты подставим в формулу и найдем λt. Рассчитанная величина λt не превышает табличное значение, поэтому подозрение в аномальности наблюдений отсутствует.
2. Построение линейной модели Y(t)=а0+а1t:
1) Оценку параметров линейной модели регрессии Y от t проведем с помощью надстройки Excel Анализ данных. Для этого необходимо выполнить следующие действия:
в диалоговом окне Анализ данных выбрать инструмент Регрессия;
в диалоговом окне Регрессия в поле Входной интервал Y ввести адрес одного диапазона ячеек, который представляет зависимую переменную (Y(t)=12,15,16,19,17,20,24,25,28); в поле Входной интервал X – значения независимой переменной t =1,2,3,…9.
в полях График подбора и Остатки ставим флажок.
Результат регрессионного анализа представлен в табл.2 и 3.
Таблица 2. Результат регрессионного анализа
Переменная |
Коэффициенты |
|
Стандартная ошибка |
|
t-статистика |
|
Y-пересечение |
а0 |
10,3 |
|
1,0 |
|
10,5 |
t |
а1 |
1,85 |
|
0,2 |
|
10,6 |
Во втором столбец таблицы 2 содержатся коэффициенты уравнения регрессии а0, а1.
Кривая роста зависимости спроса от времени имеет вид: Y(t)=а0+а1t=10,3+1,85t
Таблица 3. Вывод остатка
Наблюдение |
Предсказанное Y |
Остатки |
1 |
12,2 |
-0,2 |
2 |
14,0 |
1,0 |
3 |
15,9 |
0,1 |
4 |
17,7 |
1,3 |
5 |
19,6 |
-2,6 |
6 |
21,4 |
-1,4 |
7 |
23,3 |
0,7 |
8 |
25,1 |
-0,1 |
9 |
27 |
1,0 |
2) Оценка параметров модели «вручную» в таблице 4 приведены расчеты параметров линейной модели по формулам:
â0= ȳ - â1t
Таблица 4.
t |
yt |
t- |
(t- 2 |
yt-ȳ |
(t- (yt-ȳ) |
ŷt=â0+â1t |
et=yt-ŷt |
1 |
12 |
-4 |
16 |
-7, 6 |
30,2 |
12,2 |
-0,2 |
2 |
15 |
-3 |
9 |
-4, 6 |
13,7 |
14,0 |
1,0 |
3 |
16 |
-2 |
4 |
-3, 6 |
7,1 |
15,9 |
0,1 |
4 |
19 |
-1 |
1 |
-0, 6 |
0,6 |
17,7 |
1,3 |
5 |
17 |
0 |
0 |
-2, 6 |
0,0 |
19,6 |
-2, 6 |
6 |
20 |
1 |
1 |
0,4 |
0,4 |
21,4 |
-1,4 |
7 |
24 |
2 |
4 |
4,4 |
8,9 |
23,3 |
0,7 |
8 |
25 |
3 |
9 |
5,4 |
16,3 |
25,1 |
-0,1 |
9 |
28 |
4 |
16 |
8,4 |
33,8 |
27 |
1,0 |
срзнач=5 |
срзнач=19,6 |
|
Ʃ=60 |
срзнач=0 |
Ʃ=111 |
|
срзнач=0 |
В результате расчетов получаем те же результаты:
â0= ȳ - â1t= 19,6-1,85*5=10,3
.