Прогнозирование
Теперь построим прогноз, т.е. проверим качество модели.
Прогноз – это нахождение оценки неизвестных зависимых переменных У при известных новых параметрах Х на основании построения уравнения регрессии
Мы будем использовать наилучшую модель регрессии – логарифмическую без МЕTRDIST и LIVSP
Логарифмическая модель регрессии
ВЫВОД ИТОГОВ |
|
|
|
|
|
|
|
|
|
|
|
Регрессионная статистика |
|
|
|
|
|
Множественный R |
0,768427764 |
|
|
|
|
R-квадрат |
0,590481229 |
|
|
|
|
Нормированный R-квадрат |
0,582850444 |
|
|
|
|
Стандартная ошибка |
0,166459936 |
|
|
|
|
Наблюдения |
329 |
|
|
|
|
|
|
|
|
|
|
Дисперсионный анализ |
|
|
|
|
|
|
df |
SS |
MS |
F |
Значимость F |
Регрессия |
6 |
12,8649352 |
2,144156 |
77,38145721 |
1,75E-59 |
Остаток |
322 |
8,922269156 |
0,027709 |
|
|
Итого |
328 |
21,78720435 |
|
|
|
|
|
|
|
|
|
|
Коэффициенты |
Стандартная ошибка |
t-статистика |
P-Значение |
Нижние 95% |
Y-пересечение |
2,384934326 |
0,083624559 |
28,51954 |
4,05123E-90 |
2,220415 |
TOTSP |
0,016335467 |
0,002945172 |
5,546524 |
6,08401E-08 |
0,010541 |
KITSP |
0,033004059 |
0,007346841 |
4,492279 |
9,83497E-06 |
0,01855 |
DIST |
-0,029158376 |
0,002470119 |
-11,8044 |
5,7712E-27 |
-0,03402 |
WALK |
0,06104438 |
0,018560323 |
3,288972 |
0,001116811 |
0,02453 |
TEL |
0,117011085 |
0,040758219 |
2,870859 |
0,004364654 |
0,036825 |
BAL |
0,101648227 |
0,021567144 |
4,713106 |
3,63644E-06 |
0,059218 |
Ln y = 2,3849+ 0,0163* TOTSP + 0,0330* KITSP - 0,0291*DIST +0,0610 * WALK +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* TEL + 0, 1016* BAL
(0,0407) (0,0215)
Отложенные 10 наблюдений
PRICE |
TOTSP |
LIVSP |
KITSP |
DIST |
WALK |
МЕTRDIST |
TEL |
BAL |
49,8 |
36 |
19 |
8,5 |
3,5 |
0 |
5 |
1 |
1 |
51,9 |
48 |
26 |
12 |
2,5 |
1 |
5 |
1 |
0 |
51,9 |
56 |
26 |
15 |
8 |
1 |
5 |
1 |
1 |
53 |
32 |
21 |
6 |
3,5 |
1 |
10 |
1 |
0 |
55,1 |
49 |
20 |
12 |
9 |
1 |
5 |
1 |
0 |
55,1 |
52 |
20 |
12 |
9 |
0 |
5 |
1 |
1 |
55,1 |
52 |
20 |
12 |
9 |
1 |
5 |
1 |
1 |
57,2 |
42 |
17 |
11 |
2,5 |
1 |
10 |
1 |
1 |
58,3 |
33 |
20 |
5,5 |
2,5 |
1 |
4 |
1 |
0 |
58,3 |
61 |
25 |
8 |
3 |
0 |
5 |
1 |
1 |
Теперь подставим значения наблюдений в уравнение и найдем значения прогнозных цен:
1. Ln y = 2,3849+ 0,0163* 36 + 0,0330* 8,5 - 0,0291*3,5 +0,0610 * 0 +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* 1 +0,1016* 1 = 3,37
(0,0407) (0,0215)
=29,04801063
2. Ln y = 2,3849+ 0,0163* 48 + 0,0330* 12 - 0,0291*2,5 +0,0610 * 1 +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* 1 + 0,1016* 0 = 3,67
(0,0407) (0,0215)
=39,19503184
3. Ln y = 2,3849+ 0,0163* 56 + 0,0330* 15 - 0,0291*8 +0,0610 * 1 +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* 1 + 0, 1016* 1 = 3, 84
(0,0407) (0,0215)
=46,50221752
4. Ln y = 2,3849+ 0,0163* 32 + 0,0330* 6 - 0,0291*3,5 +0,0610 * 1 +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* 1 + 0, 1016* 0 = 3, 18
(0,0407) (0,0215)
=24,06238902
5. Ln y = 2,3849+ 0,0163* 49 + 0,0330* 12 - 0,0291*9 +0,0610 * 1 +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* 1 + 0, 1016* 0 = 3, 49
(0,0407) (0,0215)
=32,97336123
6. Ln y = 2,3849+ 0,0163* 52 + 0,0330* 12 - 0,0291*9 +0,0610 * 0 +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* 1 + 0, 1016* 1 = 3, 59
(0,0407) (0,0215)
=36,06056911
7. Ln y = 2,3849+ 0,0163* 52 + 0,0330* 12 - 0,0291*9 +0,0610 * 1 +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* 1 + 0,1016* 1 = 3, 65
(0,0407) (0,0215)
=38,32873975
8. Ln y = 2,3849+ 0,0163* 42 + 0,0330* 11 - 0,0291*2,5 +0,0610 * 1 +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* 1 + 0,1016* 1 = 3, 64
(0,0407) (0,0215)
=38,06708508
9. Ln y = 2,3849+ 0,0163* 33 + 0,0330* 5,5 - 0,0291*2,5 +0,0610 * 1 +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* 1 + 0,1016* 0 = 3,2095
(0,0407) (0,0215)
=24,76793814
10. Ln y = 2,3849+ 0,0163* 61 + 0,0330* 8 - 0,0291*3 +0,0610 * 0 +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* 1 + 0,1016* 1 = 3, 77
(0,0407) (0,0215)
=43,57571501
Доверительный интервал = цена +1,96*
Доверительный интервал = цена +1, 96*
Доверительный интервал = цена + 1,96*2,952370742
|
Доверительный интервал |
|
||||
---|---|---|---|---|---|---|
№ |
Цена |
Прогнозир.цены |
Нижняя граница |
Верхняя граница |
|
|
1 |
49,8 |
29,04801063 |
44,013353 |
55,58664654 |
- |
|
2 |
51,9 |
39,19503184 |
46,113353 |
57,68664654 |
- |
|
3 |
51,9 |
46,50221752 |
46,113353 |
57,68664654 |
+ |
|
4 |
53 |
24,06238902 |
47,213353 |
58,78664654 |
- |
|
5 |
55,1 |
32,97336123 |
49,313353 |
60,88664654 |
- |
|
6 |
55,1 |
36,06056911 |
49,313353 |
60,88664654 |
- |
|
7 |
55,1 |
38,32873975 |
49,313353 |
60,88664654 |
- |
|
8 |
57,2 |
38,06708508 |
51,413353 |
62,98664654 |
- |
|
9 |
58,3 |
24,76793814 |
52,513353 |
64,08664654 |
- |
|
10 |
58,3 |
43,57571501 |
52,513353 |
64,08664654 |
- |
Экономическая интерпретация
Построенная нами модель показывает зависимость цены на квартиры от 8 различных параметров. Проведя регрессионный анализ, и построив по имеющимся данным наилучшую модель регрессии, получили уравнение:
Ln y = 2,3849+ 0,0163* TOTSP + 0,0330* KITSP - 0,0291*DIST +0,0610 * WALK +
(0,0029) (0,0073) (0,0024) (0,0185)
0,117* TEL + 0, 1016* BAL
(0,0407) (0,0215)
Коэффициенты при переменных показывают, насколько эти переменные влияет на y, то есть в нашем случае - на цену.
В нашем случае уравнение можно объяснить следующим образом:
2,3849 – средняя цена за квартиру.
При повышении TOTSP(общей площади) на 1 м2 - цена возрастет на 0, 0163.
При повышении KITSP(площади кухни) на 1 м2 - цена возрастет на 0, 03.
При повышении DIST, на 1 км – цена уменьшается на 0, 02. То есть увеличение расстояния до центра на 1 км, происходит уменьшение цены на 0,02.
Возможность добираться до метро пешком (WALK), а не на транспорте поднимает цену на 0,06.
Наличие телефона TEL в квартире увеличивает цену на 0, 11.
Наличие в квартире балкона BAL увеличит цену на 0,1