- •Прогнозування економічних показників за допомогою пакета Microsoft Excel.
- •Загальна характеристика методів прогнозування та їх використання
- •2. Прогнозування на основі динамічних рядів.
- •Методи експоненційного згладжування
- •3. Прогнозування за допомогою статистичних функцій
- •4. Багатофакторна регресія
4. Багатофакторна регресія
У реальній дійсності всі економічні процеси взаємопов’язані і часто потрібно визначити ступінь такого зв'язку і вплив на майбутні періоди. Тобто прогнозування повинно йти з урахуванням впливу найбільше істотних факторів. Природно, що для такого прогнозування потрібний більш великий статистичний матеріал. Наприклад, комерційний агент, займаючись підготовкою офісних будинків ділового району для продажу, намагається прогнозувати ціну будинку в залежності від його площі, кількості офісів, входів, часу експлуатації. Відомі дані по 11 будинках приведені в таблиці:
N |
Площа (Х1) |
Офіси (Х2) |
Входи (Х3) |
Термін (Х4) |
Ціна (У) |
1 |
2310 |
2 |
2 |
20 |
142000 |
2 |
2333 |
2 |
2 |
12 |
144000 |
3 |
2356 |
3 |
1,5 |
33 |
151000 |
4 |
2379 |
3 |
2 |
43 |
151000 |
5 |
2402 |
2 |
3 |
53 |
139000 |
6 |
2425 |
4 |
2 |
23 |
169000 |
7 |
2448 |
2 |
1,5 |
99 |
126000 |
8 |
2471 |
2 |
2 |
34 |
142000 |
9 |
2494 |
3 |
3 |
23 |
163000 |
10 |
2517 |
4 |
4 |
55 |
169000 |
11 |
2540 |
2 |
3 |
22 |
149000 |
“Пів-входу” означає вхід тільки для доставки кореспонденції.
Стартовою точкою для подальшого аналізу і добору підхожої статистичної моделі є оцінка середнього, стандартних помилок, довірчого рівня і т.д., що можна одержати за допомогою методів описової статистики пакета Exсel.
Показники |
Площа |
Офіси |
Входи |
Термін |
Ціна |
|
|
|
|
|
|
Середнє |
2425,00 |
2,64 |
2,36 |
37,91 |
149545,45 |
Стандартна помилка |
23,00 |
0,24 |
0,23 |
7,39 |
3991,73 |
Медіана |
2425,00 |
2,00 |
2,00 |
33,00 |
149000,00 |
Мода |
#Н/Д |
2,00 |
2,00 |
23,00 |
142000,00 |
Стандартне відхилення |
76,28 |
0,81 |
0,78 |
24,51 |
13239,06 |
Дисперсія вибірки |
5819,00 |
0,65 |
0,60 |
600,69 |
175272727,27 |
Ексцес |
-1,20 |
-0,76 |
0,28 |
3,34 |
-0,31 |
Асиметр. |
0,00 |
0,85 |
0,94 |
1,68 |
0,10 |
Інтервал |
230,00 |
2,00 |
2,50 |
87,00 |
43000,00 |
Мінімум |
2310,00 |
2,00 |
1,50 |
12,00 |
126000,00 |
Максимум |
2540,00 |
4,00 |
4,00 |
99,00 |
169000,00 |
Сума |
26675,00 |
29,00 |
26,00 |
417,00 |
1645000,00 |
Рахунок |
11,00 |
11,00 |
11,00 |
11,00 |
11,00 |
Рів. надійності (95%) |
45,08 |
0,48 |
0,46 |
14,48 |
7823,63 |
Далі виконують оцінку наявності зв'язків між змінюваною ознакою і шляхом побудови кореляційної моделі, що впливає. Можна використовувати функцію КОРРЕЛ або метод Кореляция з надбудови Анализ данных пункту меню Сервис (пакет Exсel).
Кореляція | |||||
|
Площа |
Офіси |
Входи |
Термін |
Ціна |
Площа |
1 |
|
|
|
|
Офіси |
0,223607 |
1 |
|
|
|
Входи |
0,620453 |
0,310714406 |
1 |
|
|
Термін |
0,221437 |
-0,0522657 |
-0,05 |
1 |
|
Ціна |
0,318841 |
0,879305911 |
0,5083 |
-0,443316 |
1 |
Найбільш тісний зв'язок між ціною і кількістю розміщуваних у будинку офісів, кількістю наявних входів і найменший - із площею. Оскільки в поставленій задачі факторів не так багато і усі вони мають зв'язок із залежним показником, то усі вони мають бути включені в модель.
Напрямок і розмір асоційованості наборів даних визначають за допомогою функції КОВАР або методу Ковариация з надбудови Анализ данных пакета.
Коваріація | |||||
|
Площа |
Офіси |
Входи |
Термін |
Ціна |
Площа |
5290 |
|
|
|
|
Офіси |
12,54545 |
0,595041322 |
|
|
|
Входи |
33,45455 |
0,17768595 |
0,5496 |
|
|
Термін |
376,3636 |
-0,94214876 |
-0,88 |
546,0826446 |
|
Ціна |
292727,3 |
8561,983471 |
4756,2 |
-130768,6 |
159338843 |
Залежний параметр Ціна має позитивну коваріацію з усіма наборами незалежних факторів, крім Терміна. Тобто великим значенням площі, кількості офісів і входів відповідають великі значення ціни, а для великих значень термінів - менші значення ціни.
У такий спосіб приведений приклад являє собою багатофакторну модель.
Звичайно прогноз розробляється в декількох варіантах, кожний із яких можливий з деякою ймовірністю. Придатність прогнозу визначається шляхом зіставлення фактичної динаміки з динамікою, отриманої за прогнозом. Наприклад, у пакеті Exсel виконати прогноз з урахуванням ряду факторів можна за допомогою функцій Тенденция (для лінійної і поліномиальної залежностей) і Рост (для экспоненціальної залежності), а також за допомогою методу Регрессия з надбудови Анализ данных. Результати прогнозу по усім вище зазначеним функціям і методам зведені в таблицю 1. Крім того, при прогнозуванні за допомогою методу Регрессия користувачу видається таблиця дисперсійного аналізу, коефіцієнти регресійного рівняння, стандартні помилки обчислення і коефіцієнтів, по яких можна бачити достовірність прогнозу, число використовуваних ступенів свободи і розрахункові критерії для оцінки прогнозних результатів (F- і t- критерії).
ВИСНОВОК РЕЗУЛЬТАТІВ | |
|
|
Регресіоная статистика | |
Множинний R |
1,00 |
R-квадрат |
1,00 |
Нормований R-квадрат |
0,99 |
Стандартна помилка |
954,25 |
Спостереження |
11,00 |
|
|
Коефіцієнт детермінованості R-квадрат указує на сильну залежність між незалежними перемінними і продажною ціною. Проте це ще не гарантує не випадковість результату. Необхідна перевірка по критеріях, що можна одержати з такої таблиці ( видається ПК ):
ANOVA |
|
|
|
|
|
|
ступеня свободи |
Регрес. сума квадратів |
MS |
F-статистика |
Значимість F |
Регресія |
4,00 |
1747263697,28 |
436815924,32 |
479,70 |
0,00 |
Залишок |
6,00 |
5463575,44 |
910595,91 |
|
|
Разом |
10,00 |
1752727272,73 |
|
|
|
|
|
|
|
|
|
|
Коефіцієнти |
Стандартна помилка |
t-статистика |
P-Значення |
|
Y-перетинання |
58695,61 |
12031,51 |
4,88 |
0,00 |
|
Площа |
24,64 |
5,34 |
4,62 |
0,00 |
|
Офіси |
12704,67 |
393,34 |
32,30 |
0,00 |
|
Входи |
2679,80 |
521,74 |
5,14 |
0,00 |
|
Термін |
-230,23 |
13,04 |
-17,65 |
0,00 |
|
|
Нижні 95% |
Верхні 95% |
Нижні 95. 000% |
Верхні 95. 000% |
Y-перетинання |
29255,56 |
88135,67 |
29255,5576 |
88135,6696 |
Площа |
11,58 |
37,70 |
11,5772 |
37,7007 |
Офіси |
11742,21 |
13667,13 |
11742,2071 |
13667,1302 |
Входи |
1403,14 |
3956,46 |
1403,1434 |
3956,4600 |
Термін |
-262,15 |
-198,31 |
-262,1494 |
-198,3103 |
Розрахунковий розмір F= 479,7, а F-критичне вибирається з будь-якого довідника по математичній статистиці. При можливості достовірного результату 95%, і числі ступенів свободи v1=4 і v2=6 Fкр=4,53. Розрахунковий розмір F помітно більший, чим табличний, що говорить про те, що отримане регресійне рівняння корисно для передрікання оцінної вартості будинків у даному районі.
Інший критерій (t-статистика), що є в регресійній статистиці, дозволяє оцінити корисність кожного з незалежних факторів для прогнозування ціни. Наприклад, для терміна експлуатації t=-17,65, а t-критичне при достовірності прогнозу 95% і з 6 ступенями свободи дорівнює 1.94. Оскільки абсолютний розмір t.>tкр, то термін експлуатації важлива перемінна для оцінки вартості будинку під офіс. Аналогічно можна протестувати всі інші перемінні на статистичну значимість. Якщо t для цих перемінних більше, чим 1.94, значить усі вони корисні для прогнозування. Регресійна модель записується з використанням обчислених коефіцієнтів у такий спосіб:
У = 24,64Х1 + 12704,67Х2 + 2679,8Х3 – 230,23Х4 + 58695,61
Метод Регресія відразу виводить таблицю розрахункових цін по всіх наявних об'єктах і відхилення від фактичних.
ВИСНОВОК ЗАЛИШКУ | |||
Будинок |
Прогноз |
Залишки |
Стандартні залишки |
1 |
141775,92 |
224,08 |
0,23 |
2 |
144184,45 |
-184,45 |
-0,19 |
3 |
151281,09 |
-281,09 |
-0,29 |
4 |
150885,39 |
114,61 |
0,12 |
5 |
139124,92 |
-124,92 |
-0,13 |
6 |
169328,05 |
-328,05 |
-0,34 |
7 |
125648,04 |
351,96 |
0,37 |
8 |
142519,57 |
-519,57 |
-0,54 |
9 |
161003,27 |
1996,73 |
2,09 |
10 |
169587,08 |
-587,08 |
-0,62 |
11 |
149662,22 |
-662,22 |
-0,69 |
Висновок можливості
Персентиль |
Ціна |
4,55 |
126000,00 |
13,64 |
139000,00 |
22,73 |
142000,00 |
31,82 |
142000,00 |
40,91 |
144000,00 |
50,00 |
149000,00 |
59,09 |
151000,00 |
68,18 |
151000,00 |
77,27 |
163000,00 |
86,36 |
169000,00 |
95,45 |
169000,00 |
Разом із розрахунковими розмірами прогнозованого параметра і їхніх оцінних характеристик можна одержати цілий ряд графіків, що наочно подають взаємозв'язок залежного розміру з кожним фактором окремо, а також графіки залишків по кожному фактору.
Використання різних методів прогнозування, супроводжувальний графічний матеріал повинні послужити основою для обґрунтування спеціалістом своїх висновків.