Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Модуль2 (прогноз).doc
Скачиваний:
34
Добавлен:
21.02.2016
Размер:
401.41 Кб
Скачать

4. Багатофакторна регресія

У реальній дійсності всі економічні процеси взаємопов’язані і часто потрібно визначити ступінь такого зв'язку і вплив на майбутні періоди. Тобто прогнозування повинно йти з урахуванням впливу найбільше істотних факторів. Природно, що для такого прогнозування потрібний більш великий статистичний матеріал. Наприклад, комерційний агент, займаючись підготовкою офісних будинків ділового району для продажу, намагається прогнозувати ціну будинку в залежності від його площі, кількості офісів, входів, часу експлуатації. Відомі дані по 11 будинках приведені в таблиці:

N

Площа (Х1)

Офіси (Х2)

Входи (Х3)

Термін (Х4)

Ціна (У)

1

2310

2

2

20

142000

2

2333

2

2

12

144000

3

2356

3

1,5

33

151000

4

2379

3

2

43

151000

5

2402

2

3

53

139000

6

2425

4

2

23

169000

7

2448

2

1,5

99

126000

8

2471

2

2

34

142000

9

2494

3

3

23

163000

10

2517

4

4

55

169000

11

2540

2

3

22

149000

“Пів-входу” означає вхід тільки для доставки кореспонденції.

Стартовою точкою для подальшого аналізу і добору підхожої статистичної моделі є оцінка середнього, стандартних помилок, довірчого рівня і т.д., що можна одержати за допомогою методів описової статистики пакета Exсel.

Показники

Площа

Офіси

Входи

Термін

Ціна

Середнє

2425,00

2,64

2,36

37,91

149545,45

Стандартна помилка

23,00

0,24

0,23

7,39

3991,73

Медіана

2425,00

2,00

2,00

33,00

149000,00

Мода

#Н/Д

2,00

2,00

23,00

142000,00

Стандартне відхилення

76,28

0,81

0,78

24,51

13239,06

Дисперсія вибірки

5819,00

0,65

0,60

600,69

175272727,27

Ексцес

-1,20

-0,76

0,28

3,34

-0,31

Асиметр.

0,00

0,85

0,94

1,68

0,10

Інтервал

230,00

2,00

2,50

87,00

43000,00

Мінімум

2310,00

2,00

1,50

12,00

126000,00

Максимум

2540,00

4,00

4,00

99,00

169000,00

Сума

26675,00

29,00

26,00

417,00

1645000,00

Рахунок

11,00

11,00

11,00

11,00

11,00

Рів. надійності (95%)

45,08

0,48

0,46

14,48

7823,63

Далі виконують оцінку наявності зв'язків між змінюваною ознакою і шляхом побудови кореляційної моделі, що впливає. Можна використовувати функцію КОРРЕЛ або метод Кореляция з надбудови Анализ данных пункту меню Сервис (пакет Exсel).

Кореляція

Площа

Офіси

Входи

Термін

Ціна

Площа

1

Офіси

0,223607

1

Входи

0,620453

0,310714406

1

Термін

0,221437

-0,0522657

-0,05

1

Ціна

0,318841

0,879305911

0,5083

-0,443316

1

Найбільш тісний зв'язок між ціною і кількістю розміщуваних у будинку офісів, кількістю наявних входів і найменший - із площею. Оскільки в поставленій задачі факторів не так багато і усі вони мають зв'язок із залежним показником, то усі вони мають бути включені в модель.

Напрямок і розмір асоційованості наборів даних визначають за допомогою функції КОВАР або методу Ковариация з надбудови Анализ данных пакета.

Коваріація

Площа

Офіси

Входи

Термін

Ціна

Площа

5290

Офіси

12,54545

0,595041322

Входи

33,45455

0,17768595

0,5496

Термін

376,3636

-0,94214876

-0,88

546,0826446

Ціна

292727,3

8561,983471

4756,2

-130768,6

159338843

Залежний параметр Ціна має позитивну коваріацію з усіма наборами незалежних факторів, крім Терміна. Тобто великим значенням площі, кількості офісів і входів відповідають великі значення ціни, а для великих значень термінів - менші значення ціни.

У такий спосіб приведений приклад являє собою багатофакторну модель.

Звичайно прогноз розробляється в декількох варіантах, кожний із яких можливий з деякою ймовірністю. Придатність прогнозу визначається шляхом зіставлення фактичної динаміки з динамікою, отриманої за прогнозом. Наприклад, у пакеті Exсel виконати прогноз з урахуванням ряду факторів можна за допомогою функцій Тенденция (для лінійної і поліномиальної залежностей) і Рост (для экспоненціальної залежності), а також за допомогою методу Регрессия з надбудови Анализ данных. Результати прогнозу по усім вище зазначеним функціям і методам зведені в таблицю 1. Крім того, при прогнозуванні за допомогою методу Регрессия користувачу видається таблиця дисперсійного аналізу, коефіцієнти регресійного рівняння, стандартні помилки обчислення і коефіцієнтів, по яких можна бачити достовірність прогнозу, число використовуваних ступенів свободи і розрахункові критерії для оцінки прогнозних результатів (F- і t- критерії).

ВИСНОВОК РЕЗУЛЬТАТІВ

Регресіоная статистика

Множинний R

1,00

R-квадрат

1,00

Нормований R-квадрат

0,99

Стандартна помилка

954,25

Спостереження

11,00

Коефіцієнт детермінованості R-квадрат указує на сильну залежність між незалежними перемінними і продажною ціною. Проте це ще не гарантує не випадковість результату. Необхідна перевірка по критеріях, що можна одержати з такої таблиці ( видається ПК ):

ANOVA

ступеня свободи

Регрес. сума квадратів

MS

F-статистика

Значимість F

Регресія

4,00

1747263697,28

436815924,32

479,70

0,00

Залишок

6,00

5463575,44

910595,91

Разом

10,00

1752727272,73

Коефіцієнти

Стандартна помилка

t-статистика

P-Значення

Y-перетинання

58695,61

12031,51

4,88

0,00

Площа

24,64

5,34

4,62

0,00

Офіси

12704,67

393,34

32,30

0,00

Входи

2679,80

521,74

5,14

0,00

Термін

-230,23

13,04

-17,65

0,00

Нижні 95%

Верхні 95%

Нижні 95. 000%

Верхні 95. 000%

Y-перетинання

29255,56

88135,67

29255,5576

88135,6696

Площа

11,58

37,70

11,5772

37,7007

Офіси

11742,21

13667,13

11742,2071

13667,1302

Входи

1403,14

3956,46

1403,1434

3956,4600

Термін

-262,15

-198,31

-262,1494

-198,3103

Розрахунковий розмір F= 479,7, а F-критичне вибирається з будь-якого довідника по математичній статистиці. При можливості достовірного результату 95%, і числі ступенів свободи v1=4 і v2=6 Fкр=4,53. Розрахунковий розмір F помітно більший, чим табличний, що говорить про те, що отримане регресійне рівняння корисно для передрікання оцінної вартості будинків у даному районі.

Інший критерій (t-статистика), що є в регресійній статистиці, дозволяє оцінити корисність кожного з незалежних факторів для прогнозування ціни. Наприклад, для терміна експлуатації t=-17,65, а t-критичне при достовірності прогнозу 95% і з 6 ступенями свободи дорівнює 1.94. Оскільки абсолютний розмір t.>tкр, то термін експлуатації важлива перемінна для оцінки вартості будинку під офіс. Аналогічно можна протестувати всі інші перемінні на статистичну значимість. Якщо t для цих перемінних більше, чим 1.94, значить усі вони корисні для прогнозування. Регресійна модель записується з використанням обчислених коефіцієнтів у такий спосіб:

У = 24,64Х1 + 12704,67Х2 + 2679,8Х3 – 230,23Х4 + 58695,61

Метод Регресія відразу виводить таблицю розрахункових цін по всіх наявних об'єктах і відхилення від фактичних.

ВИСНОВОК ЗАЛИШКУ

Будинок

Прогноз

Залишки

Стандартні залишки

1

141775,92

224,08

0,23

2

144184,45

-184,45

-0,19

3

151281,09

-281,09

-0,29

4

150885,39

114,61

0,12

5

139124,92

-124,92

-0,13

6

169328,05

-328,05

-0,34

7

125648,04

351,96

0,37

8

142519,57

-519,57

-0,54

9

161003,27

1996,73

2,09

10

169587,08

-587,08

-0,62

11

149662,22

-662,22

-0,69

Висновок можливості

Персентиль

Ціна

4,55

126000,00

13,64

139000,00

22,73

142000,00

31,82

142000,00

40,91

144000,00

50,00

149000,00

59,09

151000,00

68,18

151000,00

77,27

163000,00

86,36

169000,00

95,45

169000,00

Разом із розрахунковими розмірами прогнозованого параметра і їхніх оцінних характеристик можна одержати цілий ряд графіків, що наочно подають взаємозв'язок залежного розміру з кожним фактором окремо, а також графіки залишків по кожному фактору.

Використання різних методів прогнозування, супроводжувальний графічний матеріал повинні послужити основою для обґрунтування спеціалістом своїх висновків.