ЛР №14 - МЕТОДИЧКА
.doc
ЕКОНОМІКО-МАТЕМАТИЧНЕ МОДЕЛЮВАННЯ |
КАФЕДРА ЕКОНОМІЧНОЇ КІБЕРНЕТИКИ |
ЛАБОРАТОРНА РОБОТА №14
Тема: Гетероскедастичність залишків.
Мета роботи: Навчитися досліджувати та будувати економетричні моделі з урахуванням гетероскедастичності залишків за допомогою методу Ейткена.
Задача. Дослідити наявність гетероскедастичності за допомогою параметричного методу Гольдфельда-Квандта. Оцінити параметри економетричної моделі за допомогою методу Ейткена. Зробити точковий та інтервальний прогнози при Х=38 та зробити порівняльну характеристику результатів 1МНК та методу Ейткена. Вихідні дані факторів Y та Х та їх перетворення наведені у таблиці 14.1.
Таблиця 14.1. Заощадження та доход на душу населення
№ п/п |
Заощадження, Yi |
Доход, Xi |
Yр |
еі=Yi-Yрi |
|ei| |
Y*=Yi/|ei| |
X*=1/|ei| |
Xi*=Xi/|ei| |
Y*p=b0X*+b1X*1i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
1 |
264 |
8,777 |
78,088 |
185,912 |
185,912 |
1,420 |
0,005 |
0,047 |
1,190 |
2 |
105 |
9,210 |
115,620 |
-10,620 |
10,620 |
9,887 |
0,094 |
0,867 |
21,836 |
3 |
90 |
9,954 |
180,110 |
-90,110 |
90,110 |
0,999 |
0,011 |
0,110 |
2,778 |
4 |
131 |
10,508 |
228,130 |
-97,130 |
97,130 |
1,349 |
0,010 |
0,108 |
2,719 |
5 |
122 |
10,979 |
268,956 |
-146,956 |
146,956 |
0,830 |
0,007 |
0,075 |
1,876 |
6 |
107 |
11,912 |
349,828 |
-242,828 |
242,828 |
0,441 |
0,004 |
0,049 |
1,231 |
7 |
406 |
12,747 |
422,205 |
-16,205 |
16,205 |
25,054 |
0,062 |
0,787 |
19,721 |
8 |
503 |
13,499 |
487,388 |
15,612 |
15,612 |
32,219 |
0,064 |
0,865 |
21,665 |
9 |
431 |
14,269 |
554,131 |
-123,131 |
123,131 |
3,500 |
0,008 |
0,116 |
2,902 |
10 |
588 |
15,522 |
662,741 |
-74,741 |
74,741 |
7,867 |
0,013 |
0,208 |
5,196 |
11 |
898 |
16,730 |
767,449 |
130,551 |
130,551 |
6,879 |
0,008 |
0,128 |
3,204 |
12 |
950 |
17,663 |
848,321 |
101,679 |
101,679 |
9,343 |
0,010 |
0,174 |
4,342 |
13 |
779 |
18,575 |
927,373 |
-148,373 |
148,373 |
5,250 |
0,007 |
0,125 |
3,128 |
14 |
819 |
19,635 |
1019,253 |
-200,253 |
200,253 |
4,090 |
0,005 |
0,098 |
2,449 |
15 |
1222 |
21,163 |
1151,699 |
70,301 |
70,301 |
17,382 |
0,014 |
0,301 |
7,514 |
16 |
1702 |
22,880 |
1300,528 |
401,472 |
401,472 |
4,239 |
0,002 |
0,057 |
1,422 |
17 |
1578 |
24,127 |
1408,617 |
169,383 |
169,383 |
9,316 |
0,006 |
0,142 |
3,552 |
18 |
1654 |
25,604 |
1536,642 |
117,358 |
117,358 |
14,094 |
0,009 |
0,218 |
5,439 |
19 |
1400 |
26,500 |
1614,307 |
-214,307 |
214,307 |
6,533 |
0,005 |
0,124 |
3,082 |
22 |
2017 |
27,430 |
1694,919 |
322,081 |
322,081 |
6,262 |
0,003 |
0,085 |
2,122 |
20 |
1829 |
27,670 |
1715,722 |
113,278 |
113,278 |
16,146 |
0,009 |
0,244 |
6,087 |
24 |
1600 |
28,150 |
1757,328 |
-157,328 |
157,328 |
10,170 |
0,006 |
0,179 |
4,458 |
21 |
2200 |
28,300 |
1770,330 |
429,670 |
429,670 |
5,120 |
0,002 |
0,066 |
1,641 |
23 |
2105 |
29,560 |
1879,546 |
225,454 |
225,454 |
9,337 |
0,004 |
0,131 |
3,266 |
25 |
2250 |
32,100 |
2099,712 |
150,288 |
150,288 |
14,971 |
0,007 |
0,214 |
5,319 |
26 |
2420 |
32,500 |
2134,384 |
285,616 |
285,616 |
8,473 |
0,004 |
0,114 |
2,833 |
28 |
1720 |
33,500 |
2221,063 |
-501,063 |
501,063 |
3,433 |
0,002 |
0,067 |
1,665 |
27 |
2570 |
35,250 |
2372,752 |
197,248 |
197,248 |
13,029 |
0,005 |
0,179 |
4,449 |
29 |
1900 |
36,000 |
2437,761 |
-537,761 |
537,761 |
3,533 |
0,002 |
0,067 |
1,666 |
30 |
2100 |
36,200 |
2455,097 |
-355,097 |
355,097 |
5,914 |
0,003 |
0,102 |
2,537 |
прог |
|
38,000 |
2611,12 |
|
76,706 |
|
0,01304 |
0,495 |
12,328 |
Нехай між заощадженням (Y) та доходом на душу населення (Х) існує лінійна залежність . Обчисливши параметри моделі за 1МНК, отримаємо наступні параметри:
86,67941 |
-682,697 |
5,097062 |
120,2584 |
0,911726 |
245,2577 |
289,1958 |
28 |
17395523 |
1684238 |
Або таку модель:
Щоб перевірити відсутня чи присутня гетероскедастичність скористаємося параметричним тестом Гольфельда-Квандта:
1. Упорядковуємо значення змінної Х у порядку зростання (Данные/Сортировка).
2. Відкидаємо k спостережень, які знаходяться в центрі. Експерименти, що проводили Гольдфельд і Квантом показали, що для вибірок, коли n>30, оптимальна кількість спостережень k, не врахованих у тесті, приблизно задовольняє співвідношення:
В нашому випадку:
Отже, виключимо 8 центральних значень змінної Х, а саме №№ 12-19.
3. Будуємо дві економетричні моделі на основі 1МНК за двома сукупностями спостережень (n–k)/2 при умові, що (n–k)/2 не перевищує кількість змінних m.
Одержимо дві підвибірки – перша з найменшими значеннями Х, друга – з найбільшими значеннями Х. Для кожної з них побудуємо лінійну регресію та розрахуємо параметри 1МНК. Вихідні дані та їх перетворення наведені в таблиці 14.2.
Таблиця 14.2
Підвибірка І |
Підвибірка ІІ |
||||||||||
n1 |
Y |
XI |
Yp |
е1і=Yi-Yрi |
е12 |
n2 |
Y |
XII |
Yp |
е1і=Yi-Yрi |
е22 |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
1 |
264 |
8,777 |
30,003 |
233,997 |
54754,388 |
1 |
2017 |
27,430 |
1952,721 |
64,279 |
4131,80 |
2 |
105 |
9,210 |
68,219 |
36,781 |
1352,837 |
2 |
1829 |
27,670 |
1959,297 |
-130,297 |
16977,27 |
3 |
90 |
9,954 |
133,883 |
-43,883 |
1925,704 |
3 |
1600 |
28,150 |
1972,449 |
-372,449 |
138718,05 |
4 |
131 |
10,508 |
182,778 |
-51,778 |
2680,926 |
4 |
2200 |
28,300 |
1976,559 |
223,441 |
49926,02 |
5 |
122 |
10,979 |
224,347 |
-102,347 |
10474,923 |
5 |
2105 |
29,560 |
2011,082 |
93,918 |
8820,53 |
6 |
107 |
11,912 |
306,692 |
-199,692 |
39876,725 |
6 |
2250 |
32,100 |
2080,678 |
169,322 |
28670,05 |
7 |
406 |
12,747 |
380,387 |
25,613 |
656,035 |
7 |
2420 |
32,500 |
2091,638 |
328,362 |
107821,90 |
8 |
503 |
13,499 |
446,757 |
56,243 |
3163,312 |
9 |
1720 |
33,500 |
2119,037 |
-399,037 |
159230,75 |
9 |
431 |
14,269 |
514,715 |
-83,715 |
7008,228 |
8 |
2570 |
35,250 |
2166,987 |
403,013 |
162419,63 |
10 |
588 |
15,522 |
625,302 |
-37,302 |
1391,451 |
10 |
1900 |
36,000 |
2187,537 |
-287,537 |
82677,30 |
11 |
898 |
16,730 |
731,918 |
166,082 |
27583,381 |
11 |
2100 |
36,200 |
2193,017 |
-93,017 |
8652,08 |
Σ |
|
|
|
|
150867,91 |
Σ |
|
|
|
|
768045,39 |
В результаті обчислень, отримаємо:
І підвибірка:
88,25778 |
-744,635 |
15,7053 |
195,4108 |
0,778216 |
129,4724 |
31,58011 |
9 |
529380,6 |
150867,9 |
ІІ підвибірка:
27,39973 |
1201,146 |
26,86746 |
851,2846 |
0,103587 |
292,1273 |
1,040015 |
9 |
88753,16 |
768045,4 |
4. Знаходимо суму залишків і за першою і другою моделями.
5. За отриманими результатами, розрахуємо критерій R*, який знайдемо за формулою:
.
Звідси, R*=5,091.
Порівняємо його з табличним значенням F-критерію на рівні значимості 0,05 та числах ступенів свободи:
.
Fтаб=3,179.
Так як R*>Fтаб, то отримана нами модель гетероскедастична.
Таким чином, на основі параметричного тесту Гольдфельда-Квандта ми отримали, що в побудованій економетричній моделі виявлено змішану гетероскедастичність. Це значить, що користуватися 1МНК для оцінки параметрів моделі не можна.
При гетероскедастичності для оцінки параметрів моделі слід користуватися узагальненим методом найменших квадратів (методом Ейткена).
Всі змінні рівняння регресії діляться на абсолютні значення залишків моделі. Утворюються нові змінні (6-10 стовпці таблиці 14.1,):
.
Отримаємо нову модель:
В результаті обчислень, отримаємо:
24,79118 |
3,572894 |
3,8366524 |
1,148515 |
0,5985846 |
4,651395 |
41,753174 |
28 |
903,34982 |
605,7933 |
Після перетворень аналізуємо модель:
.
Економетричний аналіз:
1. Якість моделі.
Помилка моделі Е=4,6514.
У відсотках до Yc похибка становить приблизно 0,4%<15%. Отже модель якісна.
2. Коефіціент детермінації.
Маємо, R2=0,5996.
У відсотках R2=59,86%. Отже, приблизно 60% вихідних даних відповідають отриманій регресії.
3. Достовірність моделі.
Значення критерію Фішера F=41,753.
Перевіримо достовірність отриманої моделі. для цього обчислимо табличне значення критерію Фішера на рівні значимості α=0,95 та числу степенів свободи m1=1 та m2=28.
Fтаб=4,196
Так як , то отримана нами модель достовірна з ймовірністю 0,95.