В. Давнис Прогнозные модели экспертных предпочтений
.pdf3.2. Идентификация случайного эффекта с помощью фиктив ной переменной /|, принимающей только два значения (0 или 1) и формируемой по следующему правилу:
_ |0, |
если |
y,-yt< |
0; |
[1, |
если |
у, — yt |
> 0- |
3.3. Построение регрессионного уравнения с фиктивной и лаговой переменными:
у, = 3114,56 + 31630,72^ + 0,94 yt_y. (6672,99) (5631,03) (0,06)
3.4. Вычисление расчетных значений у , отклонений расчет ных от фактических значений и относительных ошибок в процен тах §г Результаты расчетов представлены в табл. 4.3.
Относительный уровень ошибок хотя и снизился, но для не которых наблюдений остается все же высоким. Очевидно, оста ется еще неучтенный эффект, который требуется идентифициро вать аналогичным образом. При этом нужно оставаться в рамках ограничений, которые необходимо выполнить для успешной ре ализации второго этапа. Суть этих ограничений в том, чтобы в каждой группе наблюдений, на которые делится выборочная со вокупность, было не менее двух наблюдений. В противном слу чае идентификация модели множественного выбора невозможна.
Т а б л и ц а 4.3
У, |
/, |
У,-, |
У |
у, - У, |
8, |
|
16 828 |
0 |
13146 |
15414,70 |
1413,56 |
8,40 |
|
40 325 |
1 |
16 828 |
50 490,76 |
-10 165,74 |
25,21 |
|
73454 |
1 |
40 325 |
72 475,66 |
978,47 |
1,33 |
|
80 206 |
0 |
73454 |
71 842,43 |
8363,44 |
10,43 |
|
115 343 |
1 |
80 206 |
109 790,45 |
5552,64 |
4,81 |
|
109 730 |
0 |
115 343 |
111 036,12 |
-1305,67 |
1,19 |
|
141 |
050 |
1 |
109 730 |
137 415,33 |
3634,63 |
2,58 |
126 618 |
0 |
141 050 |
135088,93 |
-8471,33 |
6,69 |
3.5. Введение фиктивной переменной f2 аналогично fv Замечание. Преследуя цель выполнения сформулированных
выше ограничений при формировании /2, самому маленькому положительному отклонению был присвоен 0 вместо 1.
140
3.6. Построение регрессионного уравнения с двумя фиктивны ми и лаговой переменными:
у, =-2735,06 + 31924,81/, + 9595,63/2 |
+0,95y,_i. |
||
(5141,52) |
(3885,31) |
(3760,31) |
(0,04) |
3.7. Вычисление расчетных значенийyt, отклонений расчетных от фактических значений и относительных ошибок в процентах 5Г Результаты расчетов приведены в табл. 4.4.
Т а б л и ц а 4.4
У, |
/, |
л |
У,-, |
У |
у , - У, |
8, |
16 828 |
0 |
1 |
13146 |
19 321.96 |
-2493,70 |
14,82 |
40 325 |
1 |
0 |
16 828 |
45 141,66 |
-4816,64 |
11,94 |
73454 |
1 |
0 |
40 325 |
67 414,77 |
6039,37 |
8,22 |
80 206 |
0 |
1 |
73454 |
76 489,44 |
3716,43 |
4,63 |
115 343 |
1 |
1 |
80 206 |
114 814,38 |
528,72 |
0,46 |
109 730 |
0 |
0 |
115343 |
106 601,32 |
3129,12 |
2,85 |
141 050 |
1 |
1 |
109 730 |
142 801,41 |
-1751,45 |
1,24 |
126 618 |
0 |
0 |
141 050 |
130 969,46 |
-4351,85 |
3,44 |
Данные табл. 4.4 свидетельствуют о том, что мультитрендовая модель обеспечивает достаточно высокую точность аппрок симации, особенно последних наблюдений. С помощью этой модели удается рассчитать четыре прогнозных траектории, от личающиеся друг от друга на величину случайного эффекта фиксированной величины. Раз эффекты случайны, то необхо димо знать их вероятностный закон распределения. Его иден тификация осуществляется с помощью модели множественного выбора.
Атрибутами (факторами) модели множественного выбора мо гут быть как количественные, так и качественные переменные. Каждый из вариантов есть результат определенной экономической ситуации, которую не всегда удается описать количественными показателями, и поэтому имеет смысл использовать качественные оценки, получаемые с помощью экспертов.
3.8. Нумерация вариантов и определение интервалов для балль ной оценки условий, в которых может сформироваться соответ ствующий вариант (табл. 4.5).
141
|
|
Т а б л и ц а 4.5 |
Ситуация |
Номер варианта |
Баллы |
Очень плохая |
0 |
5 - 2 5 |
Плохая |
] |
1 5 - 40 |
Хорошая |
2 |
3 5 - 75 |
Очень хорошая |
3 |
50 - 90 |
3.9. Экспертная оценка ситуаций, в которых была получена
соответствующая |
прибыль |
(табл. 4.6). |
|
|
|
|
|
|
|
Т а б л и ц а 4.6 |
|
У, |
/, |
Л |
У,, |
Номер варианта |
Баллы |
16 828 |
0 |
1 |
13146 |
1 |
15 |
40 325 |
1 |
0 |
16 828 |
2 |
35 |
73454 |
1 |
0 |
40 325 |
2 |
75 |
80 206 |
0 |
1 |
73454 |
1 |
40 |
115 343 |
1 |
1 |
80 206 |
3 |
50 |
109 730 |
0 |
0 |
115343 |
0 |
5 |
141 050 |
1 |
1 |
109 730 |
3 |
90 |
126 618 |
0 |
0 |
141 050 |
0 |
25 |
3.10. Построение мультиномиальной логит-модели по данным последних двух столбцов табл. 4.6 с помощью пакета STATISTICA.
Результаты моделирования представлены в табл. 4.7. |
|
|
|||||
|
|
|
|
|
Т а б л и ц а |
4.7 |
|
Оценки параметров модели, их стандартные ошибки, |
|||||||
|
статистики Вальда и вероятности |
|
|
||||
Varl - Parameter estimates (Spreadsheetl) |
|
|
|
||||
Distribution: MULTINOMIAL |
|
|
|
|
|||
Link function: LOGIT |
|
|
|
|
|
||
Level |
Level of |
Column |
Estimate |
Standard |
Wald Stat. |
P |
|
Effect of Effect |
Response |
Error |
|
||||
Interc l |
0 |
1 |
9,672 420 |
2,140 278 |
20,42349 |
0,000 |
006 |
"Var2" |
0 |
2 |
-0,270 766 |
0,058 671 |
21,29770 |
0,000 |
004 |
Interc 2 |
1 |
3 |
7,769 844 |
2,044 825 |
14,43817 |
0,000 |
145 |
"Var2" |
1 |
4 |
-0,179 950 |
0,050 178 |
12,86105 |
0,000 |
335 |
Interc 3 |
2 |
5 |
2,192 924 |
1,075929 |
4,15413 |
0,041 |
533 |
"Var2" |
2 |
6 |
-0,035 078 |
0,016 337 |
4,61045 |
0,031778 |
|
Scale |
|
|
1,000 000 |
0,000 000 |
|
|
|
142
Статистика Вальда и вероятность ошибки свидетельствуют об адекватности построенной модели. Сама модель может быть запи сана следующим образом:
Р(А,) =ехр(9,672 - 0,27Lc,-)+exp(7,770 - 0,180*, )+ехр(2Д 93 - 0,035х,);
|
|
ехр(9,672-0,271*,.) |
ъ |
м — ; |
ехр( 7,770-0,180х,) |
|||||||||
P ( |
v |
< |
= |
0 ) |
= |
— т т |
|
(v' |
)=—i^w |
|||||
|
|
|
|
^ ^ 2 0 9 3 - 0 , 0 3 ^ ) |
|
|
|
_ ! _ . |
||||||
|
|
|
|
|
|
1 + Р(А,) |
|
|
|
|
1 + Р(А,) |
|||
3.11. |
|
Расчет |
прогнозных |
оценок _у?+1 д л я |
каждого |
из |
четырех |
|||||||
возможных ситуаций |
по мультитрендовой модели: |
|
|
|||||||||||
|
|
|
|
&+1 = Ь0 |
+ hf\ |
+ hfl |
+ ЪъУг • |
|
|
|
||||
Результаты |
|
расчетов |
представлены |
в табл. 4.8. |
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
Т а |
б л |
и |
ц а 4.8 |
|
|
Номер варианта |
А |
|
А |
|
U+1 |
|
|
|||||
|
|
|
|
0 |
|
|
0 |
|
0 |
|
117 288,69 |
|
|
|
|
|
|
|
1 |
|
|
0 |
|
1 |
|
126 884,32 |
|
|
|
|
|
|
|
2 |
|
|
1 |
|
0 |
|
149 213,51 |
|
|
|
|
|
|
|
3 |
|
|
1 |
|
1 |
|
158 809,13 |
|
|
3.12. Вычисление вероятностей получения той или иной вели чины прибыли с учетом экспертной оценки ожидаемой экономи ческой ситуации. Результаты расчетов при экспертной оценке, равной 60 баллам, представлены в табл. 4.9.
|
|
Т |
а б л и |
ц а 4.9 |
|
Расчетное значение |
Расчетное |
Вероятность |
Прибыль, |
||
аргумента логистической |
значение |
||||
варианта |
тыс. |
р. |
|||
функции |
экспоненты |
||||
|
|
|
|||
-6,573 |
0,001 |
0,001 |
117 288,69 |
||
-3,027 |
0,048 |
0,023 |
126 884,32 |
||
0,882 |
1,092 |
0,510 |
149 213,51 |
||
|
Сумма: 1,141 |
0,467 |
158 809,13 |
Многовариантный прогноз, с одной стороны, действительно является более полным, более адекватным описанием будущего, а с другой — требует дополнительных усилий по обоснованию
143
выбора. Это усложняет процедуру принятия решения и требует уточняющих расчетов. Рациональный выбор можно строить, ру ководствуясь следующими соображениями. Среди прогнозных ва риантов явным предпочтением пользуется тот, вероятность реаль ности которого выше. Таким вариантом является третий сверху (см. табл. 4.9). Кроме наиболее вероятного, можно ориентиро ваться на математическое ожидание величины прибыли
Е(?,+1)= 153167,19.
Наконец, очень важной характеристикой является оценка ин формационной ситуации, в которой принимается решение. В качестве этой оценки удобно использовать величину энтропии
H = -1£pilog2pi = l,m.
Эта величина служит дополнительным критерием при сравне нии двух решений. При всех прочих равных условиях более надеж ным считается то решение, которое принято в условиях с мень шей энтропией.
В рассматриваемом примере уровень неопределенности ситуа ции, в которой осуществлялся выбор варианта, можно считать средним, так как максимальное значение Н при выборе из четы рех вариантов равно 2. Фактически ситуация выбора по своей неопределенности близка к ситуации выбора из двух вариантов, когда максимальное значение Н равно 1. Реальность действитель но такова, что при выборе варианта нулевой и первый не конку рируют со вторым и третьим.
Используя формулу
проведем предельный анализ. Сначала вычислим взвешенное сред нее значение коэффициента регрессии
Ц= -0,2708-0,001-0,1800-0,023-0,0351-0,510 + 0-0,467 = -0,0223,
а затем рассчитаем предельные эффекты по каждому из вари антов:
- ^ - |
= -0,000 25; —¥± = -0,003 63; |
ох |
дх |
144
— ^ i |
= -0,006 52; —^1£ = o,010 414 |
Эх |
ох |
Результаты предельного анализа показывают, что если ситуация, для которой был сделан прогноз, будет улучшаться и, следователь но, оцениваться большим количеством баллов, то это соответствен но приведет к возрастанию вероятности последнего варианта. При этом, что тоже немаловажно, энтропия ситуации, в которой осу ществляется выбор, снизится до величины Н = 1,126.
Подобного рода анализ в основном ориентирован на повыше ние надежности принимаемых решений, так как, по сути, позво ляет получить упреждающие оценки ожидаемых изменений и учесть их в принимаемом решении.
4.3. Адаптивные модели прогнозирования
Принцип экспоненциального сглаживания и адаптивный механизм. Понимая, что не все модели и методы из аппарата адаптивного прогнозирования нам понадобятся для построения комбинированных моделей, ограничим свое рассмотрение много факторными адаптивными моделями регрессии, которые будут ис пользованы в излагаемом здесь подходе. Читателю, у которого этот аппарат вызовет особый интерес, можно рекомендовать мо нографию профессора В. В. Давниса [13], в которой наиболее полно рассматриваются эти вопросы. Изложение начнем с крат кого обсуждения общих принципов построения адаптивных про гнозных моделей.
Ситуации, в которых приходится прибегать к принципам адап тации при построении прогнозных моделей, обычно связаны с нестабильной динамикой моделируемых процессов. Отсутствие за кономерностей в изменениях динамики требует подходов, отлич ных от тех, которые используются при построении аналитических моделей. Если информация о закономерностях изменения дина мики моделируемых процессов отсутствует, то построение моде ли должно основываться на правдоподобных предположениях о возможном характере этих изменений. Скорее всего, самой про стой и достаточно естественной для моделирования социальноэкономических процессов является гипотеза, в основе которой лежит предположение о том, что в моделях, отражающих эти сложные закономерности, с течением времени происходит срав нительно медленное изменение структурных коэффициентов по
145
сравнению с изменениями самого процесса. Наиболее подходя щий инструмент для перемещения подобной идеи в практическую плоскость — метод экспоненциального сглаживания.
Широкое применение в задачах краткосрочного прогнозирования метод экспоненциального сглаживания получил после выхода работ Р. Винтерса [70], Р. Брауна и Р. Майера [60], Р. Брауна [59]. В них было дано его обоснование для случая прогнозных моделей полиномиального типа. Чтобы понять взаимосвязь экспоненциаль ного сглаживания с адаптацией, рассмотрим пример модели, пред ставляющей собой полином нулевого порядка
х,=а, +£,, |
(4.15) |
где xt — значение показателя, характеризующего уровень прогно зируемого процесса в момент времени Г, at — изменяющийся во времени параметр, характеризующий средний уровень прогнози руемого процесса в момент времени /; et — случайные независи мые отклонения фактических значений от текущего среднего,
имеющие нулевое математическое ожидание и конечную диспер сию а2.
В соответствии с этой моделью расчетная величина прогноз ного значения х[+1 считается равной оценке параметра а,, т.е.
xt+l=ar |
(4.16) |
За оценку текущего значения параметра а, принимается экспо ненциальная средняя St, вычисляемая по рекуррентной формуле
S, = а х, + «(1 - а);с,_1 + а(1 - а)2 х^2 +••• =
= axr +(l-a)[axl_l +a(l-a)x,_2 |
+•••] = |
= ax,+(l-a)S,_i, |
(4.17) |
где Sf — значение экспоненциальной средней в момент г, а — па раметр сглаживания, 0 < а < 1.
По сути, расчет прогнозной величины Jcr+1 задается рекуррент ной формулой (4.17), в которой при определении текущей средней применяется процедура "старения" данных по экспоненциальному закону, позволяющая построить прогнозную траекторию с домини рованием тенденции последнего периода. Причем степень этого преобладания регулируется параметром а. Чем ближе а к 1, тем меньше прогнозная оценка отличается от последнего наблюдения.
Для социально-экономических процессов такая процедура хоро шо согласуется с интуитивным представлением о характере взаи-
146
мосвязи будущего их состояния с достигнутыми уровнями пред шествующих периодов и фактически является адаптивной. Чтобы выяснить идеи, положенные в основу адаптивного механизма рас сматриваемой модели, перепишем (4.17) в виде
S, =St_l+a(xt-St_l). |
(4.18) |
Если 5М рассматривать как величину прогнозного значения для момента /, то разность (х, — Shi) в выражении (4.18) представ ляет собой ошибку прогноза. Эта ошибка учитывается в качестве корректирующего слагаемого при расчете нового прогнозного зна чения x(+l -S,- Становится очевидным, что в вычислительной схеме экспоненциального среднего используется принцип регуля тора с обратной связью, что позволяет говорить об адаптивных свойствах модели (4.15) — (4.17).
Многофакторные адаптивные модели. Принцип экспоненциаль ного сглаживания может успешно использоваться при построении многофакторных моделей, хотя детали конкретной реализации этих принципов имеют свои особенности, порождаемые много факторностью решаемых задач. Проблемы многофакторного адап тивного моделирования обсуждались в [7, 30, 35, 36]. Детальное изложение общей схемы такого моделирования, ориентированное на экономические приложения, можно найти в [13]. Основу этой схемы составляет рекуррентный метод наименьших квадратов (РМНК), в котором используется формула Шермана — Моррисона [41] рекуррентного обращения матриц
(С + х х ) , = С 1 |
, • |
(4.19) |
|
хС х +1 |
|
Однако, к сожалению, несмотря на некоторые |
преимущества |
(например, значительное сокращение времени расчетов при изме нении объема выборки), РМНК не получил должного признания в эконометрических исследованиях.
Реализация идеи экспоненциального сглаживания в задачах многофакторного моделирования сводится к введению весовой
функции вида |
|
f(t,j,a) = a ' Ч 0<сг<1, |
(4.20) |
где а — параметр сглаживания; / — номер последнего наблюде ния выборочной совокупности, используемой для построения модели; j — порядковый номер наблюдения выборочной совокуп ности, используемой для построения модели.
147
Введение весовой функции (4.20) позволяет записать экстре мальную задачу для получения вектора оценок В(?,а) регрессион ного уравнения
j ; , =x,B(0 + e„ t = l,2,...,T, |
(4.21) |
|
в виде |
|
|
в (Г,а) = Argmin |
^а'~][у: - х.В(/,а)]2 , |
(4.22) |
|
У=1 |
|
где yt — значение зависимой |
переменной (показателя) |
в момент г, |
х, = (хи, x2t, —,xmt) — w-мерная вектор-строка значений независи мых переменных (факторов) в момент t, B(0 = (bu, b2t, •••, bmt) — /и-мерный вектор-столбец оцениваемых коэффициентов модели, из меняющих с течением времени свои значения по неизвестному закону; ег — ненаблюдаемая случайная ошибка.
Функционал этой задачи является экспоненциально взвешен ной суммой отклонений расчетных значений от фактических. Суть его минимизации в том, что модель с коэффициентами, полученными как результат решения задачи (4.22), в силу сме щения точности аппроксимации к наблюдениям с высокими весовыми коэффициентами позволяет учитывать при расчете про гнозных значений в основном только те тенденции, которые проявляются в последних наблюдениях. Последовательное реше ние задачи для каждого / е [Т{, 7], (Г, > т) позволяет полу чить регрессионное уравнение с изменяющимися коэффициента ми. Многократное использование МНК является весьма громозд ким и неэффективным. В подобной ситуации гораздо предпоч тительнее применение РМНК, предложенного в [30]. Фактичес ки рекуррентная схема служит основой для построения адаптив ного механизма регрессионной модели. Многофакторная регрес сионная модель вместе с ее адаптивным механизмом записыва ется следующим образом:
|
& = x , B ( f - l , a ) ; |
|
(4.23) |
|
B(r,«) = B ( r - l , « ) + |
С ; - ' ^ |
[у, - у,] ; |
(4.24) |
|
|
|
х,СДх, +сс |
|
|
г-1 |
_ *-r-lx,xr*-r-l |
|
(4.25) |
|
а |
х,с,_!х+а |
|
||
|
|
148
При заданных начальных значениях В(0, а), С^1 и известной величине параметра сглаживания а = а* модель (4.23)—(4.25) позволяет по мере поступления новых данных изменять коэффи циенты и с учетом этого изменения вести соответствующие рас четы прогнозных значений уг
В [35] предложена многофакторная адаптивная модель |
|
j>, =x,B(f - l,a); |
(4.26) |
B(t,a) = В(? - La) + —-^[у, -x,B(f -l,a)] |
(4.27) |
в рекуррентной формуле (4.27) адаптивного механизма которой в качестве корректирующего слагаемого используется обычно приме няемый в адаптивной фильтрации градиент от прогнозной ошибки
grad(;y,-x,B(f-l,a))2 = -2x;(v,-x,B(?-l,a)), |
(4.28) |
|
умноженный на константу к =а/2^х~(0<а |
< 2). |
В некоторых |
случаях эта модель обеспечивает более высокую точность прогноз ных расчетов, чем построенная на основе применения рекуррент ной схемы МНК модель (4.23)— (4.25). Однако ее статистическая обоснованность явно уступает модели, в адаптивном механизме которой используется РМНК.
С целью повышения экстраполяционных свойств модели (4.23)— (4.25) в [13] были разработаны прогнозные модели с настраива емой структурой адаптивного механизма. Основное отличие этих моделей от рассмотренных выше в том, что структура их адаптив ного механизма заранее не фиксируется, а автоматически форми руется из заданного множества вариантов в процессе настройки параметров адаптации. В таком подходе фактически реализована возможность построения адаптивных моделей с оптимальной для рассматриваемого набора данных рекуррентной формулой пересчета.
Оптимизационная задача, позволяющая реализовать идеи на страиваемой структуры адаптивного механизма, может быть запи сана следующим образом:
В(/) = Argmin{(l -у- P)itat-j[yj |
- XjB(t))2 + |
+у£а'^[х,В(г-1)-х,.В(г)]2 +
У= 1
149