Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

В. Давнис Прогнозные модели экспертных предпочтений

.pdf
Скачиваний:
194
Добавлен:
14.08.2013
Размер:
3.39 Mб
Скачать

3.2. Идентификация случайного эффекта с помощью фиктив­ ной переменной /|, принимающей только два значения (0 или 1) и формируемой по следующему правилу:

_ |0,

если

y,-yt<

0;

[1,

если

у, — yt

> 0-

3.3. Построение регрессионного уравнения с фиктивной и лаговой переменными:

у, = 3114,56 + 31630,72^ + 0,94 yt_y. (6672,99) (5631,03) (0,06)

3.4. Вычисление расчетных значений у , отклонений расчет­ ных от фактических значений и относительных ошибок в процен­ тах §г Результаты расчетов представлены в табл. 4.3.

Относительный уровень ошибок хотя и снизился, но для не­ которых наблюдений остается все же высоким. Очевидно, оста­ ется еще неучтенный эффект, который требуется идентифициро­ вать аналогичным образом. При этом нужно оставаться в рамках ограничений, которые необходимо выполнить для успешной ре­ ализации второго этапа. Суть этих ограничений в том, чтобы в каждой группе наблюдений, на которые делится выборочная со­ вокупность, было не менее двух наблюдений. В противном слу­ чае идентификация модели множественного выбора невозможна.

Т а б л и ц а 4.3

У,

/,

У,-,

У

у, - У,

8,

16 828

0

13146

15414,70

1413,56

8,40

40 325

1

16 828

50 490,76

-10 165,74

25,21

73454

1

40 325

72 475,66

978,47

1,33

80 206

0

73454

71 842,43

8363,44

10,43

115 343

1

80 206

109 790,45

5552,64

4,81

109 730

0

115 343

111 036,12

-1305,67

1,19

141

050

1

109 730

137 415,33

3634,63

2,58

126 618

0

141 050

135088,93

-8471,33

6,69

3.5. Введение фиктивной переменной f2 аналогично fv Замечание. Преследуя цель выполнения сформулированных

выше ограничений при формировании /2, самому маленькому положительному отклонению был присвоен 0 вместо 1.

140

3.6. Построение регрессионного уравнения с двумя фиктивны­ ми и лаговой переменными:

у, =-2735,06 + 31924,81/, + 9595,63/2

+0,95y,_i.

(5141,52)

(3885,31)

(3760,31)

(0,04)

3.7. Вычисление расчетных значенийyt, отклонений расчетных от фактических значений и относительных ошибок в процентах 5Г Результаты расчетов приведены в табл. 4.4.

Т а б л и ц а 4.4

У,

/,

л

У,-,

У

у , - У,

8,

16 828

0

1

13146

19 321.96

-2493,70

14,82

40 325

1

0

16 828

45 141,66

-4816,64

11,94

73454

1

0

40 325

67 414,77

6039,37

8,22

80 206

0

1

73454

76 489,44

3716,43

4,63

115 343

1

1

80 206

114 814,38

528,72

0,46

109 730

0

0

115343

106 601,32

3129,12

2,85

141 050

1

1

109 730

142 801,41

-1751,45

1,24

126 618

0

0

141 050

130 969,46

-4351,85

3,44

Данные табл. 4.4 свидетельствуют о том, что мультитрендовая модель обеспечивает достаточно высокую точность аппрок­ симации, особенно последних наблюдений. С помощью этой модели удается рассчитать четыре прогнозных траектории, от­ личающиеся друг от друга на величину случайного эффекта фиксированной величины. Раз эффекты случайны, то необхо­ димо знать их вероятностный закон распределения. Его иден­ тификация осуществляется с помощью модели множественного выбора.

Атрибутами (факторами) модели множественного выбора мо­ гут быть как количественные, так и качественные переменные. Каждый из вариантов есть результат определенной экономической ситуации, которую не всегда удается описать количественными показателями, и поэтому имеет смысл использовать качественные оценки, получаемые с помощью экспертов.

3.8. Нумерация вариантов и определение интервалов для балль­ ной оценки условий, в которых может сформироваться соответ­ ствующий вариант (табл. 4.5).

141

 

 

Т а б л и ц а 4.5

Ситуация

Номер варианта

Баллы

Очень плохая

0

5 - 2 5

Плохая

]

1 5 - 40

Хорошая

2

3 5 - 75

Очень хорошая

3

50 - 90

3.9. Экспертная оценка ситуаций, в которых была получена

соответствующая

прибыль

(табл. 4.6).

 

 

 

 

 

 

Т а б л и ц а 4.6

У,

/,

Л

У,,

Номер варианта

Баллы

16 828

0

1

13146

1

15

40 325

1

0

16 828

2

35

73454

1

0

40 325

2

75

80 206

0

1

73454

1

40

115 343

1

1

80 206

3

50

109 730

0

0

115343

0

5

141 050

1

1

109 730

3

90

126 618

0

0

141 050

0

25

3.10. Построение мультиномиальной логит-модели по данным последних двух столбцов табл. 4.6 с помощью пакета STATISTICA.

Результаты моделирования представлены в табл. 4.7.

 

 

 

 

 

 

 

Т а б л и ц а

4.7

Оценки параметров модели, их стандартные ошибки,

 

статистики Вальда и вероятности

 

 

Varl - Parameter estimates (Spreadsheetl)

 

 

 

Distribution: MULTINOMIAL

 

 

 

 

Link function: LOGIT

 

 

 

 

 

Level

Level of

Column

Estimate

Standard

Wald Stat.

P

 

Effect of Effect

Response

Error

 

Interc l

0

1

9,672 420

2,140 278

20,42349

0,000

006

"Var2"

0

2

-0,270 766

0,058 671

21,29770

0,000

004

Interc 2

1

3

7,769 844

2,044 825

14,43817

0,000

145

"Var2"

1

4

-0,179 950

0,050 178

12,86105

0,000

335

Interc 3

2

5

2,192 924

1,075929

4,15413

0,041

533

"Var2"

2

6

-0,035 078

0,016 337

4,61045

0,031778

Scale

 

 

1,000 000

0,000 000

 

 

 

142

Статистика Вальда и вероятность ошибки свидетельствуют об адекватности построенной модели. Сама модель может быть запи­ сана следующим образом:

Р(А,) =ехр(9,672 - 0,27Lc,-)+exp(7,770 - 0,180*, )+ехр(2Д 93 - 0,035х,);

 

 

ехр(9,672-0,271*,.)

ъ

м ;

ехр( 7,770-0,180х,)

P (

v

<

=

0 )

=

т т

 

(v'

)=—i^w

 

 

 

 

^ ^ 2 0 9 3 - 0 , 0 3 ^ )

 

 

 

_ ! _ .

 

 

 

 

 

 

1 + Р(А,)

 

 

 

 

1 + Р(А,)

3.11.

 

Расчет

прогнозных

оценок _у?+1 д л я

каждого

из

четырех

возможных ситуаций

по мультитрендовой модели:

 

 

 

 

 

 

&+1 = Ь0

+ hf\

+ hfl

+ ЪъУг •

 

 

 

Результаты

 

расчетов

представлены

в табл. 4.8.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а

б л

и

ц а 4.8

 

 

Номер варианта

А

 

А

 

U+1

 

 

 

 

 

 

0

 

 

0

 

0

 

117 288,69

 

 

 

 

 

 

1

 

 

0

 

1

 

126 884,32

 

 

 

 

 

 

2

 

 

1

 

0

 

149 213,51

 

 

 

 

 

 

3

 

 

1

 

1

 

158 809,13

 

 

3.12. Вычисление вероятностей получения той или иной вели­ чины прибыли с учетом экспертной оценки ожидаемой экономи­ ческой ситуации. Результаты расчетов при экспертной оценке, равной 60 баллам, представлены в табл. 4.9.

 

 

Т

а б л и

ц а 4.9

Расчетное значение

Расчетное

Вероятность

Прибыль,

аргумента логистической

значение

варианта

тыс.

р.

функции

экспоненты

 

 

 

-6,573

0,001

0,001

117 288,69

-3,027

0,048

0,023

126 884,32

0,882

1,092

0,510

149 213,51

 

Сумма: 1,141

0,467

158 809,13

Многовариантный прогноз, с одной стороны, действительно является более полным, более адекватным описанием будущего, а с другой — требует дополнительных усилий по обоснованию

143

выбора. Это усложняет процедуру принятия решения и требует уточняющих расчетов. Рациональный выбор можно строить, ру­ ководствуясь следующими соображениями. Среди прогнозных ва­ риантов явным предпочтением пользуется тот, вероятность реаль­ ности которого выше. Таким вариантом является третий сверху (см. табл. 4.9). Кроме наиболее вероятного, можно ориентиро­ ваться на математическое ожидание величины прибыли

Е(?,+1)= 153167,19.

Наконец, очень важной характеристикой является оценка ин­ формационной ситуации, в которой принимается решение. В качестве этой оценки удобно использовать величину энтропии

H = -1£pilog2pi = l,m.

Эта величина служит дополнительным критерием при сравне­ нии двух решений. При всех прочих равных условиях более надеж­ ным считается то решение, которое принято в условиях с мень­ шей энтропией.

В рассматриваемом примере уровень неопределенности ситуа­ ции, в которой осуществлялся выбор варианта, можно считать средним, так как максимальное значение Н при выборе из четы­ рех вариантов равно 2. Фактически ситуация выбора по своей неопределенности близка к ситуации выбора из двух вариантов, когда максимальное значение Н равно 1. Реальность действитель­ но такова, что при выборе варианта нулевой и первый не конку­ рируют со вторым и третьим.

Используя формулу

проведем предельный анализ. Сначала вычислим взвешенное сред­ нее значение коэффициента регрессии

Ц= -0,2708-0,001-0,1800-0,023-0,0351-0,510 + 0-0,467 = -0,0223,

а затем рассчитаем предельные эффекты по каждому из вари­ антов:

- ^ -

= -0,000 25; —¥± = -0,003 63;

ох

дх

144

— ^ i

= -0,006 52; —^1£ = o,010 414

Эх

ох

Результаты предельного анализа показывают, что если ситуация, для которой был сделан прогноз, будет улучшаться и, следователь­ но, оцениваться большим количеством баллов, то это соответствен­ но приведет к возрастанию вероятности последнего варианта. При этом, что тоже немаловажно, энтропия ситуации, в которой осу­ ществляется выбор, снизится до величины Н = 1,126.

Подобного рода анализ в основном ориентирован на повыше­ ние надежности принимаемых решений, так как, по сути, позво­ ляет получить упреждающие оценки ожидаемых изменений и учесть их в принимаемом решении.

4.3. Адаптивные модели прогнозирования

Принцип экспоненциального сглаживания и адаптивный механизм. Понимая, что не все модели и методы из аппарата адаптивного прогнозирования нам понадобятся для построения комбинированных моделей, ограничим свое рассмотрение много­ факторными адаптивными моделями регрессии, которые будут ис­ пользованы в излагаемом здесь подходе. Читателю, у которого этот аппарат вызовет особый интерес, можно рекомендовать мо­ нографию профессора В. В. Давниса [13], в которой наиболее полно рассматриваются эти вопросы. Изложение начнем с крат­ кого обсуждения общих принципов построения адаптивных про­ гнозных моделей.

Ситуации, в которых приходится прибегать к принципам адап­ тации при построении прогнозных моделей, обычно связаны с нестабильной динамикой моделируемых процессов. Отсутствие за­ кономерностей в изменениях динамики требует подходов, отлич­ ных от тех, которые используются при построении аналитических моделей. Если информация о закономерностях изменения дина­ мики моделируемых процессов отсутствует, то построение моде­ ли должно основываться на правдоподобных предположениях о возможном характере этих изменений. Скорее всего, самой про­ стой и достаточно естественной для моделирования социальноэкономических процессов является гипотеза, в основе которой лежит предположение о том, что в моделях, отражающих эти сложные закономерности, с течением времени происходит срав­ нительно медленное изменение структурных коэффициентов по

145

сравнению с изменениями самого процесса. Наиболее подходя­ щий инструмент для перемещения подобной идеи в практическую плоскость — метод экспоненциального сглаживания.

Широкое применение в задачах краткосрочного прогнозирования метод экспоненциального сглаживания получил после выхода работ Р. Винтерса [70], Р. Брауна и Р. Майера [60], Р. Брауна [59]. В них было дано его обоснование для случая прогнозных моделей полиномиального типа. Чтобы понять взаимосвязь экспоненциаль­ ного сглаживания с адаптацией, рассмотрим пример модели, пред­ ставляющей собой полином нулевого порядка

х,=а, +£,,

(4.15)

где xt значение показателя, характеризующего уровень прогно­ зируемого процесса в момент времени Г, at изменяющийся во времени параметр, характеризующий средний уровень прогнози­ руемого процесса в момент времени /; et случайные независи­ мые отклонения фактических значений от текущего среднего,

имеющие нулевое математическое ожидание и конечную диспер­ сию а2.

В соответствии с этой моделью расчетная величина прогноз­ ного значения х[+1 считается равной оценке параметра а,, т.е.

xt+l=ar

(4.16)

За оценку текущего значения параметра а, принимается экспо­ ненциальная средняя St, вычисляемая по рекуррентной формуле

S, = а х, + «(1 - а);с,_1 + а(1 - а)2 х^2 +••• =

= axr +(l-a)[axl_l +a(l-a)x,_2

+•••] =

= ax,+(l-a)S,_i,

(4.17)

где Sf значение экспоненциальной средней в момент г, а — па­ раметр сглаживания, 0 < а < 1.

По сути, расчет прогнозной величины Jcr+1 задается рекуррент­ ной формулой (4.17), в которой при определении текущей средней применяется процедура "старения" данных по экспоненциальному закону, позволяющая построить прогнозную траекторию с домини­ рованием тенденции последнего периода. Причем степень этого преобладания регулируется параметром а. Чем ближе а к 1, тем меньше прогнозная оценка отличается от последнего наблюдения.

Для социально-экономических процессов такая процедура хоро­ шо согласуется с интуитивным представлением о характере взаи-

146

мосвязи будущего их состояния с достигнутыми уровнями пред­ шествующих периодов и фактически является адаптивной. Чтобы выяснить идеи, положенные в основу адаптивного механизма рас­ сматриваемой модели, перепишем (4.17) в виде

S, =St_l+a(xt-St_l).

(4.18)

Если 5М рассматривать как величину прогнозного значения для момента /, то разность (х, — Shi) в выражении (4.18) представ­ ляет собой ошибку прогноза. Эта ошибка учитывается в качестве корректирующего слагаемого при расчете нового прогнозного зна­ чения x(+l -S,- Становится очевидным, что в вычислительной схеме экспоненциального среднего используется принцип регуля­ тора с обратной связью, что позволяет говорить об адаптивных свойствах модели (4.15) — (4.17).

Многофакторные адаптивные модели. Принцип экспоненциаль­ ного сглаживания может успешно использоваться при построении многофакторных моделей, хотя детали конкретной реализации этих принципов имеют свои особенности, порождаемые много­ факторностью решаемых задач. Проблемы многофакторного адап­ тивного моделирования обсуждались в [7, 30, 35, 36]. Детальное изложение общей схемы такого моделирования, ориентированное на экономические приложения, можно найти в [13]. Основу этой схемы составляет рекуррентный метод наименьших квадратов (РМНК), в котором используется формула Шермана — Моррисона [41] рекуррентного обращения матриц

(С + х х ) , = С 1

, •

(4.19)

 

хС х +1

 

Однако, к сожалению, несмотря на некоторые

преимущества

(например, значительное сокращение времени расчетов при изме­ нении объема выборки), РМНК не получил должного признания в эконометрических исследованиях.

Реализация идеи экспоненциального сглаживания в задачах многофакторного моделирования сводится к введению весовой

функции вида

 

f(t,j,a) = a ' Ч 0<сг<1,

(4.20)

где а — параметр сглаживания; / — номер последнего наблюде­ ния выборочной совокупности, используемой для построения модели; j — порядковый номер наблюдения выборочной совокуп­ ности, используемой для построения модели.

147

Введение весовой функции (4.20) позволяет записать экстре­ мальную задачу для получения вектора оценок В(?,а) регрессион­ ного уравнения

j ; , =x,B(0 + e„ t = l,2,...,T,

(4.21)

в виде

 

 

в (Г,а) = Argmin

^а'~][у: - х.В(/,а)]2 ,

(4.22)

 

У=1

где yt значение зависимой

переменной (показателя)

в момент г,

х, = и, x2t, —,xmt) — w-мерная вектор-строка значений независи­ мых переменных (факторов) в момент t, B(0 = (bu, b2t, •••, bmt) /и-мерный вектор-столбец оцениваемых коэффициентов модели, из­ меняющих с течением времени свои значения по неизвестному закону; ег ненаблюдаемая случайная ошибка.

Функционал этой задачи является экспоненциально взвешен­ ной суммой отклонений расчетных значений от фактических. Суть его минимизации в том, что модель с коэффициентами, полученными как результат решения задачи (4.22), в силу сме­ щения точности аппроксимации к наблюдениям с высокими весовыми коэффициентами позволяет учитывать при расчете про­ гнозных значений в основном только те тенденции, которые проявляются в последних наблюдениях. Последовательное реше­ ние задачи для каждого / е {, 7], (Г, > т) позволяет полу­ чить регрессионное уравнение с изменяющимися коэффициента­ ми. Многократное использование МНК является весьма громозд­ ким и неэффективным. В подобной ситуации гораздо предпоч­ тительнее применение РМНК, предложенного в [30]. Фактичес­ ки рекуррентная схема служит основой для построения адаптив­ ного механизма регрессионной модели. Многофакторная регрес­ сионная модель вместе с ее адаптивным механизмом записыва­ ется следующим образом:

 

& = x , B ( f - l , a ) ;

 

(4.23)

B(r,«) = B ( r - l , « ) +

С ; - ' ^

[у, - у,] ;

(4.24)

 

 

х,СДх, +сс

 

 

г-1

_ *-r-lx,xr*-r-l

 

(4.25)

а

х,с,_!х

 

 

 

148

При заданных начальных значениях В(0, а), С^1 и известной величине параметра сглаживания а = а* модель (4.23)—(4.25) позволяет по мере поступления новых данных изменять коэффи­ циенты и с учетом этого изменения вести соответствующие рас­ четы прогнозных значений уг

В [35] предложена многофакторная адаптивная модель

 

j>, =x,B(f - l,a);

(4.26)

B(t,a) = В(? - La) + —-^[у, -x,B(f -l,a)]

(4.27)

в рекуррентной формуле (4.27) адаптивного механизма которой в качестве корректирующего слагаемого используется обычно приме­ няемый в адаптивной фильтрации градиент от прогнозной ошибки

grad(;y,-x,B(f-l,a))2 = -2x;(v,-x,B(?-l,a)),

(4.28)

умноженный на константу к =а/2^х~(0<а

< 2).

В некоторых

случаях эта модель обеспечивает более высокую точность прогноз­ ных расчетов, чем построенная на основе применения рекуррент­ ной схемы МНК модель (4.23)— (4.25). Однако ее статистическая обоснованность явно уступает модели, в адаптивном механизме которой используется РМНК.

С целью повышения экстраполяционных свойств модели (4.23)— (4.25) в [13] были разработаны прогнозные модели с настраива­ емой структурой адаптивного механизма. Основное отличие этих моделей от рассмотренных выше в том, что структура их адаптив­ ного механизма заранее не фиксируется, а автоматически форми­ руется из заданного множества вариантов в процессе настройки параметров адаптации. В таком подходе фактически реализована возможность построения адаптивных моделей с оптимальной для рассматриваемого набора данных рекуррентной формулой пересчета.

Оптимизационная задача, позволяющая реализовать идеи на­ страиваемой структуры адаптивного механизма, может быть запи­ сана следующим образом:

В(/) = Argmin{(l -у- P)itat-j[yj

- XjB(t))2 +

+у£а'^[х,В(г-1)-х,.В(г)]2 +

У= 1

149

Соседние файлы в предмете Анализ данных