Оценка значимости модели
ВР : ,
Модель тренда :
(14)
- сумма квадратов отклонений уровней ВР от среднего
его значения
- сумма квадратов отклонений модели тренда от среднего значения ВР (объясненная часть);
Остатки :
- сумма квадратов остатков (необъясненная часть);
Коэффициент детерминации
. (15)
- степеней свободы
Сколько независимых переменных из N возможных требуется для образования данной суммы квадратов, если известна величина
;
(число коэффициентов) - степеней
свободы;
- степеней свободы
Значимость модели в целом оценивается с помощью F-критерия Фишера:
, (16)
где - сумма квадратов отклонений
модели на одну степень свободы;
- остаточная сумма квадратов на одну степень свободы;
N – число наблюдений;
n+1– число параметров модели;
- коэффициент детерминации.
Модель статистически значима (существенна), если фактическое значение F-критерия (F) превосходит табличное его значение при заданном уровне значимости , т.е.
. (17)
задаются уровнем значимости, т.е. малой вероятностью ,
затем по таблице значений F-критерия Фишера определяют величину для заданных величин , где - число степеней свободы, соответствующее большей сумме квадратов; - число степеней свободы, соответствующее меньшей сумме квадратов,
сравниваются F и . Если выполняется (17), то модель тренда адекватна временному ряду, в противном случае - нет (модель признается неадекватной) .
Ошибка аппроксимации
Величина отклонений по каждому наблюдению представляет, по сути, ошибку аппроксимации, которая определяет точность модели.
Достаточно распространенной и простой мерой оценки точности является относительная ошибка.
. (18)
Величину (18) называют также функцией потерь. Возможно и иное определение относительной ошибки аппроксимации
. (19)
Если окажется , то точность признается достаточной, что свидетельствует о хорошем подборе модели к экспериментальным данным.
Прогнозирование экономических показателей на основе трендовых моделей
Под прогнозированием обычно понимают распространение закономерностей, связей и соотношений, действующих в изучаемом периоде, за его пределы.
Основные этапы:
предварительный анализ данных;
формирование набора моделей (например, набора кривых роста), называемых функциями-кандидатами;
численное оценивание параметров моделей;
определение адекватности моделей;
оценка точности адекватных моделей;
выбор лучшей модели;
получение точечного и интервального прогнозов;
верификация прогноза.
Линейное прогнозирование. Приступим теперь к рассмотрению одного из наиболее важных вопросов анализа временных рядов - прогнозированию их последующих значений по результатам наблюдения за ними на некотором фиксированном отрезке времени.
В нашем распоряжении имеются наблюдений
Задача заключается в поиске наилучшей в некотором смысле оценки ненаблюдаемой величины , т > N, по результатам наблюдений .
В качестве модели для описания тренда используем зависимость
, (1)
и т.д.
Временной ряд можно представить в виде
(2)
Запишем наблюдения (1), (2) в векторной форме, представляя ВР в виде вектора
где
Будем полагать, что модель тренда (1) на отрезке , справедлива и на . В этом случае алгоритм прогнозирования :
, (3)
где
.
Точечный прогноз — это единственное значение прогнозируемого показателя . Это значение определяется подстановкой в уравнение выбранной кривой роста величины времени , соответствующей периоду упреждения ;
и т. д., где - число уровней временного ряда. Точность прогнозирования можно характеризовать дисперсией ошибки прогнозирования
(4)
Дисперсия случайной величины , как это делалось в регрессионном анализе, заменяется ее оценкой
,
где - k-строка матрицы ,
- МНК – оценка вектора параметров модели тренда
После вычисления точечной оценки (3) следует построить доверительные интервалы для истинного значения прогнозируемой величины
, (5)
где - двухсторонняя -квантиль распределения Стьюдента с степенями свободы. N- Число уровней временного ряда(длина) n+1- число оцениваемых параметров
Верхняя граница , (6)
Нижняя граница , (7)
где - период упреждения, величина на которую осуществляется предсказание;
- точечный прогноз по модели на - момент времени;
- количество наблюдений во временном ряду;
Увеличение неопределенности прогнозируемого процесса с ростом величины упреждения проявляется в постоянном расширении доверительного интервала
Рекомендации по выбору длины ВР:
если нет никаких соображений качественного порядка, следует брать возможно больший промежуток времени;
если развитие обнаруживает циклический характер, следует брать период от середины первого до середины последнего периода цикла;
если ряд охватывает периоды с разными трендами, лучше сократить ряд, отбросив наиболее ранние уровни, которые относятся к периоду с иной тенденцией развития.
Верификация прогноза. Верификация сводится к сопоставлению расчетных результатов по модели с соответствующими данными действительности.
Верификация прогнозной модели представляет собой совокупность критериев, способов и процедур, позволяющих на основе многостороннего анализа оценивать качество получаемого прогноза. Однако до сих пор не найдено эффективного подхода к оценке качества прогноза до его реализации.
Самодеструктивный прогноз
Саморегулирующий прогноз
Точность прогноза ошибка прогноза = разности между фактическим значением исследуемого показателя и его прогнозным значением
Более точной считается модель, дающая более узкие доверительные интервалы прогноза
.
Адаптивные модели прогнозирования
Адаптивные модели прогнозирования — это модели, способные быстро приспосабливать свою структуру и параметры к изменению условий
Все адаптивные модели базируются на двух схемах: скользящего среднего (СС-модели) и авторегрессии (АР—модели).
Общая схема построения адаптивных моделей:
по нескольким первым уровням ряда оцениваются значения параметров модели;
по имеющейся модели строится прогноз на один шаг вперед, причем его отклонение от фактических уровней ряда расценивается как ошибка прогнозирования, которая учитывается в соответствии с принятой схемой корректировки модели;
далее по модели со скорректированными параметрами рассчитывается прогнозная оценка на следующий момент времени и т.д.
Таким образом, модель постоянно «впитывает» новую информацию и к концу периода обучения отражает тенденцию развития процесса, существующую в данный момент.
Модель Брауна (модель экспоненциального сглаживания)
Модель Брауна может отображать развитие не только в виде линейной тенденции, но также в виде случайного процесса, не имеющего тенденции, а также в виде изменяющейся параболической тенденции. Соответственно различают модели Брауна:
нулевого порядка, описывающие процессы, не имеющие тенденции развития. Они имеют один параметр (оценка текущего уровня). Прогноз развития на шагов вперед осуществляется согласно формуле . Такая модель также называется «наивной» («будет, как было»);
первого порядка . Коэффициент - значение, близкое к последнему уровню, и представляет как бы закономерную составляющую этого уровня. Коэффициент определяет прирост, сформировавшийся в основном к концу периода наблюдения, но отражающий также (правда, в меньшей степени) скорость роста на более ранних этапах;
второго порядка, отражающей развитие в виде параболической тенденции с изменяющимися «скоростью» и «ускорением». Модель имеет три параметра (А2 – оценка текущего прироста или «ускорение»). Прогноз осуществляется по формуле: .
Рассмотрим этапы построения линейной адаптивной модели Брауна
Этап 1. По первым пяти точкам временного ряда оцениваются начальные значения и параметров модели с помощью метода наименьших квадратов для линейной аппроксимации:
.
Обозначим эти оценки и .
Этап 2. С использованием параметров и по модели Брауна находим прогноз на один шаг (k = 1):
.
Вначале для момента времени
.
Этап 3. Значение прогноза экономического показателя на момент сравнивают с фактическим , и вычисляется величина их расхождения (ошибки). При k = 1 имеем:
.
Этап 4. В соответствии величиной ошибки корректируются параметры модели Брауна:
- параметр сглаживания.
Этап 5. По модели со скорректированными параметрами и находят прогноз на следующий момент времени.
Если t < N, то возвращаются к этапу 3.
Если t = N, то построенную модель можно использовать для прогнозирования на будущее.
Этап 6. Интервальный прогноз строится как для линейной модели кривой роста.
Начальные оценки параметров получим по первым пяти точкам при помощи МНК по формулам:
Возьмем k = 1, а параметр сглаживания равным . В таблице приведены расчеты параметров модели Брауна на каждом шаге.
На последнем шаге получена модель .
Прогнозные оценки по этой модели получаются подстановкой в нее значений L = 1 и L= 2
Таблица. Оценка параметров модели Брауна
t |
|
A0 |
A1 |
|
|
0 3302,1 19,7
3333 3331,2 21,5 3321,8 11,2
3337 3339,5 19,0 3352,7 -15,7
3 3354 3354,7 18,3 3358,5 -4,5
4 3364 3365,4 16,8 3373,0 -9,0
5 3418 3412,3 22,5 3382,3 35,7
6 3392 3398,9 15,7 3434,8 -42,3
7 3380 3385,5 10,2 3414,5 -34,5
8 3406 3404,4 11,8 3395,7 10,3
9 3394 3397,5 8,3 3416,2 -22,2
3409 3408,5 8,8 3405,8 3,2
3410 3411,2 7,6 3417,3 -7,3
3425 3424,0 8,6 3418,8 6,2
3409 3412,8 4,8 3432,6 -23,6
3415 3415,4 4,4 3417,6 -2,6
3416 3416,6 3,8 3419,8 -3,8
3402 3404,9 0,9 3420,4 -18,4
3387 3390,0 -2,2 3405,8 -18,8
3391 3390,5 -1,7 3387,9 3,1
19 3390 3389,8 -1,5 3388,8 1,2
----------------------------------------------------------------------------------------------------------------------
20 3388,3
21 3386,9
----------------------------------------------------------------------------------------------------------------------
Модель сезонной составляющей
(8)
(9)
Рис. Результаты аппроксимации и прогнозирования по адаптивной модели Брауна (параметр сглаживания равен 0,4)
Для полинома первой степени первые разности
Для полинома второй степени первые разности
Для полинома второй степени вторые разности
Свойства полиномиальных кривых роста:
от полинома высокого порядка можно путем расчета последовательных разностей (приростов) перейти к полиному более низкого порядка;
значения разностей (приростов) для полиномов любого порядка не зависят от значений самой функции .
- линейная функция времени
Предварительный выбор кривых роста - метод характеристик прироста:
исходный временной ряд предварительно сглаживается методом простого скользящего среднего;
вычисляются первые средние разности
вторые средние разности
производные величины
Таблица
Отбирают 2 – 4 кривых роста и определяют их параметры.
Модели и методы авторегрессии. В авторегрессионных (АР) моделях текущее значение процесса представляется как линейная комбинация предыдущих его значений и случайной компоненты.
Идентификация АР(n) модели состоит в определении ее порядка n. Одной из предпосылок построения модели этого типа является применение их к стационарному процессу. Поэтому в более широком смысле идентификация модели включает также выбор способа трансформации исходного ряда наблюдений, как правило, имеющего некоторую тенденцию, в стационарный (или близкий к нему) ряд. Один из наиболее распространенных способов решения этой проблемы — последовательное взятие разностей, т.е. переход от исходного ряда к ряду первых, а затем и вторых разностей.
«Чистые» авторегрессионные процессы имеют плавно затухающую автокорреляционную функцию (АКФ). В этом случае в качестве порядка модели выбирается лаг, после которого все частные автокорреляционные функции (ЧАКФ) имеют незначительную величину. Однако на практике редко встречаются процессы, которые легко было бы идентифицировать. Поэтому порядок модели обычно определяется методом проб из нескольких альтернатив. В число кандидатов включаются модели, у которых порядок соответствует ЧАКФ, превышающей стандартное отклонение 1/N. При обработке разностных рядов иногда ориентируются на АКФ, выбирая модели, у которых порядок соответствует максимальному ее значению, при условии, что оно превышает стандартное отклонение.
Ряды без тенденции, как правило, не представляют интереса для экономистов. АР - модели вообще не предназначены для описания процессов с тенденцией, однако они хорошо описывают колебания, что весьма важно для отображения развития неустойчивых показателей.
Чтобы сделать возможным применение АР - моделей к процессам с тенденцией, на первом этапе формируют стационарный ряд, т. е. исключают тенденцию путем перехода от исходного временного ряда к ряду первых или вторых разностей :
Например, ряд первых разностей формируется как ряд приростов, т. е. последовательным вычитанием двух соседних уровней. С учетом этого АР(n) — модель порядка n имеет вид:
.
Параметры этой модели вычисляются по МНК с учетом сложности модели либо методом адаптивной фильтрации (МАФ). В обоих случаях необходимо предварительно идентифицировать модель, т. е. правильно определить порядок разностного ряда d и порядок модели n.
Простейшим способом определения наиболее подходящего разностного ряда является вычисление для каждого ряда (d = 0,1,2) его дисперсии, т. е. усредненной суммы квадратов расхождений его уровней со средним значением . Для дальнейшей обработки выбирается ряд, у которого величина этого показателя минимальна.
Для идентификации порядка модели обычно используется автокорреляционная функция, значения которой определяются по формуле:
, (4)
где p — количество уровней стационарного ряда (p = N-d); т — номер коэффициента автокорреляции .
В качестве порядка модели принимается номер коэффициента автокорреляции , имеющего максимальную величину. Следовательно, в модели используются n уровней, которые оказывают на текущий уровень наибольшее влияние. В соответствии с МНК формируется система из n уравнений, которая в компактной форме имеет вид:
Например, для n = 2 система принимает вид:
(5)
В (5) суммирование проводится по t в пределах от 3 до p = N - d. Решив эту систему уравнений, получают числовое значение . Оценка свободного члена получается из соотношения:
.
На основе построенной модели вычисляют прогнозное значение разностного ряда Z(n+k) на k шагов вперед, а от него переходят к прогнозной оценке исходного ряда.
Так, для d = 1 имеем:
при ,
при .
Следовательно, прогнозные оценки базируются как на фактических, так и на полученных прогнозных уровнях ряда. Доверительный интервал прогноза рассчитывается на основе точечного прогноза:
верхняя граница прогноза Z(N+k) + U(k),
нижняя граница прогноза Z(N+k) - U(k).
Величина U(k) рассчитывается по формуле:
,
где - СКО, вычисленное с учетом сложности АР(n)- модели; - коэффициент, соответствующий табличному значению статистики Стьюдента с выбранным уровнем значимости ; коэффициент под квадратным корнем рассчитывается рекуррентно, причем при величина С(0) = 1, а при
.
В методе адаптивной фильтрации используется АР(n)-модель без свободного члена. Ее параметры корректируются на j-й итерации в каждый момент времени t следующим образом:
,
где и - векторы новых и старых значений параметров (весов) модели; w - константа обучения, определяющая скорость адаптации параметров модели ; e(t) - ошибка прогнозирования уровня Y(t).
Алгоритм построения модели прогнозирования состоит в следующем. На первой итерации (j = 1) на основе начального набора весов и первых n уровней ряда вычисляется и его расхождение с фактическим уровнем, т.е. , . Подставляя величину ошибки в уравнение корректировки весов, получают новый набор весов для следующего момента времени t = р+2. Далее эта процедура повторяется для следующих n-наборов , каждый из которых образован из предыдущего исключением первого и добавлением одного нового уровня ряда. Если на итерации j оптимальные веса не получены, то на следующей итерации надо вернуться к первому набору уровней ряда , но уже с новыми начальными весами, взятыми от предыдущей итерации.
Определение начальных весов осуществляется путем решения уравнения Юла—Уокера, составленного на основе коэффициентов автокорреляции. Процедура корректировки параметров заканчивается, когда среднеквадратическая ошибка перестает существенно убывать или при достижении заданного максимального количества итераций.
Пример 4. Рассмотрим построение прогноза на основе моделей авторегрессии. Ниже в табл. 5.8 и 5.9 приведены расчеты построения прогноза курса немецкой марки, выполненные с использованием программы ОЛИМП; при этом в качестве лучшей модели из всего класса адаптивных моделей, реализованных в программе, выбрана авторегрессионная модель. На рис. 5.2 представлены результаты аппроксимации и прогнозирования по этой модели.
Таблица 5.8. Модель временного ряда «Немецкая марка» Лучшая модель АР( 1,1)
Модель |
|
|
АР(1,1) |
3,088 |
-0,248 |
Таблица остатков
Номер |
Факт |
Расчет |
Ошибка абсолютная |
Ошибка относительная |
3354,000 3369,699 -15,699 -0,468
3364,000 3412,840 -48,840 -1,452
3418,000 3489,226 -71,226 -2,084
3392,000 3519,090 -127,090 -3,747
3380,000 3274,064 105,936 3,134
3406,000 3381,294 24,706 0,725
3394,000 3448,631 -54,631 -1,610
3409,000 3373,294 35,706 1,047
3410,000 3443,665 -33,665 -0,987
3425,000 3429,435 -4,435 -0,129
3409,000 3425,665 -16,665 -0,489
3415,000 3357,942 57,058 1,671
3416,000 3421,874 -5,874 -0,172
3402,000 3377,435 24,565 0,722
3387,000 3315,118 71,882 2,122
3391,000 3335,030 55,970 1,651
3390,000 3387,699 2,301 0,068
Характеристики остатков
Характеристика |
Значение |
Среднее значение 0,000
Дисперсия 3151,663 Средний модуль остатков 44,485
Относительная ошибка 1,310
Критерий Дарбина-Уотсона 1,901
Коэффициент детерминации 1,000
F-значение ( ) 54932,906
Уравнение значимо с вероятностью 0,95
Таблица 5.9. Таблица прогнозов (P=0,8)
Упреждение |
Прогноз |
Нижняя граница |
Верхняя граница |
1 |
3406,740 |
3329,916 |
3483,565 |
2 |
3368,701 |
3288,109 |
3449,293 |
3 |
3499,812 |
3411,373 |
3588,251 |
Рис. 5.2. Результаты аппроксимации и прогнозирования по авторегрессионной модели (1,1)