Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции по эконометрике.docx
Скачиваний:
400
Добавлен:
29.03.2016
Размер:
9.51 Mб
Скачать

Модели arima

Дляполучения стационарного ряда могут рассчитываться раз­ности уровней временного ряда ∆ разного порядкаd.Модель, в которой соединены нахождение последовательных разно­стей временного ряда порядкаdиARMA,— модель порядка (р,q),получила названиеавторегрессионной интегриро­ванной модели скользящей средней—ARIMA(AutoregressiveIntegratedMovingAverage).

Модель ARIMAобладает тремя параметрами:р— порядок авторегрессииAR;d— порядок последовательных разностей уровней временных рядов, обеспечивающий стационарность ряда, иq— порядок скользящей среднейМА.

В общем виде модель ARIMA(р, d, q) выражается формулой

(5.67)

где k-я последовательная разность уровней,т.е.— нормально распределенные случайные величины с нулевым математическим ожиданием и постоянной дисперсией.

Из модели (5.67) дляможно получить модель для ис­ходного динамического ряда с помощью выражения:

(5.68)

Так, если модель ARIMA(1, 1, 1) имеет видто динамический ряд описывается моделью

так как

Модель ARIMAпрактически пригодна для большинства вре­менных рядов. Приd =0 иq= 0 модельAR1MAпревращается в процессAR

Если р= 0 ,d= 0 иq= 1,2,…,k,то имеем модельМА

Наиболее распространены модели ARIMAс параметрамир, dиq,не превышающими двух. Современные компьютерные программы предлагают разные варианты оценивания пара­метров моделиARIMA,среди которых преобладает оценка ме­тодом максимального правдоподобия. Такой подход можно ви­деть при реализации моделиARIMAв системеSPSS1.

Методология построения модели arima для исследуемого времен­ного ряда включает следующую последовательность шагов.

На первом шагенеобходимо получить стационарный ряд. При тести­ровании исходных данных на стационарность прежде всего использует­ся визуальный анализ графика. Например, уже на этом этапе можно об­наружить ярко выраженную трендовую составляющую.

Также в методике Бокса—Дженкинса рекомендуется проводить ана­лиз АКФ (ЧАКФ). Быстрое убывание значений выборочной АКФ явля­ется простым критерием стационарности (аналогичное поведение долж­на демонстрировать и ЧАКФ).

Часто на этом этапе используются статистические тесты на нали­чие единичного корня (тест Дики—Фуллера, расширенный тест Дики- Фуллера).

Для перехода к стационарному ряду традиционно применяют опера­тор взятия последовательных разностей (процедуру дискретного диффе­ренцирования). Быстрое затухание АКФ будет свидетельствовать о том, что необходимая для стационарности ряда степень разности достигнута.

На втором шагепосле получения стационарного ряда исследуется характер поведения выборочных АКФ и ЧАКФ, выдвигаются гипотезы о значениях параметровp(порядок авторегрессии) иq(порядок скользя­щего среднего).

При этом следует иметь в виду, что выборочные корреляционные функции могут не демонстрировать детального сходства с теоретическими. Поэтому для идентификации модели могут использоваться главные черты АКФ, при расхождении более тонких деталей, в результате формируется базовый набор, включающий 1—2 или даже большее число моделей.

На третьем шагепосле осуществления идентификации моделей не­обходимо оценить их параметры. В современных эконометрических па­кетах прикладных программ используются разные подходы (МНК, нели­нейный МНК, метод максимального правдоподобия (ММП)). Все эти оценки при больших объемах выборок асимптотически эквивалентны.

На следующем, четвертом шагедля проверки каждой пробной моде­ли на адекватность анализируется ряд ее остатков. У адекватной модели остатки должны быть похожими на белый шум, т. е. их выборочные ав­токорреляции не должны существенно отличаться от нуля.

При проверке значимости коэффициентов АКФ используются два подхода:

  • проверка значимости каждого коэффициента автокорреляции отдельно;

  • проверка значимости множества коэффициентов автокорреля­ции как группы.

Первый подход опирается на работу Бартлетта, показавшего, что ес­ли модель адекватна исходным данным и ошибки представляют собой белый шум, то распределение коэффициентов автокорреляции прибли­жается к нормальному с нулевым математическим ожиданием и дисперсией , т.е. к.

Поэтому если выборочный коэффициент автокорреляции выходитза интервал, то нулевая гипотеза о равенстве нулю коэффициентаркотвергается.

Второй подход опирается на Q-статистику Бокса—Пирса, позволяю­щую проверить равенство нулю сразу т первых значений АКФ остатков.Q-статистика определяется как

Q = n

При нулевой гипотезе об отсутствии автокорреляции статистика Qимеет-распределение сv= τ-p-qстепенями свободы, гдер,q-пара­метрыARMAмодели.

Если Q>, то как группа первые τ коэффициентов автокорреля­ции значимы (т. е. не все, равны нулю).

В некоторых эконометрических пакетах включена модификация этого подхода — тест Бокса-Льюнга. Соответствующая статистика в этом случае определяется выражением:

= n(n+2)

имеет такое же асимптотическое распределение, как иQ,однако ее распределение ближе кдля конечных выборок. В практических руководствах рекомендуется рассматривать(но не более 50).

Кроме того, при построении модели ARIMAнеобходимо проверить значимость коэффициентов (поt-критерию). При этом модель не должна содержать лишних параметров, т. е. уменьшение числа пара­метров будет способствовать появлению значимой автокорреляции ос­татков.

Если в результате проверки несколько моделей оказываются адек­ватными исходным данным, то при окончательном выборе следует учесть два требования:

■ повышение точности (качество подгонки модели);

■ уменьшение числа параметров модели.

Воедино эти требования сведены в информационном критерии Акайка (Akaikeinformationcriterion (AIC)), определяемом формулой:

где — уровни ряда остатков.

Очевидно, что выбор следует сделать в пользу модели с меньшим значением AIC.

Аналогичный характер носит критерий Шварца (Schwarzcriterion), усиливающий требование уменьшения количества параметров модели:

На заключительном этапе с помощью модели, выбранной на четвертом шаге, можно строить точечный и интервальный прогноз на Lшагов вперед.

Сезонная модель Бокса—Дженкинсаможет быть представлена в виде:ARIMA(p, d, q)(Ps, Ds, Qs),где к параметрам моделир, d, qдобавлены:Psсезонный параметр авторегрес­сии;Qsсезонный параметр скользящего среднего;Ds— параметр, опреде­ляющий порядок сезонной разности (сезонной производной).

При наличии ярко выраженной сезонной компоненты целесооб­разно включение в модель сезонного дифференцирования. Однако при решении практических экономических задач не рекомендуется ис­пользовать сезонные производные больше первого порядка. Также лучше не применять модели, у которых сумма порядков разностей (се­зонных и несезонных) больше двух, т. е. желательно выдерживать соот­ношение:

d+Ds≤ 2.

Определение значений параметров сезонной авторегрессии SAR(Ps) и сезонного скользящего среднегоSMA(Ds) также опирается на исследова­ние АКФ и ЧАКФ. Только теперь все типичные проявления, всплески бу­дут удалены друг от друга на величину лагаS,гдеS— период сезонности.

При идентификации полной сезонной модели ARIMA(p, d, q)(Ps,As,Qs) часто сначала используют процедуру логарифмирования исходного ряда (для снижения дисперсии процесса), затем берут одну несезонную и одну сезонную разности (дифференцирование для несезонной части может и не потребоваться). На следующем этапе исследуется поведение АКФ и ЧАКФ для полученного производного ряда.

В некоторых эконометрических пакетах реализованы процедуры ав­томатического подбора структуры модели Бокса—Дженкинса.

Однако окончательный выбор модели все же должен оставаться за исследователем-экспертом, хорошо представляющим предметную область. Иногда можно построить две модели, одинаково хорошо соот­ветствующие данным на ретроспективном участке (например, модель с порядком дифференцирования 1 и АR-членами и модель с большим порядком дифференцирования иMA-членами). Однако предлагаемые прогнозы у этих моделей могут существенно различаться. Поэтому окончательный выбор между такими моделями должен опираться на представления исследователя о виде нестационарности исходного ря­да, о характере его трендовой составляющей.

Успех применения мощного, гибкого, но в то же время сложного аппарата модели ARIMAво многом зависит от практического опыта и квалификации исследователя, а процедуры автоматического выбора вида модели призваны лишь облегчить его аналитическую деятельность.

Пример 5.8.Известны данные экспорта и импорта РФ (в млрд. долларов США) за период с 1-го квартала 2002 года по второй квартал 2015 года. Требуется осуществить прогноз с применением моделиARIMAна 3-й и 4- кварталы 2015 года.

Рассмотрим более подробно динамические ряды экспорта и импорта. Их данные представлены в табл.5.13, а графическая иллюстрация -на рисунке 5.11.

Экспорт и импорт РФ

Таблица 5.13

Рис. 5.11. Динамические ряды экспорта и импорта РФ

В период с 3-го квартала 2008 по 1- квартал 2009 гг. наблюдается влияние мирового финансового кризиса – объемы экспорта за этот период снизились на 77,5 млрд. долл., а импорта – на 43,8 млрд. долларов.Восстановительный период завершился по экспорту в 4-ом квартале, а по импорту – во 2-ом квартале 2011 года.

Следующее снижение объёмов экспорта и импорта наблюдается со 2-го квартала 2014 года. В первом квартале 2015 года по экспорту оно составило 42,6, а по импорту – 33,4 млрд. долларов США. По сравнению с соответствующим кварталом 2013 годаобъёмы экспорта снизились на 32,0%, а импорта – на 44,2%.

Из полученного графического изображения можно выдвинуть предположение о наличии систематической и сезонной компонент, а так же случайной компоненты. Наличие систематической компоненты можно объяснить присутствием долговременно действующих факторов, формирующих динамику (график имеет постоянную тенденцию к возрастанию). Наличие же сезонной компоненты объясняется присутствием колебаний на графике (выбросов) с определенной периодичностью. Объемы экспорта и импортаувеличиваются к декабрю каждого года и резко снижаются в январе следующего за ним.

В целях уменьшения вариации результативных признаков, обусловленной различным количеством рабочих часов в кварталах года, введем в качестве результативных переменных объёмы экспорта и импорта в час.

Кроме того, в процессе решения берётся натуральный логарифм, преследуя ранее упомянутую цель.

Рис. 5.12. Логарифм экспорта (в час) РФ

Для прогнозирования будем использовать модель ARIMA с интервенцией. Особенностью данной модели является возможность учёта спада в динамике внешнеторгового оборота под влиянием мирового финансового кризиса.

Наличие основной тенденции означает, что ряд данных не является стационарным. На этапе идентификации модели ARIMA необходимо добиться того, чтобы ряд первоначально нестационарный стал стационарным; это означает, что его среднее постоянно, а выборочные дисперсия и автокорреляция не меняются во времени. По этой причине обычно необходимо брать последовательные разности ряда до тех пор, пока ряд не станет стационарным. Для того чтобы определить необходимый порядок разности, нужно исследовать график ряда и автокоррелограммы.

Сильные изменения уровня (сильные скачки вверх или вниз) обычно требуют взятия несезонной разности первого порядка. Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности. Если имеется медленное убывание выборочных коэффициентов автокорреляции в зависимости от лага, обычно берут разность первого порядка.

В результате проведенного анализа было выявлено, что наиболее подходящим является взятие первых и четвертых разностей для устранения тренда и сезонности ряда.

В итоге формируется график разностей (рис.5.13). Из графика на рис. видно, что ряд стал стационарным.

Рис. 5.13. Исходный ряд после взятия первых и четвертых разностей

На этапе идентификации модели необходимо решить, как много параметров авторегрессии (p) и скользящего среднего (q) должно присутствовать в модели процесса. На практике часто число параметровp илиq ограничивают значением 2.

В ходе анализа исходного ряда, была выявлена интервенция на 27 квартале из-за резкого спада внешнеторгового оборота России под влиянием мирового финансового кризиса. В связи с этим для прогнозирования экспорта России использовалась модельARIMA с постоянной устойчивой интервенцией в27 квартале.

Для нахождения качественной модели было проанализировано несколько комбинаций параметров (p,d,q)(P,D,Q). Среди адекватных моделей выбрана наиболее точная - модель ARIMA(0,1,0)(0,1,1), результаты которой представлены в табл. 5.14, 5.15и на рис.5.13.

Параметры модели прогноза объёмов экспорта

Таблица 5.14

Исход.:Экспорт в час, млн. долл. США (Таблица0609.sta) Преобразования: ln(x),D(1),D(4) (Прерванная АРПСС) Модель(0,1,0)(0,1,1) Сезонный лаг: 4 MS Остаток= ,01318

Парам.

Асимпт.

Асимпт.

p

Нижняя

Верхняя

Интерв.

Интерв.

Асимпт.

Qs(1)

0,852619

0,093471

9,12176

0,000000

0,664472

1,040767

Омега(1)

-0,223677

0,085869

-2,60487

0,012338

-0,396522

-0,050832

27

пост/уст

Дельта1)

0,733754

0,116116

6,31914

0,000000

0,500024

0,967484

27

пост/уст

-0,840114

Результаты прогноза объёмов экспорта

Таблица 5.15

Номер квартала

Прогноз

Нижний 90%

Верхний 90%

Отношение значения верхней границы к нижней

55

194,20

160,15

235,47

1,47

56

211,55

161,07

277,84

1,72

57

218,32

156,35

304,85

1,95

58

226,30

153,91

332,74

2,16

Рис.5.14. Прогноз объёмов экспорта

Принято считать, что если отношение верхней границы прогноза к её нижней границе меньше двух, то прогноз считается достаточно точным. Как следует из данных таб. 5.15 упомянутое условие выполняется только для 55 и 56 кварталов, т.е. для 3-го и 4-го кварталов 2015 года.

Как видно из графика (рис.5.15), выборочная плотность распределения остатков достаточно хорошо аппроксимируется нормальным законом распределения, что является одним из признаков адекватности построенной модели.

Рис.5.15. Выборочная плотность распределения остатков

В результате анализа остатков установлено, что они практически не коррелированы, имеют равную вариацию на всем протяжении ряда (кроме 27 квартала) и нет очевидного тренда или сдвига их. Из графиков (рис.5.16,5.17) видно, что остатки практически являются белым шумом.

Рис.5.16. Автокорреляционная функция остатков

Рис.5.17. Частная автокорреляционная функция остатков

Соответствующие таблицы и графики по импорту приведены ниже.

Параметры модели прогноза объёмов импорта

Таблица 5.16

Исход.:Импорт в час, млн. долл. США (Таблица0609.sta) Преобразования: ln(x),D(1),D(4) (Прерванная АРПСС) Модель(0,1,0)(0,1,1) Сезонный лаг: 4 MS Остаток= ,01030

Парам.

Асимпт.

Асимпт.

p

Нижняя

Верхняя

Интерв.

Интерв.

Асимпт.

Qs(1)

0,686282

0,260973

2,62971

0,011583

0,160971

1,211593

Омега(1)

-0,217437

0,089076

-2,44103

0,018553

-0,396737

-0,038137

27

пост/уст

Дельта1)

0,743828

0,084907

8,76053

0,000000

0,572919

0,914736

27

пост/уст

-0,848790

Результаты прогноза объёмов импорта

Таблица 5.17

Номер квартала

Прогноз

Нижний 90%

Верхний 90%

Отношение значения верхней границы к нижней

55

95,65

80,66

113,41

1,41

56

101,70

79,92

129,40

1,62

57

85,50

63,65

114,84

1,80

58

93,14

66,25

130,95

1,98

Рис.5.18. Прогноз объёмов импорта

Рис.5.19. Выборочная плотность распределения остатков

Рис.5.20. Автокорреляционная функция остатков

Рис.5.21.Частная автокорреляционная функция остатков

Таким образом, с доверительной вероятностью 0,9 объёмы экспорта и импорта в млрд. долларов США составят:

Экспорт

Номер квартала 2015 года

Прогноз

Нижний 90%

Верхний 90%

Отношение значения верхней границы к нижней

3

102,54

84,56

124,33

1,47

4

109,58

83,44

143,92

1,72

Импорт

Номер квартала 2015 года

Прогноз

Нижний 90%

Верхний 90%

Отношение значения верхней границы к нижней

3

50,50

42,59

59,88

1,41

4

52,68

41,40

67,03

1,62