- •«Российская таможенная академия»
- •План чтения лекции №1
- •«Российская таможенная академия»
- •Понятие «эконометрика»
- •Формулировки определений понятия «эконометрика»
- •Задачи эконометрики
- •Эконометрическая модель
- •Задачи эконометрическoго моделирования
- •Классы эконометрических моделей
- •Типы данных и виды переменных в эконометрическом моделировании Типы данных
- •Виды переменных
- •Этапы эконометрического моделирования
- •Модели парной регрессии
- •Множественная регрессия. Мультиколлинеарность данных
- •3.2. Отбор факторов при построении множественной регрессии
- •3.2.1. Требования к факторам
- •3.2.2. Мультиколлинеарность
- •3.3. Выбор формы уравнения регрессии
- •3.4. Оценка параметров уравнения линейной
- •3.5. Качество оценок мнк линейной множественной регрессии. Теорема Гаусса-Маркова
- •3.6. Проверка качества уравнения регрессии. F-критерий Фишера
- •3.7. Точность коэффициентов регрессии. Доверительные интервалы
- •3.8 Прогнозирование по модели множественной регрессии
- •3.9 Гетероскедастичность случайных остатков
- •3.10. Обобщенный метод наименьших квадратов
- •3.11. Фиктивные переменные
- •3.12. Тест Чоу
- •Системы одновременных уравнений
- •4.1. Структурная и приведённая форма модели
- •4.2. Оценивание параметров структурной модели
- •Методы оценивания структурных уравнений различных видов
- •1. Точная идентифицируемость
- •2.Сверхидентифицируемость
- •3.Неидентифицируемость
- •Порядковое условие идентификации
- •Ненулевое ограничение
- •3. Анализ методов оценивания
- •Моделирование изолированного динамического ряда
- •Компоненты динамического ряда
- •Выявление и характеристика основной тенденции развития
- •Экспоненциальное сглаживание.
- •Моделирование основной тенденции
- •Статистическое изучение сезонных колебаний
- •Автокорреляция уровней динамического ряда и характеристика его структуры
- •3; 1; 2; 1; 2; 1; 3; 3; 2; 3; 1; 2; 1; 1; 3; 3; 2; 2; 1; 3; 3; 2; 2; 3; 1; 2; 2; 1; 3; 1.
- •Специфика изучения взаимосвязей по рядам динамики
- •Методы исключения тенденции
- •Метод последовательных разностей
- •Метод отклонений от тренда
- •Включение в модель регрессии фактора времени
- •Обобщенный метод наименьших квадратов при построении модели регрессии по временным рядам
- •Модели с лаговыми переменными
- •Модели с распределенными лагами
- •Метод Койка
- •Модели авторегрессии
- •Интерпретация параметров модели авторегрессии
- •Инструментальные переменные как метод оценивания параметров модели авторегрессии
- •Оценка автокорреляции остатков по модели авторегрессии
- •Авторегрессионные процессы и их моделирование (общая характеристика) Авторегрессионные процессы
- •Модели скользящей средней
- •Модели arma
- •Модели arima
- •Методология построения модели arima для исследуемого временного ряда включает следующую последовательность шагов.
- •Кластерный анализ
Модели arima
Дляполучения стационарного ряда могут рассчитываться разности уровней временного ряда ∆ разного порядкаd.Модель, в которой соединены нахождение последовательных разностей временного ряда порядкаdиARMA,— модель порядка (р,q),получила названиеавторегрессионной интегрированной модели скользящей средней—ARIMA(AutoregressiveIntegratedMovingAverage).
Модель ARIMAобладает тремя параметрами:р— порядок авторегрессииAR;d— порядок последовательных разностей уровней временных рядов, обеспечивающий стационарность ряда, иq— порядок скользящей среднейМА.
В общем виде модель ARIMA(р, d, q) выражается формулой
(5.67)
где —k-я последовательная разность уровней,т.е.— нормально распределенные случайные величины с нулевым математическим ожиданием и постоянной дисперсией.
Из модели (5.67) дляможно получить модель для исходного динамического ряда с помощью выражения:
(5.68)
Так, если модель ARIMA(1, 1, 1) имеет видто динамический ряд описывается моделью
так как
Модель ARIMAпрактически пригодна для большинства временных рядов. Приd =0 иq= 0 модельAR1MAпревращается в процессAR
Если р= 0 ,d= 0 иq= 1,2,…,k,то имеем модельМА
Наиболее распространены модели ARIMAс параметрамир, dиq,не превышающими двух. Современные компьютерные программы предлагают разные варианты оценивания параметров моделиARIMA,среди которых преобладает оценка методом максимального правдоподобия. Такой подход можно видеть при реализации моделиARIMAв системеSPSS1.
Методология построения модели arima для исследуемого временного ряда включает следующую последовательность шагов.
На первом шагенеобходимо получить стационарный ряд. При тестировании исходных данных на стационарность прежде всего используется визуальный анализ графика. Например, уже на этом этапе можно обнаружить ярко выраженную трендовую составляющую.
Также в методике Бокса—Дженкинса рекомендуется проводить анализ АКФ (ЧАКФ). Быстрое убывание значений выборочной АКФ является простым критерием стационарности (аналогичное поведение должна демонстрировать и ЧАКФ).
Часто на этом этапе используются статистические тесты на наличие единичного корня (тест Дики—Фуллера, расширенный тест Дики- Фуллера).
Для перехода к стационарному ряду традиционно применяют оператор взятия последовательных разностей (процедуру дискретного дифференцирования). Быстрое затухание АКФ будет свидетельствовать о том, что необходимая для стационарности ряда степень разности достигнута.
На втором шагепосле получения стационарного ряда исследуется характер поведения выборочных АКФ и ЧАКФ, выдвигаются гипотезы о значениях параметровp(порядок авторегрессии) иq(порядок скользящего среднего).
При этом следует иметь в виду, что выборочные корреляционные функции могут не демонстрировать детального сходства с теоретическими. Поэтому для идентификации модели могут использоваться главные черты АКФ, при расхождении более тонких деталей, в результате формируется базовый набор, включающий 1—2 или даже большее число моделей.
На третьем шагепосле осуществления идентификации моделей необходимо оценить их параметры. В современных эконометрических пакетах прикладных программ используются разные подходы (МНК, нелинейный МНК, метод максимального правдоподобия (ММП)). Все эти оценки при больших объемах выборок асимптотически эквивалентны.
На следующем, четвертом шагедля проверки каждой пробной модели на адекватность анализируется ряд ее остатков. У адекватной модели остатки должны быть похожими на белый шум, т. е. их выборочные автокорреляции не должны существенно отличаться от нуля.
При проверке значимости коэффициентов АКФ используются два подхода:
проверка значимости каждого коэффициента автокорреляции отдельно;
проверка значимости множества коэффициентов автокорреляции как группы.
Первый подход опирается на работу Бартлетта, показавшего, что если модель адекватна исходным данным и ошибки представляют собой белый шум, то распределение коэффициентов автокорреляции приближается к нормальному с нулевым математическим ожиданием и дисперсией , т.е. к.
Поэтому если выборочный коэффициент автокорреляции выходитза интервал, то нулевая гипотеза о равенстве нулю коэффициентаркотвергается.
Второй подход опирается на Q-статистику Бокса—Пирса, позволяющую проверить равенство нулю сразу т первых значений АКФ остатков.Q-статистика определяется как
Q = n
При нулевой гипотезе об отсутствии автокорреляции статистика Qимеет-распределение сv= τ-p-qстепенями свободы, гдер,q-параметрыARMAмодели.
Если Q>, то как группа первые τ коэффициентов автокорреляции значимы (т. е. не все, равны нулю).
В некоторых эконометрических пакетах включена модификация этого подхода — тест Бокса-Льюнга. Соответствующая статистика в этом случае определяется выражением:
= n(n+2)
имеет такое же асимптотическое распределение, как иQ,однако ее распределение ближе кдля конечных выборок. В практических руководствах рекомендуется рассматривать(но не более 50).
Кроме того, при построении модели ARIMAнеобходимо проверить значимость коэффициентов (поt-критерию). При этом модель не должна содержать лишних параметров, т. е. уменьшение числа параметров будет способствовать появлению значимой автокорреляции остатков.
Если в результате проверки несколько моделей оказываются адекватными исходным данным, то при окончательном выборе следует учесть два требования:
■ повышение точности (качество подгонки модели);
■ уменьшение числа параметров модели.
Воедино эти требования сведены в информационном критерии Акайка (Akaikeinformationcriterion (AIC)), определяемом формулой:
где — уровни ряда остатков.
Очевидно, что выбор следует сделать в пользу модели с меньшим значением AIC.
Аналогичный характер носит критерий Шварца (Schwarzcriterion), усиливающий требование уменьшения количества параметров модели:
На заключительном этапе с помощью модели, выбранной на четвертом шаге, можно строить точечный и интервальный прогноз на Lшагов вперед.
Сезонная модель Бокса—Дженкинсаможет быть представлена в виде:ARIMA(p, d, q)(Ps, Ds, Qs),где к параметрам моделир, d, qдобавлены:Ps —сезонный параметр авторегрессии;Qs —сезонный параметр скользящего среднего;Ds— параметр, определяющий порядок сезонной разности (сезонной производной).
При наличии ярко выраженной сезонной компоненты целесообразно включение в модель сезонного дифференцирования. Однако при решении практических экономических задач не рекомендуется использовать сезонные производные больше первого порядка. Также лучше не применять модели, у которых сумма порядков разностей (сезонных и несезонных) больше двух, т. е. желательно выдерживать соотношение:
d+Ds≤ 2.
Определение значений параметров сезонной авторегрессии SAR(Ps) и сезонного скользящего среднегоSMA(Ds) также опирается на исследование АКФ и ЧАКФ. Только теперь все типичные проявления, всплески будут удалены друг от друга на величину лагаS,гдеS— период сезонности.
При идентификации полной сезонной модели ARIMA(p, d, q)(Ps,As,Qs) часто сначала используют процедуру логарифмирования исходного ряда (для снижения дисперсии процесса), затем берут одну несезонную и одну сезонную разности (дифференцирование для несезонной части может и не потребоваться). На следующем этапе исследуется поведение АКФ и ЧАКФ для полученного производного ряда.
В некоторых эконометрических пакетах реализованы процедуры автоматического подбора структуры модели Бокса—Дженкинса.
Однако окончательный выбор модели все же должен оставаться за исследователем-экспертом, хорошо представляющим предметную область. Иногда можно построить две модели, одинаково хорошо соответствующие данным на ретроспективном участке (например, модель с порядком дифференцирования 1 и АR-членами и модель с большим порядком дифференцирования иMA-членами). Однако предлагаемые прогнозы у этих моделей могут существенно различаться. Поэтому окончательный выбор между такими моделями должен опираться на представления исследователя о виде нестационарности исходного ряда, о характере его трендовой составляющей.
Успех применения мощного, гибкого, но в то же время сложного аппарата модели ARIMAво многом зависит от практического опыта и квалификации исследователя, а процедуры автоматического выбора вида модели призваны лишь облегчить его аналитическую деятельность.
Пример 5.8.Известны данные экспорта и импорта РФ (в млрд. долларов США) за период с 1-го квартала 2002 года по второй квартал 2015 года. Требуется осуществить прогноз с применением моделиARIMAна 3-й и 4- кварталы 2015 года.
Рассмотрим более подробно динамические ряды экспорта и импорта. Их данные представлены в табл.5.13, а графическая иллюстрация -на рисунке 5.11.
Экспорт и импорт РФ
Таблица 5.13
Рис. 5.11. Динамические ряды экспорта и импорта РФ
В период с 3-го квартала 2008 по 1- квартал 2009 гг. наблюдается влияние мирового финансового кризиса – объемы экспорта за этот период снизились на 77,5 млрд. долл., а импорта – на 43,8 млрд. долларов.Восстановительный период завершился по экспорту в 4-ом квартале, а по импорту – во 2-ом квартале 2011 года.
Следующее снижение объёмов экспорта и импорта наблюдается со 2-го квартала 2014 года. В первом квартале 2015 года по экспорту оно составило 42,6, а по импорту – 33,4 млрд. долларов США. По сравнению с соответствующим кварталом 2013 годаобъёмы экспорта снизились на 32,0%, а импорта – на 44,2%.
Из полученного графического изображения можно выдвинуть предположение о наличии систематической и сезонной компонент, а так же случайной компоненты. Наличие систематической компоненты можно объяснить присутствием долговременно действующих факторов, формирующих динамику (график имеет постоянную тенденцию к возрастанию). Наличие же сезонной компоненты объясняется присутствием колебаний на графике (выбросов) с определенной периодичностью. Объемы экспорта и импортаувеличиваются к декабрю каждого года и резко снижаются в январе следующего за ним.
В целях уменьшения вариации результативных признаков, обусловленной различным количеством рабочих часов в кварталах года, введем в качестве результативных переменных объёмы экспорта и импорта в час.
Кроме того, в процессе решения берётся натуральный логарифм, преследуя ранее упомянутую цель.
Рис. 5.12. Логарифм экспорта (в час) РФ
Для прогнозирования будем использовать модель ARIMA с интервенцией. Особенностью данной модели является возможность учёта спада в динамике внешнеторгового оборота под влиянием мирового финансового кризиса.
Наличие основной тенденции означает, что ряд данных не является стационарным. На этапе идентификации модели ARIMA необходимо добиться того, чтобы ряд первоначально нестационарный стал стационарным; это означает, что его среднее постоянно, а выборочные дисперсия и автокорреляция не меняются во времени. По этой причине обычно необходимо брать последовательные разности ряда до тех пор, пока ряд не станет стационарным. Для того чтобы определить необходимый порядок разности, нужно исследовать график ряда и автокоррелограммы.
Сильные изменения уровня (сильные скачки вверх или вниз) обычно требуют взятия несезонной разности первого порядка. Сильные изменения наклона требуют взятия разности второго порядка. Сезонная составляющая требует взятия соответствующей сезонной разности. Если имеется медленное убывание выборочных коэффициентов автокорреляции в зависимости от лага, обычно берут разность первого порядка.
В результате проведенного анализа было выявлено, что наиболее подходящим является взятие первых и четвертых разностей для устранения тренда и сезонности ряда.
В итоге формируется график разностей (рис.5.13). Из графика на рис. видно, что ряд стал стационарным.
Рис. 5.13. Исходный ряд после взятия первых и четвертых разностей
На этапе идентификации модели необходимо решить, как много параметров авторегрессии (p) и скользящего среднего (q) должно присутствовать в модели процесса. На практике часто число параметровp илиq ограничивают значением 2.
В ходе анализа исходного ряда, была выявлена интервенция на 27 квартале из-за резкого спада внешнеторгового оборота России под влиянием мирового финансового кризиса. В связи с этим для прогнозирования экспорта России использовалась модельARIMA с постоянной устойчивой интервенцией в27 квартале.
Для нахождения качественной модели было проанализировано несколько комбинаций параметров (p,d,q)(P,D,Q). Среди адекватных моделей выбрана наиболее точная - модель ARIMA(0,1,0)(0,1,1), результаты которой представлены в табл. 5.14, 5.15и на рис.5.13.
Параметры модели прогноза объёмов экспорта
Таблица 5.14
Исход.:Экспорт в час, млн. долл. США (Таблица0609.sta) Преобразования: ln(x),D(1),D(4) (Прерванная АРПСС) Модель(0,1,0)(0,1,1) Сезонный лаг: 4 MS Остаток= ,01318 | |||||||||
|
Парам. |
Асимпт. |
Асимпт. |
p |
Нижняя |
Верхняя |
Интерв. |
Интерв. |
Асимпт. |
Qs(1) |
0,852619 |
0,093471 |
9,12176 |
0,000000 |
0,664472 |
1,040767 |
|
|
|
Омега(1) |
-0,223677 |
0,085869 |
-2,60487 |
0,012338 |
-0,396522 |
-0,050832 |
27 |
пост/уст |
|
Дельта1) |
0,733754 |
0,116116 |
6,31914 |
0,000000 |
0,500024 |
0,967484 |
27 |
пост/уст |
-0,840114 |
Результаты прогноза объёмов экспорта
Таблица 5.15
Номер квартала |
Прогноз |
Нижний 90% |
Верхний 90% |
Отношение значения верхней границы к нижней |
55 |
194,20 |
160,15 |
235,47 |
1,47 |
56 |
211,55 |
161,07 |
277,84 |
1,72 |
57 |
218,32 |
156,35 |
304,85 |
1,95 |
58 |
226,30 |
153,91 |
332,74 |
2,16 |
Рис.5.14. Прогноз объёмов экспорта
Принято считать, что если отношение верхней границы прогноза к её нижней границе меньше двух, то прогноз считается достаточно точным. Как следует из данных таб. 5.15 упомянутое условие выполняется только для 55 и 56 кварталов, т.е. для 3-го и 4-го кварталов 2015 года.
Как видно из графика (рис.5.15), выборочная плотность распределения остатков достаточно хорошо аппроксимируется нормальным законом распределения, что является одним из признаков адекватности построенной модели.
Рис.5.15. Выборочная плотность распределения остатков
В результате анализа остатков установлено, что они практически не коррелированы, имеют равную вариацию на всем протяжении ряда (кроме 27 квартала) и нет очевидного тренда или сдвига их. Из графиков (рис.5.16,5.17) видно, что остатки практически являются белым шумом.
Рис.5.16. Автокорреляционная функция остатков
Рис.5.17. Частная автокорреляционная функция остатков
Соответствующие таблицы и графики по импорту приведены ниже.
Параметры модели прогноза объёмов импорта
Таблица 5.16
Исход.:Импорт в час, млн. долл. США (Таблица0609.sta) Преобразования: ln(x),D(1),D(4) (Прерванная АРПСС) Модель(0,1,0)(0,1,1) Сезонный лаг: 4 MS Остаток= ,01030 | |||||||||
|
Парам. |
Асимпт. |
Асимпт. |
p |
Нижняя |
Верхняя |
Интерв. |
Интерв. |
Асимпт. |
Qs(1) |
0,686282 |
0,260973 |
2,62971 |
0,011583 |
0,160971 |
1,211593 |
|
|
|
Омега(1) |
-0,217437 |
0,089076 |
-2,44103 |
0,018553 |
-0,396737 |
-0,038137 |
27 |
пост/уст |
|
Дельта1) |
0,743828 |
0,084907 |
8,76053 |
0,000000 |
0,572919 |
0,914736 |
27 |
пост/уст |
-0,848790 |
Результаты прогноза объёмов импорта
Таблица 5.17
Номер квартала |
Прогноз |
Нижний 90% |
Верхний 90% |
Отношение значения верхней границы к нижней |
55 |
95,65 |
80,66 |
113,41 |
1,41 |
56 |
101,70 |
79,92 |
129,40 |
1,62 |
57 |
85,50 |
63,65 |
114,84 |
1,80 |
58 |
93,14 |
66,25 |
130,95 |
1,98 |
Рис.5.18. Прогноз объёмов импорта
Рис.5.19. Выборочная плотность распределения остатков
Рис.5.20. Автокорреляционная функция остатков
Рис.5.21.Частная автокорреляционная функция остатков
Таким образом, с доверительной вероятностью 0,9 объёмы экспорта и импорта в млрд. долларов США составят:
Экспорт | ||||
Номер квартала 2015 года |
Прогноз |
Нижний 90% |
Верхний 90% |
Отношение значения верхней границы к нижней |
3 |
102,54 |
84,56 |
124,33 |
1,47 |
4 |
109,58 |
83,44 |
143,92 |
1,72 |
Импорт | ||||
Номер квартала 2015 года |
Прогноз |
Нижний 90% |
Верхний 90% |
Отношение значения верхней границы к нижней |
3 |
50,50 |
42,59 |
59,88 |
1,41 |
4 |
52,68 |
41,40 |
67,03 |
1,62 |