- •Модуль 8. Анализ временных рядов
- •8.1. Временные ряды
- •Примеры временных рядов
- •Пример 8.1
- •Пример 8.2
- •8.1.1. Основные задачи анализа временных рядов
- •8.2. Автоковариационная и автокорреляционная функции
- •8.2.1. Автоковариационная функция
- •8.2.2. Автокорреляционная функция
- •8.3. Методы сглаживания временного ряда
- •8.3.1. Метод скользящего среднего
- •8.3.2. Метод экспоненциального взвешенного скользящего среднего (метод Брауна)
- •8.3.3.Случай «бесконечно» удаленного прошлого
- •8.4. Модели стационарных временных рядов и их идентификация
- •8.4.1. Модель авторегрессии 1-го порядка (ар(1))
- •8.4.2. Модель авторегрессии второго порядка - ар(2)
- •8.4.3. Модель авторегрессии ар(s)
- •8.4.4. Модель авторегрессии – скользящего среднего арсс(1,1)
- •8.5. Модели нестационарных временных рядов и их идентификация
- •8.5.1. Метод последовательных разностей
- •Пример 8.3
- •Конец примера
- •8.5.2. Преобразование Бокса-Дженкинса
- •Лабораторная работа №8.5
- •Выполнение
- •8. Вопросы
8.1.1. Основные задачи анализа временных рядов
Можно сформулировать цели статистического анализа временного ряда следующим образом:
по имеющейся траектории x(1), x(2), …x(N) анализируемого временного ряда x(t) требуется:
- определить, какие из неслучайных функций ,
присутствуют в разложении , т. е. определить значения индикаторов i в разложении;
- построить «хорошие» оценки для тех неслучайных функций, которые присутствуют в разложении;
- подобрать модель, адекватно описывающую поведение «случайных остатков (t), и статистически оценить параметры этой модели.
Успешное решение перечисленных задач является основой для достижения конечных прикладных целей исследования и, в первую очередь, для решения задачи кратко- и среднесрочного прогноза значений временного ряда.
8.2. Автоковариационная и автокорреляционная функции
Для идентификации временных рядов удобно использовать специальные функции: автоковариационную и автокорреляционную.
8.2.1. Автоковариационная функция
Из предположения о строгой стационарности временного ряда x(t) при m=2 следует, что совместные двумерные распределения для пар случайных величин (x1(t), x2(t)), (x(0),(x(t2-t1)), (x(), x(t2-t1+) совпадают для любых t1, t2 и зависят только от разности t2-t1. Соответственно, ковариация между значениями x(t) и x(t ) будет зависеть только от величины «сдвига по времени» (и не будет зависеть от t). Эта ковариация называется автоковариацией (поскольку измеряет ковариацию для различных значений одного и того же временного ряда x(t) и определяется соотношением:
.
При анализе величины () в зависимости от значения принято говорить об автоковариационной функции (). Значения автоковариационной функции могут быть статистически оценены по имеющимся наблюдениям временного ряда по формуле
, где =1,2, … N-1. Очевидно
(0)= 2 =М[x(t)-];
()=cov(x(t+), x(t)) = cov(x(t), x(t+)) = cov(x(t), x(t-);
()= cov(x(t), x(t-) = (-).
8.2.2. Автокорреляционная функция
Одно из главных отличий последовательности наблюдений, образующих временной ряд, от случайной выборки заключается в том, что члены временного ряда являются, вообще говоря, статистически взаимозависмыми. Степень тесноты статистической связи между двумя случайными величинами может быть измерена парным коэффициентом корреляции. Так что степень статистической связи между двумя наблюдениями временного ряда, «разнесенными» (по времени) на единиц, определится величиной коэффициента корреляции
Коэффициент корреляции () измеряет корреляцию, существующую между членами одного и того же временного ряда, поэтому его принято называть коэффициентом автокорреляции. При анализе изменения величины() в зависимости от значенияпринято говорить об автокорреляционной функции(). График автокорреляционной функции называют коррелограммой. Автокорреляционная функция, в отличие от автоковариационной, безразмерна. Ее значения могут колебаться в пределах от –1 до +1. Очевидно, что() =(-), а(0) =1.
8.3. Методы сглаживания временного ряда
Поиск модели, адекватно описывающей поведение случайных остатков (t) анализируемого временного ряда x(t), производят, как правило, в рамках некоторого специального класса случайных временных последовательностей — класса стационарных временных рядов. На интуитивном уровне стационарность временного ряда мы связываем с требованием, чтобы он имел постоянное среднее значение и колебался вокруг этого среднего с постоянной дисперсией. В некоторых случаях временные последовательности этого класса могут воспроизводить и поведение самого анализируемого временного ряда x(t) (из приведенных выше примеров внешние признаки стационарного временного ряда демонстрирует график динамики урожайности ячменя, см. пример 2).
Ряд x(t) называется строго стационарным (или стационарным в узком смысле), если совместное распределение вероятностей m наблюдений x(t1), x(t2), …, x(tm) такое же, как и для m наблюдений x(t1+), x(t2+), …x(tm+), при любых m, t1, t2, …, tm и .
Другими словами, свойства строго стационарного временного ряда не меняются при изменении начала отсчета времени. В частности, при m= 1 из предположения о строгой стационарности временного ряда x(t) следует, что закон распределения вероятностей случайной величины x(t) не зависит от t, а значит, не зависят от t и все его основные числовые характеристики, в том числе:
среднее значение М(x(t)) = и
дисперсия D(x(t))= М(x(t) –)2 = 2
Очевидно, значение а определяет постоянный уровень, относительно которого разбросаны значения анализируемого временного ряда x(t), а постоянная величина 2 характеризует размах этого разброса. Поскольку закон распределения вероятностей случайной величины x(t) одинаков при всех t, то он сам и его основные числовые характеристики могут быть оценены по наблюдениям x(1), x(2), …x(N). В частности:
-оценка среднего значения,
- оценка дисперсии.
Под методами сглаживания временного ряда понимается выделение неслучайной составляющей. Предположим, что известен общий вид неслучайной составляющей F(t) для ряда x(t)=F(t,)+ (t). Это может быть полином, ряд Фурье и т.д. Тогда возникает задача оценки параметров . В такой постановке задачи используются аналитические методы.
Если вид неслучайной составляющей неизвестен F(t), то используются алгоритмические методы. К таким методам относится метод скользящего среднего, лежащий в основе более сложных процедур сглаживания.