Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

statistika_проц_22

.pdf
Скачиваний:
867
Добавлен:
11.04.2015
Размер:
2.41 Mб
Скачать

Составление и решение системы нормальных уравнений можно

упростить путем переноса начала координат в середину ряда дина-

мики. Это приводит к тому, что суммы по времени tk = 0 ïðè

t

k — нечетном. Если до переноса начала координат t было равно 1, 2, 3, …, то после переноса для четного числа членов ряда:

t = …, –5, –3, –1, 1, 3, 5, …, для нечетного числа членов ряда: t = …, –3, –2, –1, 0, 1, 2, 3, …

Тогда оценки параметров для прямой вычисляются по фор-

мулам:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a1 =

 

ytt

 

=

 

yt

 

 

 

 

 

 

 

 

t

, a0

 

t

 

,

 

 

 

 

 

 

 

 

t2

 

n

 

 

 

 

 

 

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

для параболы по формулам:

 

 

 

 

 

 

 

 

 

a2 =

nytt2 t2 yt

 

a1 =

ytt

 

a0 =

yt

t2

 

t

 

t

t

,

t

 

,

 

t

t

a2.

 

 

t2

2

t2

 

n

n

 

nt4

 

 

 

 

 

t

 

 

 

 

 

 

 

 

 

t

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Выбор кривой осуществляется либо визуально, либо с использованием метода последовательных разностей (для полиномов). При идентификации параметров МНК можно подобрать форму кривой по, например, минимальному значению среднеквадратической ошибки.

Альтернативой нахождению некоторой аппроксимирующей функции, которая характеризует ряд целиком, служит метод скользящих средних. В основе этого метода лежит идея о том, что в средних величинах взаимно погашаются случайные отклонения (если дисперсия уровня ряда около среднего (сглаженного) значения a характеризуется величиной σ 2, то разброс среднего из N уровней ряда около того же значения a будет характеризоваться меньшей величиной дисперсии σ 2/N, что и означает сглаживание уровней ряда). Первоначальные уровни временного ряда заменяются средними величинами, вычисленными для определенного числа уровней ряда. Полученное значение относится к середине выбранного интервала. Затем интервал сдвигается на одно наблюдение и расчет средней повторяется и т.д. Интервал, на котором вычисляются средние, как бы скользит по ряду.

341

Сглаживание временного ряда означает представление тренда в данной точке посредством взвешенного среднего значений, наблюдаемых в окрестностях этой точки (активный участок сглаживания). Оно определяется для каждого момента времени, за исключе- нием нескольких первых и нескольких последних точек.

Длину интервала сглаживания 2m + 1 удобно брать нечетной, так как в этом случае полученные значения скользящей средней приходятся на середину интервала.

Сглаженное значение yt временного ряда y1, y2, ..., yt, ..., yn â

точке t вычисляется по значениям yt-m, yt-m+1, ..., yt, yt+1, ..., yt+m по формуле

 

m

 

 

= wsyt+s , t = m + 1, ..., n – m,

(9.29)

yt

s=−m

задающей взвешенное среднее наблюдаемых значений yt в интервале значений t, отстоящих не более чем на m единиц. Полученная таким образом по (9.30) последовательность ym+1,K,yn−m называется скользящим средним исходной последовательности y1, y2, ..., yt, ..., yn.

Определение параметров ws основано на следующей процедуре. Согласно известной теореме Вейерштрасса любая гладкая функция ft при самых общих допущениях может быть локально (т.е. в ограни- ченном интервале изменения ее аргумента t) представлена алгебраическим полиномом подходящей степени p. Таким образом, веса ws определяются по 2m + 1 членам ряда в результате построения МНК полинома степени p, аппроксимирующего поведение временного ряда. Значение этого полинома в центральной точке (σ = 0) дает оценку сглаженного значения yt.

Свойства коэффициентов скользящих средних таковы:

m

сумма весов равна единице ws = 1.

s=−m

веса симметричны относительно серединного значения w0, ò.å. w–s= ws, s = 1, 2, ..., m. В табл. 9.17 значения w0 даны как последние числа в квадратных скобках.

при одной и той же длине временного интервала веса для полиномов четной степени будут такими же, как и для поли-

номов степени на единицу большей.

В случае использования полинома первого порядка значение yt получается как среднее арифметическое из уровней ряда на активном участке сглаживания.

342

Метод скользящих средних не дает значений тренда для m первых и m последних членов ряда. Особенно неприятно отсутствие значений тренда в конце траектории динамики, поскольку мы хотим экстраполировать ряд. Несмотря на то что значения тренда в конце не столь устойчивы, как в середине, можно использовать для сглаживания последних m значений ряда полином того же порядка, что и для остальных членов ряда, и получить выражения для весов.

Для выбора конкретных значений длины интервала m и степени полинома p, к сожалению, нет никаких критериев — это зависит от модели представления ряда и цели выделения тренда. При малом числе наблюдений метод скользящих средних часто приводит к искажению тенденции и его надо использовать с осторожностью.

Специфика конкретной задачи может потребовать использования в качестве активного участка четное количество уровней ряда. Например, при анализе среднесуточных колебаний (24 часа), среднемесячных недельных данных (4 недели) и т.п. В этом случае сглаженное значение yt вычисляется в средней точке скользящего интервала усреднения и попадает посередине между исходными точ- ками наблюдения. Чтобы получить сглаженное значение в точке наблюдения необходимо вычислить значения yt для двух окаймляющих эту точку промежуточных моментов времени и взять их среднее арифметическое.

После применения скользящих средних ряд сглаженных значе- ний yt будет более гладким, чем исходный yt (дисперсия ряда yt будет меньше дисперсии ряда yt), однако в нем могут появиться систематические колебания, обусловленные автокоррелированностью его последовательных значений в силу усреднения случайных составляющих. Этот вывод называется эффектом Слуцкого–Юла.

9.6. Прогнозирование периодических колебаний

Во многих временных рядах проявляется сезонный фактор в виде периодических регулярных колебаний, причем период таких колебаний не превышает года и равен кварталу, месяцу или неделе. Пусть выбрана аддитивная модель ряда. Представляется, что невозможно установить полностью объективное правило, разделяющее тренд и сезонность. Однако те или иные методы позволяют приближенно оценить сезонные колебания.

343

Простейший путь оценки сезонности для ряда y1, y2, ..., yt, ..., yn с периодом сезонности l (l = 12 для ежемесячных данных, l = 4 для ежеквартальных данных) заключается в вычислении разности (отношения) между средним по всем одноименным месяцам (кварталам) и средним по всем данным. В результате получаем сезонную компоненту, неизменную во времени. Если временной ряд содержит выраженную тенденцию развития, то перед выделением сезонных колебаний сначала должен быть выделен тренд. Обозначим число целых периодов h = n / l, тогда:

 

 

 

1

h−1

 

1

n

 

Se

 

=

y

y ,

t = 1,...,l.

t

 

 

 

 

 

t+l j

 

 

i

 

 

 

 

h j=0

 

n i=1

 

Если в последней формуле вычитание заменяется отношением, то получим так называемый индекс сезонности.

Альтернативный метод оценивания сезонной волны состоит в выделении тренда скользящими средними, например, по формуле (m = l/2):

= 1 m−1 yt

l s=−(m −1)

 

 

1

 

 

1

 

 

 

y

+

y

+

y

 

, t = m + 1,...,n − m

 

 

t+m

t+s

2

t−m

2

 

 

 

 

 

 

и использовании отклонений от сглаженных значений в качестве оценок сезонности:

Set

=

1

 

h−1

 

 

 

t = 1,...,m;

 

 

 

 

 

 

h

 

 

(yt+lj − yt+l j ),

 

 

1 j=1

 

 

 

 

 

 

1

h−2

(yt+l j

 

),

 

 

(9.30)

Set =

 

 

− yt+l j

t

= m +

1,...,2m.

 

 

 

h −1 j=0

 

 

 

 

 

 

Если выбирается мультипликативная модель ряда, то в последней формуле вместо разностей берется отношение.

Разные пределы суммирования объясняются тем, что при использовании скользящей средней с четным значением длины интервала сглаживания m первых и m последних уровней будут потеряны.

Затем полученные значения сезонной компоненты корректируются так, чтобы суммарное воздействие сезонности на динамику было нейтральным. В случае аддитивной модели сумма значений сезонной составляющей для одного периода должна быть равна нулю. Поэтому окончательные оценки сезонности получаются по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= Set − Se , t = 1, ..., l,

(9.31)

 

 

 

 

 

Set

 

 

 

1

 

l

 

 

 

 

ãäå

 

=

 

Sei .

 

 

 

 

Se

 

 

 

 

l

 

 

 

 

 

 

 

i=1

 

 

 

 

344

В случае мультипликативной модели:

 

 

 

 

l

 

 

 

Se = l Sei .

= Set × Se,

Set

 

 

 

 

i=1

Таким образом, построение тренд-сезонной модели в этом слу- чае реализуется в виде следующей последовательности действий.

1.Оценивание сезонной компоненты по формулам (9.30) и (9.31).

2.Переход к временному ряду zt без сезонной компоненты (десе-

=, t = 1, …,n.

zt yt Setзонализация

3.Расчет параметров тренда для ряда zt.

4.Моделирование динамики исходного ряда с учетом трендовой

èсезонной составляющих. Оценка точности и адекватности модели.

5.Использование модели для прогнозирования.

Другим способом моделирования сезонной составляющей является использование фиктивных переменных для сезонов:

Set = λ1δ1t + λ2δ2t + ... + λlδlt ,

 

ãäå δjt — сезонные фиктивные переменные,

соответствующие

l сезонам, так что δjt =1 для сезона j и δjt = 0 , иначе, j = 1, …, l.

Поскольку в сумме фиктивные переменные

δjt дают единицу,

то в регрессии с константой будет иметь место линейная зависимость между переменными. Поэтому на коэффициенты накладывается ограничение, например, λ1 +... l = 0 . При этом сезонная компонента центрируется, т .е. в среднем влияние сезонной волны на уровень ряда будет нулевым. Тогда:

Set = −(λ2 + ... + λl 1t + λ2δ2t

+ ... + λlδlt =

= λ22t − δ1t ) + ... + λl lt

− δ1t ).

Новые переменные, стоящие в скобках в последнем уравнении будут линейно независимыми и их использование позволяет полу- чить оценки сезонности l1, ...,ll, которые интерпретируются как отклонения в j-м сезоне от основной динамики ряда на величину lj.

Если для описания тренда используется полином вида (9.27), то тренд-сезонная модель временного ряда будет иметь вид:

y

=a +a t+...+a tp+ λ δ

+ λ

δ

2t

+...

δ

lt

+ u ,

(9.32)

t

0 1

p

1 1t

2

 

l

 

t

 

ãäå λ1 +... l

= 0 .

 

 

 

 

 

 

 

 

 

 

В регрессии (9.32) неизвестные коэффициенты ai, i = 1,…,p è lj, j =1,…,l находятся МНК, что приводит к выделению трендовой, сезонной и случайной составляющих.

345

С помощью фиктивных переменных удобно также моделировать выбросы, т.е. аномальные значения временного ряда, которые соответствуют фиксированным моментам времени. Предположим, что в момент времени t* произошло некоторое событие (например, дефолт). Тогда, построив фиктивную переменную δt* =1, åñëè t = t* è δt* =0, åñëè t ≠ t*, и включив ее в качестве регрессора, например, в (9.33), сможем учесть в модели соответствующее событие.

Также с помощью фиктивной переменной вида δt* =1, åñëè t = t* è δt* =0, åñëè t < t* можно учесть в модели структурный сдвиг, произошедший в момент времени t*.

На практике часто применяется получивший широкое распространение метод сезонной декомпозиции и корректировки, связанный с деятельностью Бюро переписи США (U.S. Burea of Census).

Метод не только позволяет произвести декомпозицию ряда на тренд,

сезонность и случайную компоненту, но и учесть различное влияние дней недели, отдельных месяцев, скорректировать экстремальные наблюдения. Временной ряд последовательно подвергается нескольким стадиям обработки, причем итерационно, когда на каждом новом этапе анализа предыдущие оценки пересчитываются. Метод X-11, X-12-ARIMA применяется для квартальных или помесячных данных. Процедура в зависимости от типа требует в каче- стве исходных данных как минимум 3 полных года и работает при числе наблюдений до 600 (т. е. 50 полных лет при помесячных данных). Рассмотрим процедуру классической сезонной декомпозиции подробно.

1. Предварительная обработка исходных уровней ряда. На этом этапе исключается влияние устойчивых предсказуемых воздействий, например, связанных с календарным фактором:

эффекты торгового дня: для рядов, описывающих потоки (процессы), корректируется эффект дня недели или только эффект выходных дней, для временных рядов запасов может быть учтен эффект дня месяца, в который наблюдается зна- чение ряда.

эффект праздничных дней: для временных рядов, описывающих процессы, может быть указано число, определяющее продолжительность времени до праздников, например, если выбрано число 8, то уровень ежедневной активности изменяется за семь дней до праздников и остается на новом уровне до праздников.

346

2. Временной ряд сглаживается для получения предварительной оценки тренда yt(0). Для этой цели используется скользящая средняя с длиной активного участка 12 для помесячных данных или 4 для квартальных:

(0)

 

(

0,5yt−6

+

yt−5

+

...

+

yt

+

...

+

yt+5

+

0,5yt+6

)

/12,

месячные данные,

=

 

 

 

 

 

 

 

 

 

 

yt

(0,5y

+ y

+ y

+ y

 

+ 0,5y

 

)/4, квартальные данные.

 

 

 

t−2

 

t−1

 

t

 

t+1

 

 

t+2

 

 

 

 

 

3. Находится отношение соответствующих уровней ряда yt к уровням yt(0) для получения предварительной оценки сезонной и случай-

= (0)

ной компоненты Set yt / yt .

4. Полученные значения Set усредняются для кажäîãо «сезона» (месяца или квартала) и получают индексы сезонности Sej , j = 1,…,l, затем они корректируются так, чтобы суммарное воздействие се-

зонности на динамику было нейтральным

 

 

 

 

 

 

 

 

 

...

 

 

(1)

Se

j

12 Se

Se

Se

, месячные данные,

 

 

1

2

 

12

 

 

 

Sej

=

 

 

 

 

 

 

 

 

 

 

 

 

Se

j

4 Se

Se

Se

Se

4

, квартальные данные.

 

 

 

1

2

3

 

 

 

(1)

В результате определяется оценка сезонной составляющей

Set .

Интерпретация полученных значений — уровни ряда yt íà

(1)

Set

процентов выше (ниже) в период t относительно сглаженного временного ряда.

5. Десезонализированный временной ряд получается делением yt

(1)

= y

(1)

 

на сезонность Set : z

/Set .

 

t

t

(1)

получается после сглажи-

6. Пересмотренная оценка тренда yt

вания ряда zt. Нечетная длина участка сглаживания задается пользователем или выбирается пакетом Eviews автоматически.

7. Случайная компонента

(1)

получается делением скорректиро-

u

 

t

(1)

ванных на сезонные колебания значений ряда zt на оценку тренда yt .

В пакетах прикладных программ для чистоты фильтрации повторяются шаги после 6-го, начиная с 3-го. Если используется аддитивная модель временного ряда, то на 3, 5 и 7-м шагах деление заменяется вычитанием, а также на шаге 4 корректировка принимает вид (9.31).

Пример 9.1. Имеются данные об объеме производства продукции предприятия (по месяцам) в сопоставимых ценах, млн руб.

347

 

 

 

Таблица 9.17

 

 

 

 

Месяц

Объ¸м производства

Месяц

Объ¸м производства

Январь

5,1

Èþëü

5,6

Февраль

5,4

Август

5,9

Ìàðò

5,2

Сентябрь

6,1

Апрель

5,3

Октябрь

6,0

Ìàé

5,6

Ноябрь

5,9

Èþíü

5,8

Декабрь

6,2

Вычислим среднемесячный выпуск продукции по кварталам, т.е.

укрупним интервалы:

Таблица 9.18

Объем производства продукции предприятия (по кварталам) в сопоставимых ценах, млн руб.

Квартал

Объ¸м производства за квартал

В среднем за месяц

I

15,7

5,23

II

16,7

5,57

III

17,6

5,87

IV

18,1

6,03

После укрупнения интервалов основная тенденция роста производства стала очевидной: 5,23 < 5,57 < 5,87 < 6,03.

Пример 9.2. Рассчитаем скользящую среднюю по данным об урожайности зерновых культур.

 

 

 

 

Таблица 9.19

 

Исходные данные и результаты расчета

 

 

скользящей средней, ц/га

 

 

 

 

 

 

 

Фактический

 

Скользящая средняя

 

Ãîä

уровень

 

Трехлетняя

Пятилетняя

 

 

урожайности

 

 

 

 

 

 

 

1998

15,4

 

 

1999

14,0

 

(15,4+14,0+17,6)/3=15,7

 

2000

17,6

 

(14,0+17,6+15,4)/3=15,7

(15,4+14,0+17,6+15,4+

 

 

 

 

 

+ 10,9)/5=14,7

 

2001

15,4

 

(17,6+15,4+10,9)/3=14,6

(14,0+17,6+15,4+10,9+

 

 

 

 

 

+17,5)/5=15,1

 

2002

10,9

 

14,6

15,2

 

2003

17,5

 

14,5

17,1

 

2004

15,0

 

17,0

16,8

 

2005

18,5

 

15,9

17,6

 

2006

14,2

 

15,9

 

2007

14,9

 

 

 

y=153,4

 

 

 

 

348

Пример 9.3. Имеются сведения о квартальном товарообороте торговой компании «Дельта» за 20 последних кварталов.

Год / Квартал Товарооборот Год / Квартал Товарооборот

1998/1

155

1999/2

162

1998/2

160

1999/3

168

 

 

 

 

1998/3

163

1999/4

179

 

 

 

 

1998/4

173

2000/1

175

 

 

 

 

1999/1

161

2000/2

181

Год / Квартал Товарооборот Год / Квартал Товарооборот

2000/3

187

2001/4

207

2000/4

197

2002/1

192

 

 

 

 

2001/1

188

2002/2

196

 

 

 

 

2001/2

193

2002/3

200

 

 

 

 

2001/3

198

2002/4

210

1. Построим график ряда динамики.

На графике отчетливо видно, что товарооборот изменяется под воздействием сезонных колебаний. Заметен рост в 4 квартале каждого года (соответственно 4, 8, 12, 16 и 20 кварталы), а затем снижение товарооборота в первом квартале каждого года (соответственно 5, 9, 13 и 17 кварталы).

Построение аддитивной модели начнем с выделения сезонной компоненты временного ряда.

 

 

Объем товарооборота компании "Дельта"

 

 

220

 

 

 

 

 

ðóá.

200

 

 

 

 

 

180

 

 

 

 

 

ìëí.

 

 

 

 

 

160

 

 

 

 

 

 

 

 

 

 

 

 

140

 

 

 

 

 

 

0

4

8

12

16

20

 

 

 

 

квартал

 

 

В нашем случае l = 4 и h = n/l = 20/4 = 5. Для этого просуммируем уровни ряда по 1-му кварталу по всем пяти годам 155 + 161 + + 175 + 188 + 192 = 871 и найдем среднее значение 871/5 = 174,2, и аналогично для остальных кварталов. Получим таблицу 9.21. Среднее

349

значение по всем 20-ти наблюдениям равно 182,25. Вычитая из средних значений по кварталам 182,25 (например, для первого квартала 174,2 – 182,25 = –8,05), получим последнюю строку расчетной таблицы, в которой и содержатся значения сезонной компоненты St.

Таблица 9.20

Расчет сезонной компоненты для аддитивной модели

Квартал/Год

I

II

III

IV

1998

155

160

163

173

1999

161

162

168

179

2000

175

181

187

197

2001

188

193

198

207

2002

192

196

200

210

Среднее по одноименным

174,2

178,4

183,2

193,2

кварталам

 

 

 

 

Sl

–8,05

–3,85

0,95

10,95

Устраним сезонную компоненту из исходных уровней ряда и по-

лучим zi =Ti +Ui = yi Si в столбце 4 таблицы 9.21.

Далее рассчитаем значения ∆i = zi − zi−1, представленные в столбце 5 таблицы 9.21. Поскольку первые разности являются примерно одинаковыми (см. столбец 5), считаем, что ряд z имеет линейный тренд. Рассчитаем значения тренда Т. Модель тренда имеет вид

µ

= a + b t.

Рассчитаем параметры уравнения тренда. Необходи-

Tt

мые предварительные расчеты приведены в таблице 9.21 в столбцах 6–8: столбец 7 получается путем возведения в квадрат значений столбца 6, столбец 8 равен произведению столбца 4 на столбец 6.

Параметры уравнения линейного тренда:

b =

1640

= 2,47,

a =

3649

= 182,25.

 

 

665

 

20

 

Таким образом, уравнение тренда имеет вид:

T = 182,25 + 2,47t.

Подставляя в уравнение тренда последовательно соответствующие значения t, получим значения тренда для каждого уровня временного ряда (столбец 9 таблицы 9.21), например, для t = –9,5 получим

T(–9,5) = 182,25 + 2,47·(–9,5) = 158,785.

350

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]