Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
6. Эконометрика.Курс лекций.Ч.2.Булдык.doc
Скачиваний:
37
Добавлен:
14.11.2018
Размер:
2.93 Mб
Скачать

7. Моделирование одномерных временных рядов

7.1. Временные (динамичкские) ряды. Динамический ряд образует числовая последовательность наблюдений , характеризующих изменение экономического явления во времени, т.е. зарегистрированных в последовательные моменты времени .

В любом динамическом ряду содержится перечень хронологических дат (моментов) или периодов и конкретные количественные значения соответствующего показателя на эти даты или периоды. Количественные значения соответствующего показателя называются уровнями динамического ряда. Различают начальный, конечный (крайние) и промежуточные уровни динамического ряда. В зависимости от формы регистрации времени t динамические ряды делятся на моментные, интервальные (периодические) и ряды средних.

Динамический ряд имеет два главных отличия от рассматриваемых наблюдений анализируемого признака, образующих случайные выборки:

1) образующие временной ряд наблюдения не являются взаимно независимыми; в частности, значение, которое мы получим в момент времени t, может существенно зависеть от того, какие значения были зарегистрированы до этого момента;

2) наблюдения динамического ряда в отличие от элементов случайной выборки, вообще говор, не образуют стационарной последовательности, т.е. члены динамического ряда могут иметь различные законы распределения вероятностей.

Примером динамического ряда может служить ряд, представленный в табл. 7.1.

Т а б л и ц а 7.1

Годы

Национальный доход СССР в в сопоставимых ценах, млрд. руб

Годы

Н Национальный доход СССР в в сопоставимых ценах, млрд. руб.

1975

1976

1977

1978

1979

1980

397,5

418,6

439,7

460,8

472,8

490,9

1981

1982

1983

1984

1985

505,9

527,0

548,1

563,2

584,2

Если уровни динамических рядов характеризуют исследуемое явление в определенные моменты времени (например, численность населения или объем основных фондов на начало года), то они называются моментными рядами. Примерами моментных динамических рядов являются: ряд цен, ряд нормы прибыли, а также ряды, связанные с представлением о фондах, которые определяются количеством оборудования, долгом, финансовыми средствами и т.д. В каждом случае можно считать, что эти переменные заданы для определенных моментов времени, а наш ряд будет значением переменной в моменты времени, выбранные для измерения.

В интервальных (периодических) динамических рядах абсолютные показатели уровней относятся к некоторым периодам времени (неделе, месяцу, кварталу, году). Так, к интервальным динамическим рядам относятся динамические ряды, характеризующие валовой сбор зерна за год, число родившихся за год, национальный доход, данные по производству и данные по объему сделок. Эти ряды представляют собой сумму или накопление значений переменной за время, прошедшее с того момента, когда была проведена последняя регистрация данных.

Динамические ряды, уровни которых характеризуют изменение средних величин исследуемого явления во времени, называются динамическими рядами средних величин. Примером динамического ряда средних величин может служить динамический ряд среднегодовой добычи нефти или угля на одного работающего.

Абсолютные уровни моментных, интервальных рядов и рядов средних могут быть преобразованы в относительные величины, которые получаются путем отнесения абсолютных уровней к одному и тому же уровню, принятому за базу, или к предыдущему уровню. За базу сравнения, как правило, принимают начальный уровень динамического ряда. Показатели, получающиеся при этом, называют базисными. Сравнивая каждый уровень с предыдущим, получают цепные показатели.

При непрерывной регистрации времени происходит непрерывная запись изменения явления с помощью различных приборов, и полученный в результате динамический ряд называется непрерывным динамическим рядом. Современные методы динамического анализа построены на предположении непрерывности, но для преодоления вычислительных трудностей непрерывные ряды дискретизируются и анализ производится на дискретных последовательностях. Необходимость более тонкой классификации экономических рядов возникает в связи с проблемой различия обусловленности и зависимости между рядами. Так, различают динамические ряды, являющиеся результатом действия микропеременных, и ряды, являющиеся результатом действия макропеременных.

Когда исследуется деятельность предприятия в условиях конкуренции, то переменные, характеризующие выпуск продукции, не могут оказать заметного влияния на переменные, характеризующие совокупный выпуск продукции, общий индекс цен и национальный доход. Переменные, которые не могут влиять на эти основные экономические показатели, называются микропеременными, а все другие переменные - макропеременными.

При рассмотрении отдельно взятого ряда классификации не имеет значения, однако в случае исследования вопросов обусловленности такая классификация играет большую роль, так как эта задача сложнее для макропеременных, чем для микропеременных. Это происходит в силу того, что для микропеременных заранее известен механизм обусловленности, который обычно очень прост, а для макропеременных имеет место соотношение обратной связи. Отметим, что выбор вида динамического ряда  определяется целями анализа.

При построении динамического ряда нужно, чтобы его уровни состояли из однородных, сопоставимых величин. В этом случае он будет правильно отражать объективный процесс развития экономического явления. Анализируя несопоставимые уровни динамического ряда, можно получить неправомерные выводы.

Уровни динамического ряда могут быть несопоставимы:

  • по территории;

  • по кругу охватываемых объектов (не сравнимости данных по подчинению);

  • по временным периодам (данные относятся к различным периодам в течение года или разным датам);

  • из-за различного понимания единицы наблюдаемого объекта (понятие крупного и мелкого предприятия должно быть одинаковым для всего изучаемого объекта);

  • по масштабу измерения;

  • по структуре совокупности, для которой они вычислены.

Отметим, что конечной целью анализа динамических рядов является достижение более глубокого понимания тех причинных механизмов, которые обусловливают появление этих рядов. Такого понимания можно достичь, лишь рассматривая несколько различных рядов, которые порождает изучаемый экономический процесс.

7.2. Агрегатная модель компонент уровня ряда динамики. Динамика рядов экономических показателей в общем случае складывается из четырех компонент:

1) тенденции, характеризующей долговременную основную закономерность развития исследуемого явления;

2) сезонной компоненты, связанной с влиянием сезонности развития изучаемого явления;

3) циклической компоненты, характеризующей циклические колебания, свойственные любому воспроизводству;

4) случайной нерегулярной компоненты как результата влияния множества случайных факторов.

Тенденцией называется общее направление развития, долговременная эволюция. В экономических рядах динамики можно выделить тенденцию трех видов: 1) среднего уровня; 2) дисперсии; 3) автокорреляции. Аналитическая тенденция выражается некоторой функцией времени, называемой трендом. Тренд характеризует основную закономерность развития явления во времени. График тренда - гладкая кривая, называемая траекторией. Считается, что основная тенденция является результатом влияния комплекса причин, постоянно действующих на изучаемый процесс в течение длительного периода, т.е. она характеризуется детерминированной составляющей ряда динамики.

Тенденция среднего уровня представима в виде графика временного ряда. Аналитически это функция , вокруг которой варьируют фактические значения изучаемого явления. В таком случае значения тренда в отдельные моменты времени являются математическими ожиданиями ряда динамики. Отклонения от тренда определяются случайной составляющей, характеризующей влияние случайных факторов.

Тенденция дисперсии характеризует тенденцию изменения отклонений эмпирических значений от значений, вычисленных по уравнению тренда. Тенденцию этого вида можно также изобразить графически.

Тенденция автокорреляции - это тенденция изменения связи между отдельными уровнями ряда динамики.

В рядах динамики можно наблюдать и различного рода периодические колебания с различной продолжительностью периода. Если  периоды  колебаний длительностью один год, они называются сезонными колебаниями. Сезонная компонента характеризует тип изменения, который регулярно повторяется во времени. Это изменение должно завершиться в пределах года и повторяться год за годом, чтобы квалифицироваться как сезонное изменение. Поэтому для выделения сезонной компоненты в динамическом ряду необходимо собрать данные за период больше года.

Сезонные колебания свойственны рядам, характеризующим рост объема реализации удобрений каждую весну и его сокращение в течение остальных месяцев, рядам, характеризующим потребление и производство сельскохозяйственной продукции и т.д.

Кроме тенденции и сезонной компоненты, в динамическом ряду выделяется циклическая компонента. Циклические колебания динамического

ряда также являются повторяющимися и волнообразными, как и сезонные изменения. Но в отличие от сезонных изменений они обладают большой длительностью и меньшей возможностью прогнозирования по длительности и амплитуде. Так, например, не является редкостью циклическое изменение, требующее для своего завершения 4, 5 и более лет.

Таким образом, заметная долгосрочная компонента изменения динамического ряда, которая требует нескольких лет для своего завершения, называется циклической компонентой. Напомним, что долгосрочная компонента, лежащая в основе изменения динамического ряда, называется тенденцией. Важным примером циклической компоненты, которой экономисты уделяют значительное внимание, является деловой цикл.

В экономике изучаются также циклы с периодом колебаний равным 40 - 60 лет (длинные волны); 15 - 20 лет (строительные циклы); 6 - 11 лет (главные циклы); 2 - 4 года (второстепенные (малые) циклы); от одного года до дести - двенадцати лет (экономические циклы); 24 месяца (подциклы МЭК).

Отметим, что автором концепции больших циклов конъюнктуры (или “длинных волн”) периодичностью 40 - 60 лет является русский ученый Н.Д. Кондратьев. Концепция длинных волн приобрела широкую популярность в связи с изучением долговременных тенденций научно-технического прогресса.

Периодические колебания возникают, как правило, в результате суммирования большого числа случайных причин. Повторяющиеся же чередования подъема и спада в рядах динамики в большинстве случаев не характеризуются периодичностью.

Выделение циклической компоненты уровня динамического ряда производится при изучении циклов, если требуется измерить продолжительность отдельных этапов цикла. Компоненты, представляющие быстрые изменения (как правило, малой длительности) и не характеризующиеся наличием гладких размерных форм, образуют случайную (нерегулярную) компоненту. Случайная компонента порождается влиянием разнообразных событий на изучаемую величину. Так, случайную (нерегулярную) компоненту составляют ежедневные и еженедельные колебания уровня продажи некоторого товара, которые связаны с изменениями погоды и т.п.

Исследуемые динамические ряды могут представлять те или иные рассмотренные компоненты почти в чистом виде. Но в большей их части может проявляться как общая тенденция, так и некоторые сезонные изменения, на которые могут налагаться случайные флюктуации.

Для объяснения описываемого динамическим рядом процесса и использования результатов анализа при прогнозировании, уровни расчленяют на непосредственно не наблюдаемые компоненты и изучают в отдельности каждое из перечисленных выше движений. Указанные компоненты динамического ряда можно изобразить графически (см. рис.7.1)

Рис. 7.1

На рис. 7.1 данные динамического ряда за десть лет изображены волнистой линией с острыми гребешками. Линию тенденции представляет прямая, обозначенная буквой T. Сезонная компонента характеризует увеличение в середине года, а затем спад. И так каждый год. Циклическая компонента обозначена буквой C, ее волны длиною 3 - 4 года. Случайная (нерегулярная) компонента обозначена буквой .

При построении математической модели динамического ряда предполагают, что его уровни являются суммой воздействующих величин:

(7.1a)

или произведением:

(7.1б)

или это воздействие смешанное:

(7.1в)

Здесь - тенденция; - соответственно сезонная, циклическая и случайная (нерегулярная) компоненты; - детерминированная составляющая, включающая тренд и циклические колебания.

Если перейти к логарифмам, то мультипликативную модель (7.1б) динамического ряда можно привести к линейному виду

. (7.2)

При выборе модели (7.2) слагаемое рассматривается как случайная переменная с нулевым математическим ожиданием, и тогда формула (7.2) записывается в виде

.

В этом случае исходную модель (7.2) логичнее записать в виде

При допущении аддитивности компонент вклад сезонной компоненты остается на том же самом уровне для данной части года независимо от предельного уровня динамического ряда. При допущении мультипликативности компонент по мере возрастания предельных значений динамического ряда абсолютная величина сезонной колеблемости от периода к периоду также возрастает.

Пример 7.1. Пусть временные ряды характеризуются следующими событиями: 1) школьные каникулы; 2) пониженный спрос на керосиновые примусы; 3) продажа елочных украшений; 4) повышенный спрос на гостиные гарнитуры в некотором городе; 5) продажа детских колясок. Укажем, какую из компонент характеризуют перечисленные временные ряды.

Временной ряд, характеризующий наступление и длительность школьных каникул, описывает циклическую компоненту, так как каникулы наступают в строго определенное время и имеют определенную продолжительность.

Уровни динамического ряда, характеризующего пониженный спрос на керосиновые примусы, определяют тенденцию. Сезонную компоненту временного ряда естественно связать с продажей елочных украшений, которые реализуются в канун Нового года. События 4 и 5 характеризуют случайную компоненту временного ряда.

Рассмотрим моделирование компонент ряда динамики.

7.3. Выбор функции тренда. Самым распространенным методом моделирования тенденции динамического ряда является аналитическое выравнивание. Аналитическое выравнивание динамического ряда состоит в выражении тенденции развития в виде функции изучаемого показателя от времени, называемой моделью тренда. Функции, описывающие закономерности развития явлений во времени, называют кривыми роста.

В аналитическом выражении тренда время рассматривается как независимая переменная, а уровни ряда - как функция этой независимой переменной. При этом следует подчеркнуть, что развитие явления во времени рассматривается как результат действия факторов, влияющих на это развитие.

Существуют различные приемы, позволяющие выбирать тип кривой, достаточно хорошо аппроксимирующей тенденцию. Наиболее простой способ состоит в выборе функции на основе графического изображения временного ряда.

Второй способ выбора типа кривой заключается в применении метода последовательных разностей.

Тип кривой можно выбрать и на основании значения суммы квадратов отклонений, заданных уровней динамического ряда от расчетных, полученных выравниванием.

Наиболее приемлемым является метод, основанный на сравнении характеристик изменения приростов исследуемого динамического ряда и соответствующих характеристик кривых роста. Для сглаживания выбирается та кривая, закон изменения прироста которой наиболее близок к закономерности изменения уровней динамического ряда. Этот метод называется методом характеристик прироста. Для применения метода характеристик прироста:

  • проводят сглаживание динамического ряда скользящей средней;

  • определяют средние значения приростов;

  • вычисляют характеристики прироста:

;

  • выбирают тип кривой.

Сглаживание динамического ряда скользящей средней по формулам (3.5), (3.12) (см. ) дает возможность определить тенденцию изменения ряда.

При вычислении взвешенных скользящих средних приростов применяют рекуррентные формулы:

Вычислив средние приросты динамического ряда, определяют ряд производных характеристик прироста. Анализируя изменение средних приростов и их характеристик, сравнивают их с соответствующими характеристиками кривых роста (табл. 7.2).

Т а б л и ц а 7.2

Показатель

Характер изменения

Вид кривой

Примерно одинаковые

Линейно изменяются

То же

Примерно одинаковые

То же

- “ -

- “ - или ,

или

В тех случаях, когда значения средних приростов оказываются отрицательными, рекомендуется увеличить интервал усреднения, принятый для вычисления скользящей средней, или заменить уровни динамического ряда, для которых получаются отрицательные , расчетными величинами, например средними из уровней, предшествующих таким уровням и следующих за ними (достаточно взять по два уровня до и после момента ).

Если исследуемый динамический ряд имеет понижающуюся тенденцию, то средние приросты вычисляют в обратном направлении, т.е. с конца ряда.

Для подбора типа кривой можно воспользоваться также рекомендациями, изложенными в учебнике .

Пример 7. 2. Производство ткани (млн. м2) в Беларуси характеризуются динамическим рядом, представленным в табл. 7.3 (первый и второй столбцы).

Для выбора формы кривой вычислим конечные разности и характеристики приростов исследуемого динамического ряда. Результаты вычислений сведены в таблице 7.3. Как видим из третьего, четвертого и пятого столбцов таблицы 7.3, конечные разности заметно варьируют. Следовательно, полиномы первой, второй, третьей и более высоких степеней не подходят в качестве кривых, описывающих тренд динамического ряда. Поэтому применим метод характеристик приростов. Для этого проведем сглаживание ряда семилетней скользящей средней (шестой столбец), которое дает возможность наметить тенденцию изменения уровней ряда. Определим средние приросты по формуле:

.

Вычислим характеристики приростов:

.

В таблице 7.3 приведены значения средних приростов и их характеристик, анализ которых показывает, что отношения , примерно одинаковые. Следовательно, в качестве кривой тренда можно выбрать экспоненциальную функцию . Таблица 7.3

1

2

3

4

5

6

7

8

9

10

11

1975 315 - - - - - - - - -

1976 322 7 - - - - - - - -

1977 329 7 0 - - - - - - -

1978 340 11 4 4 340,3 11,0 - 2,3979 0,0323 -3,4319

1979 350 10 -1 -5 352,1 12,86 1,86 2,5541 0,0365 -3,3098

1980 371 21 11 12 365,9 14,96 2,10 2,7054 0,0409 -3,1970

1981 378 7 -14 -25 382,2 16,18 1,22 2,7838 0,0423 -3,1622

1982 399 21 14 28 399,9 16,89 0,71 2,8267 0,0422 -3,1645

1983 420 21 0 -14 417,9 15,71 -1,18 2,7543 0,0376 -3,2809

1984 435 15 -6 -6 435,7 14,79 -0,92 2,6940 0,0339 -3,3830

1985 451 16 1 7 448,2 12,82 -1,97 2,5510 0,0286 -3,5542

1986 457 6 -10 -11 - - - - - -

1987 467 10 4 14 - - - - - -

1988 480 13 3 -1 - - - - - -

Пример 7.3. Введение механизации на предприятии позволило увеличить производительность труда. С февраля 1988г по апрель 1989г производительность характеризуется динамическим рядом, представленным в табл. 7.4, (первый и второй столбцы).

Семилетнюю скользящую среднюю вычислим по формуле:

Тогда:

и т.д. Анализируя значения семилетней скользящей средней, можно сделать вывод о том, что тенденция приближается к линейной.

Рис 7.2

Для проверки этого вывода вычислим характеристики приростов (см. табл. 7.4) и построим соответствующие графики (рис. 7.2). Средние приросты вычислим, используя формулу:

Анализ значений характеристик приростов и их графиков подтверждает сделанное предположение о том, что тенденция динамического ряда описывается линейной функцией: .

Таблица 7.4

Месяц и год, t

Произво

дитель-

ность труда,

02.1988

20

-

-

-

-

-

-

-

03.1988

24

-

-

-

-

-

-

-

04.1988

28

-

-

-

-

-

-

-

05.1988

30

29,9

2,25

5,06

0,07

0,81

-2,66

0,003

06.1988

31

31,4

1,93

3,72

0,06

0,66

-2,73

0,002

07.1988

33

32,9

1,68

2,82

0,05

0,52

-3,00

0,002

08.1988

34

34,5

1,71

2,92

0,05

0,54

-3,00

0,001

09.1988

37

36,5

1,71

2,92

0,05

0,54

-3,00

0,001

10.1988

38

38,1

1,68

2,82

0,04

0,52

-3,22

0,001

11.1988

40

39,8

1,71

2,92

0,04

0,54

-3,22

0,001

12.1988

41

41,1

1,79

3,20

0,04

0,58

-3,22

0,001

01.1989

43

-

-

-

-

-

-

-

02.1989

45

-

-

-

-

-

-

-

03.1989

48

-

-

-

-

-

-

-

7.4. Методы определения сезонных колебаний. Одной из задач анализа динамических рядов является задача обнаружения определенных закономерностей, которые регулярно повторяются с периодом, равным двенадцати месяцам (или нескольким месяцам), и называются сезонными колебаниями. В общем случае сезонными колебаниями будем называть все такие изменения динамического ряда, которые соответствуют одинаковому и строго периодическому ритму в определенной причинной связи, если период ритма и не равен одному году.

Исследование сезонности предполагает выявление и измерение периодических колебаний в рядах динамики, выявление факторов, вызывающих сезонные колебания, и определение экономических последствий проявления сезонности.

Сезонная компонента находится путем исключения из данных всех других компонент и вычисляется для каждого месяца (или сезона) года, как правило, в виде индекса.

При анализе сезонных колебаний следует учитывать тот факт, что период колебаний равен одному году (нескольким месяцам) и что наблюдения обычно проводятся лишь через определенные интервалы: ежеквартально, ежемесячно, еженедельно. Большинство выводов, относящихся к сезонным колебаниям в течение года, может быть адекватно распространено и на циклические процессы с иным периодом времени. Примером может служить изменение температуры в течение дня или цен в течение недели.

Разработано несколько способов исследования сезонных колебаний: простой средней, скользящей средней (простой и взвешенной), относительных чисел. Наиболее точным, а, следовательно, наиболее распространенным является метод расчета сезонных волн, базирующийся на определении тенденции с помощью скользящей средней и методом наименьших квадратов.

Считая, что влияние сезонности носит мультипликативный характер, рассмотрим модель вида

.

Использование этой модели заключается в выделении сезонной компоненты делением уровней динамического ряда на среднее тренда по рассматриваемому году. Полученные отношения рассматриваются как оценки мультипликативного сезонного фактора.

Разделив поквартальные величины на эти средние, получим показатели сезонности. Для определения индексов сезонности, характеризующих сезонную компоненту, вычисляем средние поквартальных данных.

Иной подход заключается в предварительном исключении тренда методом скользящих средних и последующем изучении остаточных характеристик сезонности. Если, при этом, простая скользящая средняя с равными весами вычисляется по отрезку длиной, равной периоду циклической компоненты, то значение тренда для этой компоненты равно нулю. Следовательно, остаток остается незатронутым.

Исключение тренда иногда производят, осуществляя более тщательное скользящее усреднение. Для этого вычисляют взвешенные скользящие средние, производя выравнивание интервала сглаживания полиномом некоторой степени.

Если уровни динамического ряда характеризуют экономический процесс по месяцам, то определение сезонной компоненты начинается с расчета 12-месячной скользящей средней. Так как сезонные колебания имеют постоянный период в 12 месяцев, этим методом можно пользоваться с большей уверенностью, чем в случае, когда изучается цикл с неопределенным периодом. Поскольку отдельные наблюдения подвержены влиянию случайных факторов, то размер колебаний непостоянен из года в год. Поэтому уровень, вычисленный с помощью скользящей средней, не полностью свободен от сезонных влияний и отклонения от него представляют сезонные колебания не точно. Чтобы частично устранить эти погрешности, будем вычислять индексы сезонных изменений по скользящим средним: как средние отношения эмпирических месячных данных к скользящему уровню по месяцам. Вычисляемая скользящая средняя должна относиться к тому самому моменту, к которому относится соответствующий сопоставимый с ней первоначальный уровень. Для выполнения этого требования нужно вычислить среднее из двух скользящих средних, т. e. произвести центрирование.

Например, помесячные данные должны быть отнесены к середине каждого месяца. Среднее из 12 помесячных данных для некоторого года приходится на 1 июля. Среднее из 12 уровней, начиная с февраля этого года и до января следующего года, приходится на 1 августа. Поэтому для получения уровня, который можно сравнить с исходным отнесенным к 15 июля, вычисляем среднее из этих двух средних. Таким образом, сохраняется сопоставимость ряда скользящих средних с исходным динамическим рядом.

Для вычисления точного индекса, характеризующего высоту сезонной волны для каждого месяца года, применяются различные методы. Но наиболее подходящими показателями такого индекса будут средняя арифметическая и медиана. Необходимо производить выправление средней арифметической и медианы, так как их среднее значение за 12 месяцев редко равно 100, потому что трудно добиться полного исключения влияния несезонных факторов. Для выправления среднего арифметического по месяцам нужно каждую помесячную среднюю арифметическую умножить на обратную величину средней арифметической за 12 месяцев. После такого выправления, среднее, из выправленных средних арифметических, будет равно 100. Аналогичное выправление производится и для медианы. Отметим, что вычисленная таким образом средняя арифметическая реагирует на все происходящие изменения, поэтому может быть искажение под влиянием необычных событий. Медиана же не подвержена влиянию колебаний в отдельные месяцы. Она будет значительно изменяться, если помесячные данные распределения численностей не являются концентрированными.

Для того чтобы оценить сезонную компоненту в аддитивной модели, нужно также вначале оценить тренд. Скользящая средняя с равными весами, вычисляемая на отрезке усреднения, равном одному году, не должна сильно повлиять на остатки .

Рассмотрим динамический ряд с месячными данными. Будем вычислять центрированные скользящие средние по формуле

и налагать то же ограничение, что и для аддитивной модели:

Суть этого ограничения состоит в том, что простая скользящая средняя, которая, как правило, оценивает линейный тренд, в этом случае фактически элиминирует полином 2-го порядка. Более того, средняя, которая элиминирует полином -гo порядка при ограничении , будет элиминировать полином порядка + 1. Вычисляя скользящие средние, мы тем самым вычисляем значения тренда. Но, как указал Д.Дарбин, определение значений тренда для выявления сезонных колебаний не является необходимым. Покажем это. Обозначим через отклонения уровней динамического ряда от 12-месячной скользящей средней:

Вычислим средние отклонений :

(7.3)

где число уровней динамического ряда равно 12(+1), а не 12; - число лет. Различные пределы суммирования объясняются тем, что центрированная 12-месячная средняя дает первое значение для седьмого уровня динамического ряда, а последняя - для 12 + 6.

Сезонный эффект определим как разность, т. e.

где Определив месячные средние исходного динамического ряда по формуле

а общую среднюю, не считая шести первых и шести последних значений, по формуле

и подставив полученные значения в выражение (7.3), будем иметь

Отсюда следует, что значения отклонений от тренда могут быть получены по месячным средним без построения тренда. Необходима только корректировка, использующая первые и последние двенадцать членов ряда. Значения остальных -24 уровней динамического ряда учитываются через месячные средние. Указанный метод определения сезонных колебаний эффективен, так как оценки месячных сезонных эффектов, полученные по 12 значениям без элиминирования тренда, имеют дисперсию, равную: . Оценка несезонной постоянной, которая является составляющей в рассматриваемом методе, имеет дисперсию, не меньшую .

Рассмотрим теперь динамический ряд, состоящий из квартальных данных за лет:. Отклонения от тренда данных за первый квартал равны:

Их сумма равна:

где S - сумма всех уровней динамического ряда, - сумма уровней первого квартала. Аналогично определяются суммы отклонений для остальных трех кварталов:

Так как S =S1+S2+S3+S4 , то среднее значение этих сумм равно:

Индексы сезонности определим вычитанием этой средней из сумм отклонений, вычисленных для каждого квартала. Они будут равны:

(7.4)

Следовательно, индексы сезонности равны отклонениям квартальных средних от общей средней, скорректированных членами, зависящими только от первых четырех и последних четырех значений динамического ряда.

Определив основную тенденцию динамического ряда методом скользящих средних и выбрав форму кривой тренда, с помощью метода наименьших квадратов оценивают параметры кривой тренда. Затем для каждого квартала или месяца рассматривают отношение фактического уровня к показателю, вычисленному по уравнению тренда. Тем самым получают показатели сезонности. Индексы сезонности рассчитываются по способу средней арифметической из показателей сезонности. Далее производится выправление индексов сезонности. Индексы сезонности можно вычислять и по расположению. Для этого в ранжированном ряду показателей сезонности для каждого квартала отбрасываются наибольшие и наименьшие значения. Для оставшихся значений показателей вычисляется средняя арифметическая. Такая средняя арифметическая по расположению не подвержена влиянию крайних значений, следовательно, индексы сезонности более устойчивы.

После определения индексов сезонности по месяцам или кварталам определяют уровни динамического ряда, в которых элиминировано влияние сезонности. Для этого необходимо фактические уровни динамического ряда разделить на соответствующие индексы. Затем снова методом наименьших квадратов оценивают параметры уравнения тренда.

Показателем колеблемости динамического ряда за счет сезонности является среднее квадратичное отклонение, определяемое по формуле

или

для поквартальных или месячных данных соответственно.

Пример 7.4. В табл.7.5 приведены данные об объеме ежеквартальных продаж в фирме “Квант”, производящей сельскохозяйственный инвентарь.

Исследование сезонности проведем методом, базирующимся на определении тенденции методом наименьших квадратов и определении индексов сезонности, рассчитанных по уравнению тренда.

Определим уравнение тренда исследуемого динамического ряда. Для этого вычислим средние скользящие приросты по формуле

Так как средние скользящие приросты примерно одинаковы, то для исследуемого динамического ряда характерен линейный тренд Параметры тренда оценим, решив систему:

Таблица 7.5

Год

Квартал, t

Объем продаж,

млрд. руб.

Год

Квартал,

Объем продаж,

млрд. руб.

1982

1983

1984

1985

1986

I

II

III

IV

I

II

III

IV

I

II

III

IV

I

II

III

IV

I

II

III

IV

17,5

17,7

14,2

16,7

18,6

19,5

15,4

20,7

21,8

22,5

15,8

22,4

23,4

22,7

16,8

22,2

22,6

22,7

16,8

22,6

1987

1988

1989

1990

I

II

III

IV

I

II

III

IV

I

II

III

IV

I

II

III

IV

21,9

23,6

15,8

22,3

21,8

23,6

16,6

22,0

23,1

24,7

17,9

25,0

24,6

26,6

17,2

25,5

которую предварительно упростим, перенеся начало координат в середину ряда динамики. После этого параметры и определим по формулам:

Итак, искомое уравнение тренда имеет вид = 20,689 + 0,081.

Затем определим расчетные уровни по уравнению тренда. Индексы сезонности являются показателями, характеризующими результаты сравнения фактических уровней данного квартала с уровнями, вычисленными при выявлении тенденции для этого же квартала. Индексы сезонности определим двумя способами: исключив тренд, во-первых, с помощью центрированных скользящих средних:

во-вторых, с помощью уравнения 20,689 + 0,081t.

Исключив тренд с помощью центрированных скользящих средних или уравнения 20,70 + 0,08t и получив показатели сезонности, вычислим среднюю арифметическую из них по одноименным кварталам, т.e. определим индексы сезонности. В табл. 7.6 приведены вычисленные таким образом индексы сезонности для каждого квартала. Полное элиминирование несезонных факторов достигается тогда, когда средняя из индексов сезонности равна 4. В нашем случае сумма индексов сезонности, вычисленных с помощью скользящих средних, равна 4,004, а с помощью уравнения тренда - 3,996. Поэтому произведем выправление индексов сезонности. Для этого разделим их на 1,001 и 0,999 соответственно.

Таблица 7.6

Квартал

Индекс сезонности, вычисленный с помощью

скользящей средней

уравнения тренда

I

II

III

IV

1,064 (1,063)

1,102 (1,101)

0,792 (0,792)

1,045 (1,044)

1,060 (1,061)

1,094 (1,095)

0,785 (0,786)

1,057 (1,058)

В скобках указаны выправленные индексы.

Сравнив соответствующие индексы сезонности с выправленными индексами, видим, что расхождение между ними небольшое. Это объясняется тем, что сезонные колебания относительно невелики и повторяются из года в год.

Анализируя данные табл. 7.6, замечаем, что “сезонный пик” продаж достигается во втором квартале, а “сезонная яма” - в третьем. Этот факт подтверждается индексами сезонности, вычисленными с помощью скользящей средней и с помощью уравнения тренда.

Исключив сезонность из уровней ряда динамики, оценим параметры и тренда Выполнив промежуточные расчеты, найдем:

.

Таким образом, уравнение тренда = 20,689 + 0,082t отличается только коэффициентом при t. Этот факт еще раз подчеркивает влияние сезонности на уровни продаж.

Рис. 7.3

График тренда, уровни исходного динамического ряда и уровни ряда после исключения сезонности представлены на рис. 7.3 (линии 1-3 соответственно). Исключив сезонные колебания, из графика замечаем, что на скорректированные уровни динамического ряда, кроме тренда, оказывают влияние еще циклическая и случайная компоненты.

Для исследования периодических колебаний в рядах динамики целесообразно применять гармонический анализ.

Если величину изучаемого показателя t представить как части длины окружности:

где число значений изучаемого показателя или величина периода, то зависимость соответствующих им значений уровней динамического ряда запишется в виде следующей суммы:

(7.5) которая представляет собой гармоник ряда Фурье.

Практически выявление периодичностей состоит в преобразовании исходной тенденции в новую тенденцию, где роль периодической компоненты проявляется ярче. Задача, таким образом, сводится к аппроксимации тенденции суммой (7.5), в которой среднее значение за период; - неизвестные коэффициенты гармоник. Коэффициенты оцениваются по методу наименьших квадратов, т. e. при условии минимизации функции

(7.6)

Получение формул для коэффициентов облегчается благодаря свойству ортогональности:

Тогда минимум функции (7.6) достигается при следующих значениях коэффициентов

Так как число гармоник не может превышать ( /2), то по этим формулам вычисляются коэффициенты для гармоник. Для последней гармоники всегда

Если вычислять число гармоник и , то число коэффициентов при синусах и косинусах будет одинаковым.

Уравнение (7.5) называется амплитудным и фазовым представлением тенденции, а - амплитудой. Дисперсия, учитываемая одной гармоникой, определяется по формуле Для последней гармоники . Часть дисперсии, учитываемая определенной гармоникой, представляется в виде отношения величины или к общей дисперсии . Так как никакие две гармоники не между собой, то они не будут учитывать одну и ту же часть общей дисперсии, т. e. дисперсии, учитываемые различными гармониками, складываются.

Пример 7.5. Применим гармонический анализ для расчета периодической функции для динамического ряда, характеризующего реализацию товаров весенне-летнего сезона (данные приведены в табл . 7.7).

Таблица 7.7

Месяц

Реализация товаров

, ден. ед.

Месяц

Реализация товаров

ден. ед

1

41,4

/6

7

134,8

7/6

2

45,5

/3

8

112,0

4/3

3

51,6

/2

9

70,7

3/2

4

62,1

2/3

10

52,9

5/3

5

83,2

5/6

11

40,5

11/6

6

108,3

12

33,3

2

836,3

Наибольшее количество гармоник, которое можно рассчитать для этого ряда, равно 6. Вычислим коэффициенты :

В целом модель сезонной волны имеет вид

(7.7)

Дисперсии, учитываемые гармониками, составляют:

Теперь определим вклады di шести гармоник в дисперсию динамического ряда по формуле: Так как общая дисперсия равна 1327,308, то часть общей дисперсии, учитываемая гармониками, составляет: первой - 64,97 %, второй - 8,22, третьей - 1,04, четвертой - 0,59, пятой - 1,36, шестой - 0,14 %.

Как следует из данных, приведенных выше, шесть гармоник объясняют 76,32 % дисперсии динамического ряда. Наиболее важными являются первая и вторая гармоники, объясняющие 73,19 % общей дисперсии. В табл. 7.8 приведены значения, рассчитанные по функции (7.7), и модули относительных отклонений расчетных значений от фактических. Используя эти данные, вычисляем среднюю ошибку аппроксимации:

которая будет равна 0,0669, или 6,69 %.

Таблица 7.8

41,4

44,6

0,077

134,8

126,9

0,059

45,5

49,4

0,086

112,0

117,7

0,051

51,6

57,4

0,112

70,7

78,2

0,106

62,1

57,1

0,081

52,9

59,4

0,123

83,2

86,4

0,038

40,5

38,7

0,044

108,3

107,7

0,006

33,3

32,63

0,020

На рис. 7.4 отображены фактические данные (сплошная линия) и данные, сглаженные шестью гармониками (штриховая линия). Значения функции (7.7) достаточно близко расположены к фактическим данным.

Рис.7.4

Это подтверждается малым значением средней ошибки аппроксимации.

Изучение эволюции сезонной волны сезонных колебаний экономических явлений приведены в учебнике .

В заключение заметим, что после установления и выявления сезонной компоненты ее можно исключить из ряда динамики. Для этого исходные месячные или квартальные уровни динамического ряда делят на соответствующие сезонные индексы. После исключения сезонной компоненты уровни динамического ряда содержат тенденцию, циклическую и случайную компоненты.

7.5. Анализ и моделирование случайной компоненты. Целью исследования является выяснение вопроса: подчинены ли ряды некоторому закону или любая их часть случайна? Наиболее простым критерием проверки случайности исследуемого ряда является определение местонахождения максимумов и минимумов. Для применения такого критерия подсчитывают «пики» и «ямы» динамического ряда: .

«Пиком» называют значение, которое больше двух соседних. Два или более равных значения, которые больше предшествующих и последующих. Рассматриваются как один пик. «Ямой» называется значение, меньшее двух соседних. Пики и ямы называются экстремальными точками динамического ряда. Число экстремальных точек на единицу меньше числа интервалов монотонности. Интервал между двумя экстремальными точками называется «фазой».

Вычислив число экстремальных точек исследуемого динамического ряда, сравниваем с математическим ожиданием . Если их больше, то ряд является быстро колеблющимся. Если их меньше, то последовательные значения положительно коррелированны.

Для оценки существенности разности между подсчитанным числом экстремальных точек и их ожидаемым числом, вычисляем стандартное отклонение (среднее статистическое квадратическое отклонение) .

В случайном ряду экстремальная точка приходится примерно на каждые полтора (1,5) наблюдения.

Кроме вычисления числа экстремальных точек, изучают еще и распределение интервалов («фаз») между ними. Для установления наличия фазы длиной рассматривается уровня динамического ряда, где (для случая роста) первый больше второго, второй меньше третьего, третий меньше четвертого, …, -й меньше -го, а -й больше -го. Проверка случайности состоит в сравнении математического ожидания числа фаз различной длины и математического ожидания полного числа фаз, вычисленных по формулам , с числом рассчитанных фаз.

Для выявления случайной компоненты динамического ряда применяется также метод конечных разностей, который состоит в вычислении первых, вторых, третьих, …, разностей, делении на и определении момента когда отношение становится постоянным, т.е. Достоверность равенства определяется при помощи контрольной величины при … При этом нужно найти такое , что будет надежным, а - нет. Тогда можно предположить, что будет оценкой для неизвестного рассеяния случайной компоненты.

Пример 7.6. В табл. 7.8 приведены данные об урожайности озимой ржи.

Рассматриваемый динамический ряд содержит 56 уровней. Так как дважды встречаются одинаковые уровни (в 1957 и 1958 гг., в 1961 и 1962 гг.), уменьшим число уровней до 54. Анализ динамического ряда показывает, что число экстремальных точек равно 35. Вычисляем математическое ожидание числа экстремальных точек для случайного ряда, состоящего из 54 наблюдений:

Число экстремальных точек исследуемого динамического ряда и математическое ожидание ожидаемого числа экстремальных точек хорошо согласуются, так как стандартное отклонение

больше, чем разность 35 - 34 = 1. Следовательно, динамический ряд представляет случайную выборку.

Таблица 7.8

Год,t

Урожайность,

, ц/га

Год,t

Урожайность,

, ц/га

Год,t

Урожайность,

, ц/га

1935

1936

1937

1938

1939

1940

1941

1942

1943

1944

1945

1946

1947

1948

1949

1950

1951

1952

1953

14,1

15,8

14,2

13,8

14,6

14,0

15,6

15,2

15,4

12,2

15,4

13,9

14,8

14,4

15,8

15,3

13,8

13,4

15,5

1954

1955

1956

1957

1958

1959

1960

1961

1962

1963

1964

1965

1966

1967

1968

1969

1970

1971

1972

14,0

13,5

14,9

15,7

15,7

14,4

16,2

14,4

14,4

14,1

14,7

14,6

13,0

13,7

13,3

14,5

12,8

13,6

13,2

1973

1974

1975

1976

1977

1978

1979

1980

1981

1982

1983

1984

1985

1986

1987

1988

1989

1990

1991

12,9

13,4

14,3

14,2

14,9

15,3

16,1

16,7

13,3

13,9

14,9

15,7

15,8

15,5

15,1

12,9

17,0

16,4

-

Пример 7.7. Рассмотрим динамический ряд, характеризующий доходы фирмы, производящей детские игрушки:

Таблица 7.9

Год t

1982

1983

1984

1985

1986

1987

1988

1989

1990

Доходы

фирмы

ден.ед .

29,22

30,0

39,19

39,25

42,48

43,48

43,85

46,04

47,35

Оценим неизвестное рассеяние случайного элемента , предполагая, что рассматриваемый динамический ряд состоит из гладкой и случайной компонент. Для этого найдем разности . Далее вычислим рассеяние разностей:

Значения биномиальных коэффициентов приведены в табл. 7.9.

Таблица 7.9

0

1

2

3

4

5

6

7

8

9

10

1

2

6

20

70

252

924

3432

12870

48620

184756

Тогда = 42,6165, = 6,4467, = 4,1331, = 4,2084, = 3,6570, = 2,9206.

Для необходимых проверок вычисляем

Затем находим контрольные величины:

При нормальном распределении с вероятностью ошибки , т. e. с уровнем доверия 0,05, должно быть равно 1,96. Анализируя значения , можно предположить, что путем образования разностей второго порядка более или менее исключена систематическая компонента исследуемого динамического ряда. В качестве оценки неизвестного рассеяния случайной компоненты возьмем = 4,2084, так как = - 0,4118 < 1,96.

Метод конечных (последовательных) разностей прост в реализации, но применять его следует осторожно, так как последовательные значения не являются независимыми и часто убывают (или возрастают), т. e. не сходятся к постоянному значению. Кроме того, сходимость не доказывает, что ряд первоначально состоял из полинома и случайной компоненты. Сходимость лишь подтверждает, что динамический ряд может быть приближенно представлен в виде полинома плюс случайная компонента. Тем не менее этот метод ценен тем, что дает верхний предел порядка полинома , который целесообразно использовать для элиминирования тренда.

7.6. Авторегрессионные модели. Анализируя динамические ряды, можно выявить, что при объяснении поведения переменной величины в течение некоторого периода используются значения той же величины в предыдущие периоды. Например, потребление в течение года изменяется не только в соответствии с наличными доходами в течение данного года, но также в зависимости от уровня потребления, уже достигнутого в предыдущем году. Поэтому модели, кроме текущих значений эндогенных переменных, часто содержат значения некоторых из этих переменных, которые они принимали в предыдущие периоды. Такие модели будем называть авторегрессиоными моделями. Они имеют следующий вид:

, (7.8)

Число h, определяющее количество периодов, от которых зависит текущее значение процесса , называется порядком авторегрессии.

Если процесс может быть представлен в виде разностного уравнения

,

где - скользящая средняя динамического ряда, то он называется процессом скользящей средней.

Таким образом, модель авторегрессии является моделью стационарного процесса, выражающей значение уровня динамического ряда в виде линейной комбинации конечного числа предшествующих значений этого показателя и аддитивной случайной составляющей.

Авторегрессионое представление процесса особенно полезно для прогноза эволюции динамического ряда. Следовательно, авторегрессионые модели применяются, когда известно, что изучаемый процесс зависит от развития в прошлом. Авторегрессионые модели применяются также при определении преобразования, приводящего к процессу, близкому к последовательности независимых случайных величин. Речь идет о том, что, желая рассматривать случайный процесс, используют статистические методы, задуманные для применения к авторегрессионому представлению. Поэтому существуют методы формирования стационарных процессов из временных рядов. Рассмотрим их.

1. Если уровни динамического ряда содержат линейный тренд

,

где - нормально распределенная случайная составляющая с нулевой средней и постоянной дисперсией, то разности первого порядка

уже не содержат тренда. Поэтому - случайная величина, распределение которой полностью определяется распределением величины Математическое ожидание разностей первого порядка , так как , т.e. оно не зависит от t. Если тренд динамического ряда характеризуется многочленом порядка и нормально распределенной случайной составляющей с нулевой средней и постоянной дисперсией , то разности порядка p

являясь случайной величиной с постоянным математическим ожиданием, также не зависят от t. В этом случае .

Таким образом, динамический ряд, уровни которого характеризуются полиномиальным трендом и случайной компонентой с нормальным законом распределения , приводится к стационарному процессу образованием разностей, порядок которых определяется порядком полиномиального тренда.

2. Пусть тренд динамического ряда представим в виде

,

где - закон распределения случайной компоненты. Тогда динамический ряд , где , имеет постоянную среднюю , и может быть приведен к стационарному процессу.

3. Рассмотрим аддитивную модель динамического ряда

,

где - сезонная составляющая (постоянная пропорциональности, не меняющаяся от года к году); - случайная компонента с законом распределения, Тогда его уровни колеблются около среднего значения с некоторым периодом L, т.e. с точностью до случайной компоненты .

Вычислим разности через L шагов, т.e. . Случайная величина будет характеризоваться составляющей . Следовательно, процесс - это стационарный процесс, среднее значение которого совпадает со средним значением исходного ряда.

Рассмотренные случаи сведения динамических рядов к стационарным процессам могут быть описаны с помощью символического оператора сдвига D, который преобразует в , так что и т.д. Используя оператор сдвига, соотношение (7.8) можно записать так:

или

.

Определив оператор как полином степени h, получим уравнение (7.8) в виде

или (7.9)

Уравнение (7.9) содержит неизвестных параметров: 1) h коэффициентов ; 2) среднее значение динамического ряда ; 3) дисперсию случайной составляющей.

Можно показать, что уравнение (7.9) можно рассматривать как разностное неоднородное уравнение относительно . Для нахождения решения этого уравнения решим вначале соответствующее однородное разностное уравнение . Его решение задается функцией

(7.10)

где - постоянные, определяемые из начальных условий; , - корни характеристического уравнения

. (7.11)

Уравнение (7.11) является уравнением степени h и имеет ровно h корней.

Предположим, что все корни уравнения (7.11) различны и < 1 для всех i, т.e. что все корни этого уравнения попадают внутрь круга единичного радиуса. Тогда с ростом i решение (7.10) стремится к нулю.

Ряд (7.9) рассматривается как ряд, отражающий процесс, начавшийся далеко в прошлом. Тогда вклад решения (7.9) становится пренебрежимо мал и полное решение фактически совпадает с частным решением

где постоянные и определяются из тождества по D:

.

На практике корни уравнения (7.11) ищут редко. Тем не менее Уайз показал, что условия, налагаемые на эти корни, могут быть выражены в форме алгебраических связей постоянных

Если все корни уравнения (7.11) по модулю меньше единицы (условие устойчивости) и процесс стационарен, то процесс авторегрессии также стационарен.

Для построения авторегрессионых моделей необходимо:

1) исключить тренд и сезонную компоненту из динамических рядов;

2) проверить процесс на стационарность;

3) определить порядок модели авторегрессии;

4) оценить параметры авторегрессионой модели.

Эти действия могут повторяться в процессе уточнения модели, так как анализ авторегрессии не ограничивается построением только одной модели, а строится несколько моделей, после чего определяется порядок правильной модели.

Оценка параметров авторегрессионных моделей. Оценка параметров авторегрессионой модели производится при следующих предположениях:

1) все корни характеристического уравнения (7.11) по модулю меньше единицы (условие устойчивости);

2) случайная величина подчиняется нормальному закону распределения и не зависит от t и , t = 1, 2,... Значения и статистически независимы при .

Оценка параметров авторегрессионой модели осуществляется методом наименьших квадратов, методом максимального правдоподобия и методом коэффициентов автокорреляции.

Метод наименьших квадратов основывается на требовании минимизации остаточной дисперсии

Применив процедуру метода, получим систему нормальных уравнений

(7.12)

Корни системы (7.12) являются коэффициентами авторегрессии.

Метод коэффициентов автокорреляции предполагает построение системы уравнений с коэффициентами автокорреляции. Предположим, что процесс имеет нулевое среднее значение, и умножим обе части равенства (7.8) на . Будем иметь

. (7.13)

Просуммировав слагаемые уравнения (7.13) по t, получим

. (7.14)

Так как то является эмпирической ковариацией, а она равна нулю в силу статистической независимости и . Умножив обе части равенства (7.14) на заменим полученные суммы парных произведений

коэффициентами автокорреляций , получим

. (7.15)

Уравнение (7.15) связывает коэффициенты автокорреляции процесса авторегрессии порядка h. Подставляя в уравнение (7.15) значения и учитывая, что и для любого i, получаем систему уравнений Юла - Уокера для определения параметров,авторегрессионой модели:

(7.16)

Решение системы (7.16) сводится к рекуррентным соотношениям:

, (7.17)

(7.18)

В качестве начального значения используется . Так как то, применив формулы (7.17) и (7.18), получим оценки коэффициентов авторегрессионой модели порядка h.

Отметим, что, за исключением малых значений h, система (7.16) решается легче, чем система (7.12), так как ее матрица имеет более симметричную форму. В то же время при неограниченном увеличении числа наблюдений результаты оценок параметров , по методу наименьших квадратов и с помощью коэффициентов автокорреляции совпадают.

Метод максимального правдоподобия состоит в построении функции правдоподобия и определении максимума этой функции. Координаты точки являющейся точкой максимума функции правдоподобия, и будут оценками правдоподобия коэффициентов авторегрессионого процесса (7.8).

Проиллюстрируем определение оценок параметров авторегрессионых моделей первого и второго порядков.

Процесс авторегрессии первого порядка, называемый марковским процессом, описывается уравнением

. (7.19)

Из системы (7.16) следует, что единственный коэффициент модели (7.19) равен коэффициенту автокорреляции первого порядка Условие стандартности процесса авторегрессии первого порядка определяется неравенством - 1 < а <1. Итак, процесс (7.19) может быть записан в виде

. (7.20)

Процесс авторегрессии второго порядка, называемый авторегрессионым процессом Юла, описывается уравнением

система (7.16) для случая h = 2 имеет вид

Решив ее методом Гаусса, получим:

Для стационарности процесса авторегрессии второго порядка нужно, чтобы выполнялись неравенства и что следует из условия стационарности процесса.

Коэффициенты авторегрессии третьего порядка

(7.21)

вычисляются по формулам:

Так как с помощью рекуррентных формул мы находим оценки параметров регрессионных моделей, то их многократное использование при повышении порядка модели приводит к снижению точности описания исходного процесса. Поэтому повышение порядка модели при условии применения рекуррентных формул возможно лишь на 1-2 порядка. Дальнейшее повышение порядка модели авторегрессии должно сопровождаться решением системы (7.12) или (7.16).

Определение порядка авторегрессионых моделей. Одним из этапов построения авторегрессионой модели является определение ее порядка. Предварительная оценка порядка модели проводится на основе экономического анализа. Он позволяет выделять те уровни динамического ряда, которые оказали значительное влияние на его изменения в последующие периоды. Затем исследуется автокорреляционная функция

, (7.22)

которая характеризует внутреннюю структуру динамического ряда. Функция (7.22) является нормированной, так как и четной относительно

Так как автокорреляционная функция авторегриссионного процесса представляется в виде затухающих колебаний, то при ее анализе выясняют:

1) период колебаний, т.е. промежуток времени между двумя соседними максимальными значениями;

2) амплитуда колебаний;

3) фазу - угловую величину отклонения автокорреляционной функции от нулевого состояния (см. рис. 3.15, на котором приведен график автокорреляционной функции и указаны ее характеристики). По скорости затухания амплитуды можно сделать вывод о порядке модели авторегрессии.

Изменение автокорреляционной функции тесно связано со свойствами корней характеристического уравнения (7.11) и, следовательно, свойствами его коэффициентов. Если корни характеристического уравнения действительны, то автокорреляционная функция состоит из двух затухающих экспонент. Если больший по модулю корень положительный, то автокорреляционная функция убывает, оставаясь положительной. Если же больший по модулю корень отрицательный, то автокорреляционная функция убывает с изменением знака. Если корни комплексно-сопряженные, то автокорреляционная функция является затухающей с амплитудой ,частотой m и фазой F, причем:

.

Далее исследуется частная автокорреляционная функция

, (7.23)

где - алгебраическое дополнение элемента первой строки и (k+1)-го столбца матрицы - алгебраическое дополнение элемента первой строки и первого столбца матрицы . Матрица состоит из коэффициентов автокорреляции динамического ряда:

.

Элементы матрицы - это коэффициенты автокорреляции разностного ряда с рядом, сдвинутым на i временных промежутков . Значения частной автокорреляционной функции R(k) для k = 1, 2, 3 могут быть выражены в явном виде через значения коэффициентов автокорреляции:

.

Из формулы (7.23) и системы (7.16) следует, что значение частной автокорреляционной функции R(h) совпадает с коэффициентом при последнем члене авторегрессионой модели порядка h, т.e. ,... Отсюда получаем, что если исследуемый процесс является авторегрессионым порядком h, то , но для всех q > h. Используя этот признак, можно установить, описывается ли исследуемый процесс моделью авторегрессии порядка h или же требуется повысить порядок модели.

Отметим, что значения частной автокорреляционной функции при имеют асимптотически нормальное распределение с нулевым математическим ожиданием и дисперсией , где n - число уравнений динамического ряда.

Порядок авторегрессионой модели определяют, используя критерий Барлетта, состоящий в проверке гипотезы о том, что исследуемый процесс представляет авторегрессию заданного порядка h.

Чтобы проверить гипотезу , т.е. чтобы определить, достаточно ли высокая степень приближения получена в результате аппроксимации моделью (7.8) порядка h, вычисляют отклонения, возникающие при повышении порядка авторегрессии. Для этого строят авторегрессионые модели порядка q, где p < q < [n/2], и находят суммы квадратов отклонений для тех уровней, для которых величину можно вычислить с помощью модели как порядка h, так и порядка q. Тогда величина

(7.24)

имеет распределение с степенями свободы. В формуле (7.24) - сумма квадратов остатков для модели порядка q; - сумма квадратов остатков для модели порядка h, причем рассматриваются остатки, для которых определена модель порядка . Если при уровне доверия , то модель порядка q даст существенно лучшую аппроксимацию остатков по сравнению с моделью порядка h. В противном случае, т.e. при гипотеза о том, что авторегрессионая модель порядка q даст лучшие результаты, отвергается, следовательно, авторегрессионая модель порядка h является лучшей.

Рассмотренный критерий Барлетта является асимптотическим, поэтому для небольших выборок, содержащих менее 20 наблюдений, вычисляется финальная ошибка прогноза (ФОП). Процедура определения порядка авторегрессионой модели состоит в переборе авторегрессий различных порядков и выборе той из них, для которой финальная ошибка прогнозирования минимальна, т.е.

ФОП

H - верхний предел порядка рассматриваемых моделей авторегрессии.

Построение авторегрессионых моделей для коротких динамических рядов. Динамические ряды экономических показателей предприятий и отраслей в основном содержат менее 20 наблюдений. Поэтому в оценке коэффициентов авторегрессий необходимо учитывать отклонения, возникающие вследствие несоответствия между объемом информации для данного динамического ряда и требуемой оценкой параметров модели. Продемонстрируем сказанное для авторегрессии первого порядка:

Метод наименьших квадратов приводит к оценке

Л. Гурвиц изучил распределение и показал существование систематической ошибки в малых выборках. Когда процесс рассматривается как стационарный и начальное значение - как случайное, когда |а| мало, а n велико, тогда математическое ожидание оценки определяется формулой

При неограниченном возрастании n систематическая ошибка 2а/n бесконечно мала относительно средней квадратичной ошибки, равной . Для динамических рядов, содержащих около 20 уровней, она достигает примерно 10 % истинной величины.

Чтобы хорошо оценить свойства обычных методов (например, метода наименьших квадратов), когда аналитический подход затруднителен, приходится прибегать к изучению экспериментальных результатов. Исходя из известной авторегрессионой модели, достаточно сформировать некоторое число искусственных динамических рядов с одними и темы же вероятностными характеристиками и найти оценки для каждого из них, предполагая, что в действительности мы имеем дело лишь с различными реализациями одного динамического ряда. Тогда для каждой оценки мы будем располагать столькими значениями, сколько имеется динамических рядов. Эмпирическое распределение этих значений дает приближение к теоретическому закону, который мы хотели установить. Этот метод называется методом Монте - Карло, он был применен для изучения распределения оценки .

Изучение искусственных динамических рядов допускает также оценку статистических методов, связанных с методом наименьших квадратов. Асимптотическая теория обосновывает применение обычных формул для вычисления дисперсий оценок и установления критериев и доверительных интервалов. Но эти формулы применимы строго лишь для больших выборок. Поэтому важно установить, ведут ли они к заметным ошибкам для выборок, которые обычно изучаются в эконометрии. Установлено, что для малых выборок дисперсия дает в среднем достаточно точную оценку дисперсии . Этот вывод говорит о том, что применение методов обычной регрессии к авторегрессионым моделям не влечет за собой серьезной ошибки, если ошибки неавтокоррелированы.

Некоторые другие методы построения авторегрессионых моделей. Оценивать параметры авторегрессионой модели, как отмечалось выше, можно методом наименьших квадратов. Точность модели повышается, если коэффициенты определены на основе минимизации выражения

в котором уровням динамического ряда придают веса, причем больший вес соответствует последним наблюдениям, в наибольшей мере влияющим на последующие значения показателя.

Коэффициенты авторегрессионой модели можно находить путем минимизации коэффициентов автокорреляции случайных величин , т.е. минимизируя функцию

где

Приравнивая нулю частные производные по каждому коэффициенту функции получаем систему уравнений второй степени, которая даже при небольшом числе неизвестных решается со значительными трудностями.

Построение авторегрессионых моделей можно осуществить с помощью робастных методов. Робастной оценкой считается такая оценка, статистические свойства которой остаются достаточно хорошими при несоответствии наблюдений динамического ряда некоторым теоретическим предположениям. Согласно такому подходу, коэффициенты авторегрессионой модели определяют, минимизируя выражение

(7.25)

где U - общая функция потерь. Эта функция вводится вследствие отклонения уровней динамического ряда от теоретических значений. Параметр S вводится для масштабирования этих отклонений. Если параметры авторегрессионой модели определяются по методу наименьших квадратов, то U - квадратичная функция.

Дифференцируя выражение (7.25) по параметрам , получаем систему нелинейных уравнений

(7.26)

где - производная функции потерь.

Параметр масштабирования определяется из уравнения

,

где Q - константа, которой придаются различные значения в зависимости от вида функции потерь. Решение системы (7.26) осуществляется методом последовательных приближений.

Авторегрессионые модели строят также методом адаптивной фильтрации. Суть его состоит в непрерывном пошаговом уточнении параметров модели, т.е. в поиске такого набора весов для корректировки параметров, который бы минимизировал квадрат ошибки прогноза. Поэтому авторегрессионую модель представляют в виде

(7.27)

и параметры для начального приближения определяют, решая систему Юла-Уокера (7.16). Корректировку параметров в модели (7.27) осуществляют методом наискорейшего спуска, который определяет величину шага вдоль градиента в сторону убывания минимизируемой функции - квадрата ошибки прогноза, т.е. вдоль

а(n) =-2а(n) yt,

Где a(n) - вектор коэффициентов модели (7.27); yt - вектор уровней динамического ряда. Шаг в сторону убывания квадрата ошибки прогноза состоит в измерении вектора a(n) по формуле

,

где индекс n показывает итерацию, для которой имеются прогнозируемое и фактическое значения показателя. Следовательно, может быть определена ошибка , а n + 1 - следующая итерация. Величина k- вес, с которым учитывается поправка к вектору коэффициентов метода. Теоретически необходимое и достаточное условие сходимости метода наискорейшего спуска - это условие , которое является слишком общим. Поэтому чрезмерное увеличение k может привести к тому, что какое-либо из значений весов пересечет свой минимум и вынуждено будет к нему возвращаться. А это способствует увеличению ошибки при недостаточном числе итераций. Из практического применения этого метода следует, что для каждого значения k существует оптимальное число итераций, и наоборот. Это значит, что величина k тесно связана с числом уровней динамического ряда и числом итераций.

Пример 7.7. Рассмотрим динамический ряд, характеризующий поквартальный объем продаж фирмы с 1980 по 1990 г. Данные, из которых исключена сезонная компонента, приведены в табл. 7.10.

Таблица 7.10.

Год

Квартал

t

Объем продаж

Год

Квартал

t

Объем продаж

1980

I

1

1382

1986

I

25

1722

II

2

1417

II

26

1681

III

3

1432

III

27

1726

IV

4

1438

IV

28

1642

1981

I

5

1457

1987

I

29

1777

II

6

1403

II

30

1787

III

7

1389

III

31

1779

IV

8

1379

IV

32

1850

1982

I

9

1408

1988

I

33

1948

II

10

1426

II

34

1903

III

11

1460

III

35

1945

IV

12

1442

IV

36

1937

1983

I

13

1414

1989

I

37

1992

II

14

1472

II

38

1980

III

15

1520

III

39

1980

IV

16

1540

IV

40

2024

1984

I

17

1611

1990

I

41

2026

II

18

1612

II

42

2130

III

19

1632

III

43

2078

IV

20

1659

IV

44

2197

1985

I

21

1581

II

22

1643

III

23

1643

IV

24

1686

Построим авторегрессионую модель. На первом этапе определим ее порядок. Из исходных данных следует, что нужно рассмотреть авторегрессию на . Для проверки этого вывода вычислим автокорреляционную функцию (7.22):

Значения автокорреляционной функции сначала затухают: затем возрастают: и снова начинают убывать: . Следовательно, автокорреляционная функция состоит из двух затухающих экспонент.

Порядок авторегрессионой модели попытаемся определить, используя критерий Барлетта. Для этого построим авторегрессионые модели первого, второго, третьего и четвертого порядков и рассмотрим, как изменяются суммы квадратов отклонений для этих моделей. Параметры авторегрессионой модели четвертого порядка определим из системы Юла-Уокера (7.16):

Решая систему, находим:

= 1,6742, =-0,3082, = -1,6838, = 1,3248.

Следовательно, авторегрессионая модель четвертого порядка имеет вид

Коэффициенты авторегрессии второго порядка вычислим по формулам:

, .

Тогда авторегрессионая модель второго порядка запишется уравнением

.

Коэффициенты авторегрессии третьего порядка определим из рекуррентных формул:

,

подставив которые в равенство (7.21), получим

.

Марковский процесс авторегрессии первого порядка, как следует из равенства (3.89), имеет вид

Вычислим далее для всех моделей суммы квадратов отклонений тех уровней, для которых можно вычислять с помощью модели четвертого порядка. Первое значение будет соответствовать первому кварталу 1981 г.

Сравнение моделей для простоты проведем для уровней 1990 г. (хотя нужно учитывать все уровни). Результаты приведены в табл. 7.11.

Таблица 7.11

0,9788

-

-

-

50 244,772

0,5226

0,4660

-

-

33 568,353

0,8300

0,8180

-0,6597

-

20 978,008

1,6742

-0,3082

-1,6838

1,3248

20 757,455

Суммы квадратов отклонений значительно уменьшаются при добавлении . Поэтому сравним авторегрессионые модели третьего и четвертого порядков. Вычислим:

Квантиль распределения для уровня значимости и 4 степени свободы равен 3,841. Следовательно, что означает, что авторегрессионая модель четвертого порядка даст лучшую аппроксимацию остатков , чем модель третьего порядка.

Таким образом, продемонстрирован процесс построения авторегрессионых моделей.