- •Теоретичні відомості до практичної роботи 2
- •5. Анализ временных рядов
- •5.1.Постановка задачи
- •5.1.1. Временные ряды. Задачи исследования временных рядов
- •5.1.2 Компонентный состав рядов динамики
- •5.1.3. Требования к данным
- •5.1.4.Предварительный анализ временных рядов
- •Результаты расчета
- •5.1.4.2.Средние характеристики:
- •5.1.4.3.Автокорреляции в рядах динамики.
- •5.1.4.4.Методы проверки наличия и выделения тенденции.
- •5.1.4.5.Методы проверки наличия сезонности.
- •5.1.5. Методы анализа основной тенденции во временных рядах.
- •5.1.5.1.Механическое сглаживание.
- •5.1.5.2.Аналитическое выравнивание временных рядов.
- •5.1.6.Гармонический анализ
- •5.1.7.Проверка качества прогнозов (сравнение моделей прогнозирования)
- •5.1.7.3.Проверка случайности ряда остатков.
- •5.1.7.4. Проверка гипотезы о нормальности ряда остатков.
- •5.1.7.5. Проверка гипотезы о стационарности ряда остатков.
- •5.1.8.Адаптивные модели и методы
- •5.1.8.2. Модели сс.
- •Модель Брауна
- •Модель Хольта
- •Модель авторегрессии
- •5.1.8.3Линейные параметрические методы
- •Нестационарные модели
- •5.1.9.Анализ сезонных колебаний
- •5.1.9.1. Анализ сезонной волны.
- •5.1.9.2. Адаптивные модели анализа сезонности
- •Базовые сезонные модели, к ним относятся:
- •Сезонные модели скользящего среднего
- •Модель Хольта-Уинтерса
- •Сезонные модели авторегрессии
- •5.1.9.3. Cезонные модели арисс (сезонная модель Бокса-Дженкинса)
- •5.1.10. Прогнозирование
- •5.1.10.1. Методы экстраполяции.
- •5.1.10.2. Прогнозирование экономических показателей с помощью кривых роста.
- •5.1.10.3. Адаптивные методы прогнозирования
5.1.2 Компонентный состав рядов динамики
Статистические методы исследования исходят из предположения о возможности представления уровней ряда в виде суммы нескольких компонент, отражающих закономерность и случайность развития:
Х(t) = F(t) + S(t) + С(t) +E(t):
где F(t) - тренд (долговременная тенденция) развития;
S(t) - сезонная компонента;
C(t) - циклическая компонента
E(t) - остаточная компонента.
К регулярным компонентам временных рядов, чаще всего, относятся: трендовая компонента и сезонная компонента, реже циклическая компонента, отличающая от сезонной большей длительностью цикла. Оба эти вида регулярных компонент часто присутствуют в ряде одновременно.
Тренд представляет собой устойчивое изменение показателя в течение длительного времени, определяет общее направление развития (тенденцию) анализируемого явления. Он является детерминированной компонентой, которая описывается с помощью линейной или нелинейной и монотонной неслучайной функцией F(t). На его основе формируются прогнозные оценки.
Сезонная компонента характеризует устойчивые внутригодичные колебания уровней. Это периодически повторяющаяся компонента, описываемая некоторой периодической функцией S(t). Она проявляется в некоторых показателях, которые представлены квартальными или месячными данными. Наличие устойчивых колебаний в суточных или недельных данных могут рассматриваться как циклические.
Остаточная компонента представляет собой расхождение между фактическими и расчетными значениями, т.е.E(t)=Y(t)-(F(t)+S(t)). Если модель построена хорошая, то E(t) является случайной, независимой и подчиняющейся нормальному закону распределения компонентой и несильно отличающаяся от нуля. В противном случае модель является плохой.
5.1.3. Требования к данным
Все математические методы обработки временных рядов наблюдений используют аппарат математической статистики, который требует, чтобы в исходных данных наблюдалась:
сопоставимость
полнота
однородность
устойчивость.
Невыполнение одного из этих требований делает бессмысленным применение любого математического аппарата исследования.
В блоке исходных данных могут отсутствовать некоторые значения. В этом случае большинство программ выдают соответствующую диагностику и осуществляют обработку пропущенных наблюдений.
Сопоставимость данных достигается в результате одинакового подхода к наблюдениям на разных этапах формирования ряда динамики. Уровни во временных рядах должны выражаться в одних и тех же единицах измерения, иметь одинаковый шаг наблюдений, рассчитываться для одного и того же интервала времени, по одной и той же методике, охватывать одни и те же элементы, относящиеся к неизменной совокупности.
Полнота данных связана с их количеством. Достаточное число наблюдений определяется в зависимости от цели проводимого исследования динамики. Если целью является описательный статистический анализ, то в качестве изучаемого можно выбрать очень короткий интервал времени (но не менее 5 наблюдений). Если же целью исследования является построение модели динамики, то число уровней исходного динамического ряда в этом случае должно не меньше, чем в три раза превышать период упреждения прогноза и быть не менее 10.
В случае использования квартальных или месячных данных для исследования сезонности и прогнозирования сезонных процессов, исходный временной ряд должен содержать данные не менее чем за четыре года, даже если требуется прогноз на 1-2 квартала (месяца). В противном случае эти данные будут обрабатываться без учета внутригодичных колебаний.
Однородность данных означает отсутствие нетипичных, аномальных наблюдений, а также изломов тенденций. Аномальность приводит к смещению оценок и, следовательно, к искажению результатов анализа. Формально она проявляется как сильный скачок (спад) с последующим примерным восстановлением предыдущего уровня.
Для диагностики аномальных наблюдений предложено несколько критериев. Один из них предполагает для всех или только для подозрительных на аномальность уровней вычислять среднее значение и среднеквадратическое отклонение нескольких соседних с ними. Если рассчитанная величина превышает критическое значение, наблюдение считается аномальным. Аномальные наблюдения необходимо исключить из временного ряда и заменить расчетными значениями.
Изломы тенденций свидетельствуют об изменении закономерностей протекания процесса или об изменении методики вычисления значений показателя. В этом случае также важно провести качественный анализ происходящих изменений или дождаться поступления нового наблюдения.
Устойчивость временного ряда отражает преобладание закономерности над случайностью в изменении уровней ряда. На графиках устойчивых временных рядов даже визуально прослеживается закономерность. На графиках неустойчивых рядов изменения последовательных уровней представляются хаотичными, и поэтому поиск закономерностей в формировании значений уровней таких рядов лишен смысла.
Обработка пропущенных наблюдений. Выделенные пользователем данные могут содержать нечисловые и пропущенные наблюдения. При любом методе обработки они должны быть предварительно устранены, т.е. заменены числовыми значениями. Обработку пропущенных наблюдений можно выполнить тремя способами, а именно, путем:
· интерполяции;
· аппроксимации;
· построения регрессионных зависимостей.
В соответствии с первым способом пропущенные наблюдения восстанавливаются путем использования стандартных интерполяционных формул (например, с использованием методов линейной и кубической интерполяции, интерполяции сплайнами, аппроксимацию полиномами), причем каждый показатель обрабатывается изолированно от других. При этом способе известные наблюдения не меняются.
Восстановление наблюдений при помощи аппроксимации сводится к подбору кривой роста, наилучшим образом отображающей особенности изменения исследуемого показателя. При этом пропущенные наблюдения заменяются на расчетные значения аппроксимирующей модели.
Восстановление наблюдений при помощи регрессионных зависимостей заключается в построении модели взаимосвязи показателя, который содержит пропущенные наблюдения, с одним или несколькими показателями, не содержащими пропущенные наблюдения.
Восстановление пропущенных наблюдений при всех описанных выше способах осуществляется лишь в том случае, если по каждому показателю количество пропущенных наблюдений не превышает половины всего объема наблюдений