- •1.Основные понятия временных рядов
- •2.Предварительный анализ и сглаживание временных рядов
- •2.1.Выявление аномальных значений уровней ряда
- •2.2.Определение наличия тренда
- •2.2.1.Метод проверки разностей средних уровней
- •2.2.2.Метод Фостера—Стьюарта
- •2.2.3.Метод «критерий серий»
- •2.3.Сглаживание временных рядов
- •2.3.1.Метод простой скользящей средней
- •2.3.2.Медианное сглаживание
- •2.3.3.Метод экспоненциального сглаживания
- •2.4.Трендовые модели
- •2.4.1.Формирование набора моделей
- •2.4.2.Оценка адекватности и точности трендовых моделей
- •Контрольные вопросы
2.2.2.Метод Фостера—Стьюарта
Этот метод обладает большими возможностями и дает более надежные результаты по сравнению с предыдущим. Кроме тренда самого ряда (как говорят, тренда в среднем), он позволяет установить наличие тренда дисперсии временного ряда: если тренда дисперсии нет, то разброс уровней ряда постоянен; если дисперсия увеличивается, то ряд «раскачивается» и т. д.
Реализация метода также содержит четыре этапа.
На первом этапе производится сравнение каждого уровня исходного временного ряда, начиная со второго уровня, со всеми предыдущими, при этом определяются две числовые последовательности:
l, если yt больше всех предыдущих уровней;
kt =
0, в противном случае,
l, если yt меньше всех предыдущих уровней;
lt =
0, в противном случае,
t = 2,3, ...,n.
На втором этапе вычисляются величины s и d:
Формула 9
Величина s, характеризующая изменение временного ряда, принимает значения от 0 (все уровни ряда равны между собой) до n-1 (ряд монотонный). Величина d характеризует изменение дисперсии уровней временного ряда и изменяется от -(n-1) (ряд монотонно убывает) до (n-1) (ряд монотонно возрастает).
Третий этап заключается в проверке гипотез: можно ли считать случайными
1) отклонение величины s от величины μ — математического ожидания величины s для ряда, в котором уровни расположены случайным образом,
2) отклонение величины d от нуля.
Эта проверка проводится с использованием расчетных значений t-критерия Стьюдента для средней и для дисперсии:
;
Формула 10
где μ — математическое ожидание величины s, определенной для ряда, в котором уровни расположены случайным образом;
1 — среднеквадратическое отклонение для величины s;
2 — среднеквадратическое отклонение для величины d.
Для удобства имеются табулированные значения величин μ, 1 и 2; фрагмент этих значений представлен в табл. 5.
Таблица 5. Значения μ, 1 и 2 для n от 10 до 40
n |
10 |
20 |
30 |
40 |
μ |
3,858 |
5,195 |
5,990 |
6,557 |
1 |
1,288 |
1,677 |
1,882 |
2,019 |
2 |
1,964 |
2,279 |
2,447 |
2,561 |
На четвертом этапе расчетные значения ts и td сравниваются с табличным значением t-критерия Стьюдента tкр для числа степеней свободы = n - 1 и заданного уровня значимости . Если расчетное значение меньше табличного, то гипотеза об отсутствии соответствующего тренда принимается; в противном случае тренд есть. Например, если ts больше табличного значения tкр, a td меньше tкр, то для данного временного ряда имеется тренд в среднем, а тренда дисперсии уровней ряда нет.
2.2.3.Метод «критерий серий»
С целью проверки гипотезы о неизменности среднего значения временного ряда (случайности ряда) рассмотрим критерий серий, основанный на медиане.
Значение временного ряда сопоставляется с выборочной медианой, и если x(t) > , то для соответствующего наблюдения член последовательности, образующего серии, принимает знак«+», если x(t) < , то – знак «-».
В методе критерий серий, основанном на медиане выборки, для того чтобы не была отвергнута гипотеза о случайности исходного ряда (об отсутствии систематической составляющей), должны выполняться следующие неравенства (для 5% уровня значимости):
, Формула 11
где n – длина временного ряда;
ν(n) – число серий;
τmax(n) – число подряд идущих плюсов или минусов в самой длинной серии;
квадратные скобки, как обычно, означают целую часть числа.
Если хотя бы одно из неравенств (11) нарушается, то гипотеза об отсутствии тренда отвергается с вероятностью ошибки α, заключенной между 0,05 и 0,0975 (и, следовательно, подтверждается наличие зависящей от времени неслучайной составляющей в разложении (3) исследуемого ряда).
Проверка гипотезы по «восходящей» и «нисходящей» серий основывается на том, что при условии случайности ряда (при отсутствии систематической составляющей) протяженность самой длинной серии не должна быть слишком большой, а общее число серий – слишком маленьким.
Каждое значение временного ряда сравнивается с предыдущим, и, если xt > xt-1, то для соответствующего наблюдения член последовательности, образующего серии, принимает знак«+», если xt < xt-1, то – знак «-».
Критерий «восходящих» и «нисходящих» серий устанавливается исходя из системы неравенств
, Формула 12
где n – длина временного ряда;
ν(n) – число серий;
τmax(n) – число подряд идущих плюсов или минусов в самой длинной серии.
Следует отметить, что τ0 принимает значения в зависимости от n т.е: если n ≤26, то τ0 = 5; если 26< n ≤ 153, то τ0 = 6; и если 153<n≤ 1170, то τ0 = 7. Если хотя бы одно из неравенств (12) окажется нарушенным, то гипотезу об отсутствии тренда следует отвергнуть, т.е. признать, что в разложении (3) анализируемого временного ряда присутствует неслучайная, зависящая от времени t компонента.