- •1. Введение в анализ временных рядов
- •1.1. Временные ряды и требования, предъявляемые к ним
- •1.2. Основные показатели динамики экономических явлений
- •1.3. Компонентный состав временного ряда
- •1.4. Некоторые элементы теории случайных процессов
- •2. Определение общей тенденции временного ряда
- •2.1. Виды тенденций и проверка гипотезы о существовании тенденции
- •Расчет вспомогательных характеристик
- •2.2. Методы выделения общей тенденции временного ряда
- •2.2.1. Механическое сглаживание
- •2.2.2. Аналитическое выравнивание временных рядов
- •2.2.3. Гармонический анализ
- •3.1. Проверка гипотезы о правильности выбора вида тренда
- •3.2. Проверка гипотезы о независимости случайного компонента
- •3.3. Проверка гипотезы о нормальности случайного компонента
- •4. Описание стационарных временных рядов с помощью авторегрессионной модели
- •4.1. Оценка параметров авторегрессионной модели
- •4.2. Определение порядка авторегрессии
- •5. Прогнозирование экономических показателей
- •5.1. Простейшие приемы экстраполяции
- •5.2. Прогнозирование экономических показателей с помощью кривых роста
- •5.3. Прогнозирование экономических показателей с помощью авторегрессионных моделей
- •6. Статистический анализ сезонной компоненты
- •6.1. Методы выявления периодической компоненты
- •6.3. Прогнозирование явлений с помощью индексов сезонности
- •8. Корреляция и регрессия рядов динамики
- •8.1.Простая корреляция и регрессия рядов динамики
- •8.2. Множественная корреляция и регрессия рядов динамики
- •Тест для самопроверки
2. Определение общей тенденции временного ряда
2.1. Виды тенденций и проверка гипотезы о существовании тенденции
Во временных рядах, описывающих социально-экономические процессы, могут наблюдаться тенденции трех видов: тенденция среднего уровня, тенденция дисперсии, тенденция автокорреляции.
В статистической литературе под тенденцией среднего уровня понимают некоторое общее направление развития. Обычно ее можно представить графически более или менее гладкой траекторией. Предполагается, что такая траектория, которую можно описать в виде некоторой математической функции времени Ft, характеризует основную закономерность движения во времени и в некоторой мере становится свободной от случайных воздействий [22 ] (в дальнейшем функцию Ft будем обозначать через и называть трендом).
Тенденция дисперсии представляет собой тенденцию изменения отклонений между фактическими и расчетными уровнями, найденными по математической формуле тренда. Этот вид тенденции также легко представить графически.
Тенденцией автокорреляции является тенденция изменения связи между отдельными уровнями временного ряда.
Во временных рядах с незначительной тенденцией развития во времени и существенной колеблемостью уровней не всегда удается (даже при использовании современных программных средств) определить, присутствует ли тренд в данном ряду или нет. Поэтому прежде чем переходить к выделению тренда, нужно выяснить, существует ли вообще тенденция в исследуемом процессе. Основные подходы к решению этой задачи основаны на статистической проверке гипотезы о неизменности среднего значения временного ряда [1, 21, 23]. Для этого чаще всего используют метод Фостера — Стюарта, критерий „восходящих" и „нисходящих" серий и критерий серий, основанный на медиане выборки.
Метод Фостера — Стюарта позволяет обнаружить как тенденцию среднего уровня, так и тенденцию дисперсии, что очень важно для практического анализа. Этот метод можно реализовать в виде определенной последовательности шагов.
1. Каждый уровень ряда, начиная со второго, сравнивается со всеми предыдущими, при этом определяются значения вспомогательных характеристики ut и mt:
т.е. ut = 1, если уt больше всех предшествующих уровней, а mt = 1, если уt меньше всех предшествующих уровней.
2. Вычисляются значения st = ut + mt и dt = ut- mt для t = 2, 3, …, n.
3. Находятся характеристики
Показатель S применяется для обнаружения тенденции дисперсии, а показатель D — для обнаружения тенденции среднего уровня.
4. После того как для исследуемого ряда найдены фактические значения S и D с помощью критерия Стьюдента, проверяется гипотеза о том, что величины S — µ и D — 0 — случайны. Для этого определяются расчетные значения критериев tS и tD:
где µ — математическое ожидание величины S, определяемое для случайного распределения уровней во времени;
σS — среднеквадратическая ошибка величины S;
σD — среднеквадратическая ошибка величины D (значения µ, σS,σD занесены в табл. 2.1).
Если в таблице нет искомых значений для n (например, n = 12), то необходимые µ, σS,σD, приближенно находятся с помощью интерполирования, используя табличные данные для ближайших n (n = 10 и n = 15).
Т а б л и ц а 2.1
Значения средней µ и стандартных ошибок σS и σD для n от 10 до 50
п |
µ | ||
10 |
3,858 |
1,288 |
1,964 |
15 |
4,636 |
1,521 |
1,964 |
20 |
5,195 |
1,677 |
2,279 |
25 |
5,632 |
1,791 |
2,373 |
30 |
5,990 |
1,882 . |
2,447 |
35 |
6,294 |
1,956 |
2,509 |
40 |
6,557 |
2,019 |
2,561 |
45 |
6,790 |
2,072 |
2,606 |
50 |
6,998 |
2,121 |
2,645 |
5. Расчетные значения tD и tS сравниваются с критическим , взятым из таблицы t-распределения Стьюдента для конкретного уровня значимости . Если расчетное значениеtD больше критического , тогда гипотеза об отсутствии тенденции среднего уровня отвергается (аналогично проверяется гипотеза об отсутствии тенденции дисперсии). Если расчетные значения меньше критического , тогда гипотеза подтверждается.
Критерий „восходящих” и „нисходящих” серий реализуется в виде. определенной; последовательности шагов.
1. Для временного ряда определяется последовательность γt из плюсов и минусов следующим образом:
Если последующее наблюдение оказалось равным предыдущему, то учитывается только одно наблюдение.
2. В совокупности плюсов и минусов подсчитывается количество серий ν (n), где под серией понимается последовательность подряд идущих плюсов или минусов. Один плюс или минус тоже считается серией.
3. Определяется протяженность самой длинной серии kmax(n).
4. Для того чтобы гипотеза об отсутствии тренда не была отвергнута, должны выполняться следующие неравенства (при 5% уровне значимости):
(2.1)
Квадратные скобки в неравенстве означают целую часть числа. Величина k0(n) зависит от длины исходного ряда и определяется по табл. 2.2.
Т а б л и ц а 2.2
Длина ряда |
п ≤ 26 |
26 < п ≤ 153 |
153 < п ≤ 170 |
Значение k0 |
5 |
6 |
7 |
Если хотя бы одно из неравенств не выполняется, то гипотеза об отсутствии тренда отвергается [1].
Рассмотрим теперь критерий серий, основанный на медиане выборки.
1. Исходный ряд Yt преобразуется в ранжированный где — наименьшее значение ряда Yt.
2. Определяется медиана ранжированного ряда Ме. Для нечетного значения n (n = 2m + 1)
для четного n ( n = 2m)
3. Образуется последовательность из плюсов и минусов последующему правилу
Если значение уt равно медиане, то оно опускается.
4. Подсчитываются общее число серий ν(n) и протяженность самой длинной серии kmax(n) аналогично тому, как это делалось в критерии „восходящих” и „нисходящих” серий.
5. Для того чтобы гипотеза об отсутствии тренда (гипотеза о случайности) не была отвергнута, необходимо выполнение следующих неравенств (для 5% уровня значимости):
(2.2)
Если хотя бы одно из неравенств нарушается, то гипотеза об отсутствии тренда отвергается [1 ].
П р и м е р 2.1. По данным об изменении урожайности зерновых культур, которые представлены в табл. 2.3, проверим с помощью метода Фостера — Стюарта наличие тенденций в исследуемом ряду.
Таблица 2.3