- •А.С. Березина анализ данных
- •Предисловие
- •Лекция 1. Априорный анализ компонент временного ряда
- •1.1. Понятие временного ряда. Виды временных рядов
- •Производство молока в Кемеровской области
- •Численность работников здравоохранения, перед которыми организация имеет просроченную задолженность по заработной плате работников в Российской Федерации в 2013 году
- •Индекс потребительских цен в Кемеровской области (декабрь к декабрю предыдущего года; в процентах)
- •Потребление сахара (кг) на душу населения в Кемеровской области
- •1.2. Методы оценки однородности исходных данных
- •1.3. Методика выявления и анализа аномальных наблюдений
- •Краткосрочные экономические показатели рф
- •Расчётная таблица примера 1.1.
- •1.4. Абсолютные, относительные и средние показатели в анализе временных рядов
- •ЛЕкция 2. Моделирование тенденции
- •2.1. Проверка гипотезы о существовании тренда
- •Промежуточные расчетные значения кумулятивного т-критерия
- •2.2. Методы выявления тенденции
- •Численность населения на одного врача в Кемеровской области
- •Расчетная таблица метода Фостера-Стюарта
- •2.3. Выбор формы тренда
- •Критерии выбора класса, выравнивающих кривых
- •Лекция 3. Моделирование периодической компоненты
- •3.1. Аддитивные и мультипликативные тренд-сезонные модели Алгоритм построения модели временного ряда, содержащего сезонные колебания:
- •Поквартальные данные по розничному товарообороту компании
- •Расчет коэффициента автокорреляции
- •Коррелограмма временного ряда товарооборота
- •Расчет оценок сезонной компоненты в аддитивной модели
- •Расчет значений сезонной компоненты в аддитивной модели
- •Расчет значений t и ошибок e в аддитивной модели.
- •Расчет оценок сезонной компоненты в мультипликативной модели
- •Расчет значений сезонной компоненты в мультипликативной модели
- •Расчет значений t и ошибок e в мультипликативной модели
- •Лекция 4. Простейшие методы прогнозирования
- •4.1. Метод среднего уровня ряда
- •4.2. Метод среднего абсолютного прироста
- •Расчетная таблица для определения прогнозных значений методом среднего абсолютного прироста
- •4.3. Метод среднего темпа роста
- •4.4. Оценка точности и надежности прогнозов
- •Лекция 5. Методы выбора трендовой модели прогноза
- •5.1. Прогнозирование на основе кривых роста
- •5.2. Прогнозирование на основе экстраполяции тренда
- •Лекция 6. Адаптивные модели прогнозирования
- •6.1. Сущность адаптивных методов
- •6.2. Экспоненциальное сглаживание
- •Индекс потребительских цен Кемеровской области
- •Экспоненциальные средние
- •6.3. Метод гармонических весов
- •Параметры уравнений отдельных фаз движения текущего тренда
- •Лекция 7. Прогнозирование динамических рядов, не имеющих тенденции.
- •Распределение знаков отклонений
- •Расчетная таблица для определения знаков отклонений
- •Распределение знаков отклонений
- •8. Метод экспертных оценок
- •8.1. Методы и модели экспертных оценок
- •Матрица опроса
- •Матрица преобразованных рангов
- •Оценки вкусовых качеств продукта
- •Оценки вкусовых качеств продукта
- •Матрица преобразованных рангов
- •8.2. Методы и модели выбора альтернатив
- •Частные критерии трех операторов
- •Нормализованные критерии
- •Лекция 9. Статистические методы обработки результатов экспертизы
- •9.1. Оценка согласованности мнений экспертов
- •9.2. Обобщение мнений экспертов
- •Список литературы
- •Содержание
- •Анализ данных
- •650992, Г. Кемерово, пр. Кузнецкий, 39
6.2. Экспоненциальное сглаживание
Предположим, что модель временного ряда имеет вид: , где;— случайные неавтокоррелированные отклонения с нулевым математическим ожиданием и дисперсией.
Для экспоненциального сглаживания ряда используется рекуррентная формула
, (6.1)
где St — значение экспоненциальной средней в моментt;
α — параметр сглаживания, α = сonst, 0 < α < 1; β = 1 – α.
Если последовательно использовать эту рекуррентную формулу, то экспоненциальную среднюю St можно выразить через предшествующие значения уровней временного ряда.
При n → ∞. Таким образом, величинаSt оказывается взвешенной суммой всех членов ряда.
Причем веса отдельных уровней ряда убывают по мере их удаления в прошлое соответственно экспоненциальной функции (в зависимости от «возраста» наблюдений). Именно поэтому величина St названа экспоненциальной средней.
Например, пусть α = 0,3. Тогда вес текущего наблюдения yt будет равен α = 0,3, вес предыдущего уровняyt–1 будет соответствовать α × β = 0,3 × 0,7 = 0,21; для уровняyt–2 вес составит α × β2 = 0,147; дляyt–3 – α × β3 = 0,1029 и т.д.
При высоком значении α дисперсия экспоненциальной средней незначительно отличается от дисперсии ряда. С уменьшением α дисперсия экспоненциальной средней сокращается, возрастает ее отличие от дисперсии ряда. Тем самым, экспоненциальная средняя начинает играть роль «фильтра», поглощающего колебания временного ряда.
Таким образом, с одной стороны, следует увеличивать вес более свежих наблюдений, что может быть достигнуто повышением α, с другой стороны, для сглаживания случайных отклонений величину α нужно уменьшить. Эти два требования находятся в противоречии. Поиск компромиссного значения параметра сглаживания α составляет задачу оптимизации модели.
Автор метода простого экспоненциального сглаживания Р.Г. Браун предложил следующую формулу расчета α:,
где n — число уровней временного ряда, вошедших в интервал сглаживания.
Пределы изменения α установлены эмпирическим путем и изменяются в пределах:
0,1 ≤ α ≤ 0,3.
Однако, следует учитывать, что в этом случае параметр α полностью зависит от числа наблюденийn.
Часто на практике при решении конкретных задач параметр α применяется равным: α = 0,1; 0,15; 0,2; 0,25; 0,3.
Иногда поиск этого значения параметра осуществляется путем перебора. В этом случае в качестве оптимального выбирается то значение α, при котором получена наименьшая дисперсия ошибки.
При расчете экспоненциальной средней в момент времени t всегда требуется значение экспоненциальной средней в предыдущий момент времени, поэтому на первом шаге должно быть определено некоторое значениеS0 , предшествующееS1. Часто на практике в качестве начального значенияS0 используется среднее арифметическое значение из всех имеющихся уровней временного ряда или из какой-то их части. Вес, приписываемый этому значению, уменьшается по экспоненциальной зависимости по мере удаления от первого уровня. Поэтому для длинных временных рядов влияние неудачного выбораS0 погашается.
При использовании экспоненциальной средней для краткосрочного прогнозирования предполагается, что модель ряда имеет вид:
,
где — варьирующий во времени средний уровень ряда.
Прогнозная модель определяется равенством:
,
где — прогноз, сделанный в моментt на τ единиц времени (шагов) вперед;
—оценка ,
Единственный параметр модели определяется экспоненциальной средней:.
Выражение (6.1.) можно представить по-другому, перегруппировав члены:
.
Величину (yt – St–1) можно рассматривать как погрешность прогноза. Тогда новый прогноз St получается в результате корректировки предыдущего прогноза с учетом его ошибки. В этом и состоит адаптация модели.
Экспоненциальное сглаживание является примером простейшей самообучающейся модели. Вычисления чрезвычайно просты, выполняются итеративно, причем массив прошлой информации уменьшен до единственного значения St–1.
Пример 6.1. Рассчитайте экспоненциальную среднюю для временного ряда индекса потребительских цен в Кемеровской области (таблица 6.1). В качестве начального значения экспоненциальной средней возьмите среднее значение из 5 первых уровней ряда. Расчеты проведите для двух различных значений параметров адаптации α:
α = 0,1; α = 0,5.
Таблица 6.1.