- •А.С. Березина анализ данных
- •Предисловие
- •Лекция 1. Априорный анализ компонент временного ряда
- •1.1. Понятие временного ряда. Виды временных рядов
- •Производство молока в Кемеровской области
- •Численность работников здравоохранения, перед которыми организация имеет просроченную задолженность по заработной плате работников в Российской Федерации в 2013 году
- •Индекс потребительских цен в Кемеровской области (декабрь к декабрю предыдущего года; в процентах)
- •Потребление сахара (кг) на душу населения в Кемеровской области
- •1.2. Методы оценки однородности исходных данных
- •1.3. Методика выявления и анализа аномальных наблюдений
- •Краткосрочные экономические показатели рф
- •Расчётная таблица примера 1.1.
- •1.4. Абсолютные, относительные и средние показатели в анализе временных рядов
- •ЛЕкция 2. Моделирование тенденции
- •2.1. Проверка гипотезы о существовании тренда
- •Промежуточные расчетные значения кумулятивного т-критерия
- •2.2. Методы выявления тенденции
- •Численность населения на одного врача в Кемеровской области
- •Расчетная таблица метода Фостера-Стюарта
- •2.3. Выбор формы тренда
- •Критерии выбора класса, выравнивающих кривых
- •Лекция 3. Моделирование периодической компоненты
- •3.1. Аддитивные и мультипликативные тренд-сезонные модели Алгоритм построения модели временного ряда, содержащего сезонные колебания:
- •Поквартальные данные по розничному товарообороту компании
- •Расчет коэффициента автокорреляции
- •Коррелограмма временного ряда товарооборота
- •Расчет оценок сезонной компоненты в аддитивной модели
- •Расчет значений сезонной компоненты в аддитивной модели
- •Расчет значений t и ошибок e в аддитивной модели.
- •Расчет оценок сезонной компоненты в мультипликативной модели
- •Расчет значений сезонной компоненты в мультипликативной модели
- •Расчет значений t и ошибок e в мультипликативной модели
- •Лекция 4. Простейшие методы прогнозирования
- •4.1. Метод среднего уровня ряда
- •4.2. Метод среднего абсолютного прироста
- •Расчетная таблица для определения прогнозных значений методом среднего абсолютного прироста
- •4.3. Метод среднего темпа роста
- •4.4. Оценка точности и надежности прогнозов
- •Лекция 5. Методы выбора трендовой модели прогноза
- •5.1. Прогнозирование на основе кривых роста
- •5.2. Прогнозирование на основе экстраполяции тренда
- •Лекция 6. Адаптивные модели прогнозирования
- •6.1. Сущность адаптивных методов
- •6.2. Экспоненциальное сглаживание
- •Индекс потребительских цен Кемеровской области
- •Экспоненциальные средние
- •6.3. Метод гармонических весов
- •Параметры уравнений отдельных фаз движения текущего тренда
- •Лекция 7. Прогнозирование динамических рядов, не имеющих тенденции.
- •Распределение знаков отклонений
- •Расчетная таблица для определения знаков отклонений
- •Распределение знаков отклонений
- •8. Метод экспертных оценок
- •8.1. Методы и модели экспертных оценок
- •Матрица опроса
- •Матрица преобразованных рангов
- •Оценки вкусовых качеств продукта
- •Оценки вкусовых качеств продукта
- •Матрица преобразованных рангов
- •8.2. Методы и модели выбора альтернатив
- •Частные критерии трех операторов
- •Нормализованные критерии
- •Лекция 9. Статистические методы обработки результатов экспертизы
- •9.1. Оценка согласованности мнений экспертов
- •9.2. Обобщение мнений экспертов
- •Список литературы
- •Содержание
- •Анализ данных
- •650992, Г. Кемерово, пр. Кузнецкий, 39
ЛЕкция 2. Моделирование тенденции
2.1. Проверка гипотезы о существовании тренда
Анализ и моделирование тенденции временного ряда целесообразно начинать с выявления наличия тенденции в целом. Для этой цели наиболее эффективны и дают хорошие результаты такие методы как кумулятивный Т-критерий.
Кумулятивный Т-критерий позволяет определить наличие не только самой тенденции, но и ее математического выражения — тренда.
Выдвигается основная гипотеза () об отсутствии тенденции в исходном временном ряду.
Расчетное значение критерия определяется как отношение накопленной суммы квадратов отклонений эмпирических значений уровней временного ряда от их среднего значения и самих отклонений по формуле:
,
,
где - накопленный итог отклонений эмпирических значений от среднего уровня исходного временного ряда:
, .
Расчетное значение кумулятивного Т-критерия сравнивается с критическим при заданном уровне значимости α. Если расчетное значение Tp превышает критическое (табличное) значение критерия (Ткр), то гипотеза об отсутствии тренда отвергается, следовательно в исходном временном ряду существует тенденция, описываемая трендом. В противном случае, если Тр < Ткр или tp < tкр, признается отсутствие тенденции в ряду динамики.
Пример 2.1.Имеются следующие данные об индексе потребительских цен Кемеровской области за период январь-декабрь 2012 г (). Необходимо выявить тенденцию в изменении данного показателя.
Промежуточные расчеты реализации кумулятивного Т-критерия представлены в следующей таблице 2.1.
Таблица 2.1.
Промежуточные расчетные значения кумулятивного т-критерия
месяц |
|
|
|
|
| |
январь |
100,3 |
10060,09 |
-0,3 |
-0,3 |
0,09 |
0,09 |
февраль |
100,3 |
10060,09 |
-0,3 |
-0,6 |
0,36 |
0,09 |
март |
100,6 |
10120,36 |
0 |
-0,6 |
0,36 |
0 |
апрель |
100,3 |
10060,09 |
-0,3 |
-0,9 |
0,81 |
0,09 |
май5 |
100,4 |
10080,16 |
-0,2 |
-1,1 |
1,21 |
0,04 |
июнь |
100,8 |
10160,64 |
0,2 |
-0,9 |
0,81 |
0,04 |
июль |
101,3 |
10261,69 |
0,7 |
-0,2 |
0,04 |
0,49 |
август |
100,6 |
10120,36 |
0 |
-0,2 |
0,04 |
0 |
сентябрь |
100,8 |
10160,64 |
0,2 |
0,00 |
0,00 |
0,04 |
октябрь |
100,7 |
10140,49 |
0,1 |
0,1 |
0,01 |
0,01 |
ноябрь |
100,6 |
10120,36 |
0 |
0,1 |
0,01 |
0 |
декабрь |
100,5 |
10100,25 |
-0,1 |
0,00 |
0,00 |
0,01 |
Сумма |
1207,2 |
121445,2 |
- |
- |
3,74 |
0,9 |
, ,.
Так как Тр > Ткр, то гипотеза об отсутствии тенденции отвергается, следовательно в ряду динамики индекса потребительских цен Кемеровской области тенденция существует.
2.2. Методы выявления тенденции
Тенденция исходного ряда динамики может быть трех видов: тенденция среднего уровня, дисперсии и автокорреляции.
Тенденция среднего уровня может быть выражена с помощью графического метода. Аналитически тенденция выражается с помощью некоторой математической функцииf(t), вокруг которой варьируют эмпирические значения исходного временного ряда изучаемого социально-экономического явления. При этом теоретические значения, то есть значения, полученные по трендовым моделям в отдельные моменты времени, являются математическими ожиданиями временного ряда.
Тенденция дисперсии представляет собой тенденцию изменения отклонений эмпирических значений уровней временного ряда от теоретических, полученных по уравнению тренда.
Тенденция автокорреляции выражает тенденцию изменения корреляционной связи между отдельными, последовательными уровнями временного ряда.
Проверка на наличие тенденции среднего уровня и дисперсии может быть произведена методом сравнения средних уровней временного ряда и методом Фостера-Стюарта.
Метод сравнения средних уровней временного ряда предполагает, что исходный временной ряд разбивается на две приблизительно равные части по числу членов ряда, каждая из которых рассматривается как самостоятельная, независимая выборочная совокупность, имеющая нормальное распределение. При этом решаются две задачи.
I.Если временной ряд имеет тенденцию, то средние, вычисленные для каждой совокупности в отдельности, должны существенно, значимо различаться между собой. Если же расхождение незначимо, несущественно и носит случайный характер, то временной ряд не имеет тенденции средней.
Таким образом, проверка гипотезы () о наличии тенденции в исследуемом ряду сводится к проверке гипотезы о равенстве средних двух нормально распределенных совокупностей, то есть:
Гипотеза проверяется на основе t-критерия Стьюдента, расчетное значение которого определяется по формуле:
,
где: и- средние уровни согласно порядку разбиения;
и - число уровней;
и - дисперсии уровней ряда.
Расчетное значение (tp) критерия сравнивается с его критическим (табличным) значением (tкр) при уровне значимости α и числе степеней свободы n-2.
Если tp > tкр, то гипотеза о равенстве средних уровней двух нормально распределенных совокупностей отвергается, следовательно расхождение между вычисленными средними значимо, существенно и носит неслучайный характер, и, следовательно, во временном ряду существует тенденция средней и существует тренд.
II.Если временной ряд имеет тенденцию, то дисперсии, вычисленные для каждой совокупности в отдельности, должны существенно и значимо различаться между собой. Если же расхождение между ними не значимо, то временной ряд не имеет тенденции дисперсии. Таким образом, проверяется гипотеза (H0:) об отсутствии тенденции в дисперсиях в исходном временном ряду, которая сводится к проверке гипотезы о равенстве дисперсий двух нормально распределенных совокупностей, то есть:
.
Гипотеза проверяется на основе F-критерия Фишера - Снедекора, расчетное значение которого определяется по формуле:
если ,
если .
Проверка гипотезы осуществляется на основе сравнения расчетного и критического значений F-критерия, полученного при заданном уровне значимости α и числе степеней свободы и.
Если , то.
Если , то.
Гипотеза о равенстве дисперсий двух нормально распределенных совокупностей отвергается, если Fp > Fкр. Следовательно, расхождение между вычисленными дисперсиями значимо, существенно, носит неслучайный характер и в ряду динамики существует тенденция в дисперсиях и существует тренд.
Следует заметить, что данный метод дает вполне приемлемые результаты лишь в случае рядов с монотонной тенденцией. Если же ряд динамики меняет общее направление развития, то точка поворота тенденции может оказаться близкой к середине ряда, в силу этого средние двух отрезков ряда будут близки и проверка может не показать наличия тенденции.
Пример 2.2. Имеются следующие данные о численности населения на одного врача в Кемеровской области (таблица 2.2).
Таблица 2.2.