- •А.С. Березина анализ данных
- •Предисловие
- •Лекция 1. Априорный анализ компонент временного ряда
- •1.1. Понятие временного ряда. Виды временных рядов
- •Производство молока в Кемеровской области
- •Численность работников здравоохранения, перед которыми организация имеет просроченную задолженность по заработной плате работников в Российской Федерации в 2013 году
- •Индекс потребительских цен в Кемеровской области (декабрь к декабрю предыдущего года; в процентах)
- •Потребление сахара (кг) на душу населения в Кемеровской области
- •1.2. Методы оценки однородности исходных данных
- •1.3. Методика выявления и анализа аномальных наблюдений
- •Краткосрочные экономические показатели рф
- •Расчётная таблица примера 1.1.
- •1.4. Абсолютные, относительные и средние показатели в анализе временных рядов
- •ЛЕкция 2. Моделирование тенденции
- •2.1. Проверка гипотезы о существовании тренда
- •Промежуточные расчетные значения кумулятивного т-критерия
- •2.2. Методы выявления тенденции
- •Численность населения на одного врача в Кемеровской области
- •Расчетная таблица метода Фостера-Стюарта
- •2.3. Выбор формы тренда
- •Критерии выбора класса, выравнивающих кривых
- •Лекция 3. Моделирование периодической компоненты
- •3.1. Аддитивные и мультипликативные тренд-сезонные модели Алгоритм построения модели временного ряда, содержащего сезонные колебания:
- •Поквартальные данные по розничному товарообороту компании
- •Расчет коэффициента автокорреляции
- •Коррелограмма временного ряда товарооборота
- •Расчет оценок сезонной компоненты в аддитивной модели
- •Расчет значений сезонной компоненты в аддитивной модели
- •Расчет значений t и ошибок e в аддитивной модели.
- •Расчет оценок сезонной компоненты в мультипликативной модели
- •Расчет значений сезонной компоненты в мультипликативной модели
- •Расчет значений t и ошибок e в мультипликативной модели
- •Лекция 4. Простейшие методы прогнозирования
- •4.1. Метод среднего уровня ряда
- •4.2. Метод среднего абсолютного прироста
- •Расчетная таблица для определения прогнозных значений методом среднего абсолютного прироста
- •4.3. Метод среднего темпа роста
- •4.4. Оценка точности и надежности прогнозов
- •Лекция 5. Методы выбора трендовой модели прогноза
- •5.1. Прогнозирование на основе кривых роста
- •5.2. Прогнозирование на основе экстраполяции тренда
- •Лекция 6. Адаптивные модели прогнозирования
- •6.1. Сущность адаптивных методов
- •6.2. Экспоненциальное сглаживание
- •Индекс потребительских цен Кемеровской области
- •Экспоненциальные средние
- •6.3. Метод гармонических весов
- •Параметры уравнений отдельных фаз движения текущего тренда
- •Лекция 7. Прогнозирование динамических рядов, не имеющих тенденции.
- •Распределение знаков отклонений
- •Расчетная таблица для определения знаков отклонений
- •Распределение знаков отклонений
- •8. Метод экспертных оценок
- •8.1. Методы и модели экспертных оценок
- •Матрица опроса
- •Матрица преобразованных рангов
- •Оценки вкусовых качеств продукта
- •Оценки вкусовых качеств продукта
- •Матрица преобразованных рангов
- •8.2. Методы и модели выбора альтернатив
- •Частные критерии трех операторов
- •Нормализованные критерии
- •Лекция 9. Статистические методы обработки результатов экспертизы
- •9.1. Оценка согласованности мнений экспертов
- •9.2. Обобщение мнений экспертов
- •Список литературы
- •Содержание
- •Анализ данных
- •650992, Г. Кемерово, пр. Кузнецкий, 39
Численность населения на одного врача в Кемеровской области
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
221,6 |
219,9 |
217,8 |
215,8 |
212,6 |
212,8 |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
209,5 |
207 |
207,7 |
207,4 |
209,5 |
206,8 |
Необходимо проверить наличие тенденции в данном ряде динамики методом сравнения средних уровней ряда динамики.
Решение.Разобьем исходный ряд динамики на 2 равные части:
– в первую войдут значения показателя с 2000 по 2005 гг.,
– во вторую — с 2006 по 2011 гг.
Рассчитаем выборочные характеристики:
.
Если в ряду динамики существует тенденция средней, то средние, вычисленные для двух совокупностей, должны значимо различаться между собой.
Выдвигаем гипотезу , проверяем ее на основе t-критерия Стьюдента:
.
.
, следовательно гипотеза о равенстве средних двух совокупностей отвергается с вероятностью ошибки 0,05, средние существенно различаются между собой, в ряду динамики численности населения на одного врача Кемеровской области существует тенденция средней и, следовательно, в ряду динамики существует тренд.
Проверим гипотезу H0 о равенстве дисперсий двух нормально распределенных совокупностей на основе F-критерия Фишера — Снедекора.
, ,.
Так как Fp > Fкр, то гипотеза H0 о равенстве дисперсий двух нормально распределенных совокупностей отвергается с вероятностью ошибки 0,05, следовательно, расхождение между дисперсиями существенно, в ряду динамики численности населения на одного врача Кемеровской области существует тенденция дисперсий, следовательно, в ряду динамики существует тренд.
Метод Фостера-Стюарта основан на двух простых характеристиках S и d.
,
где: .
Суммирование производится по всем членам ряда. Значения иопределяются путем последовательного сравнения уровней.
Если значение уровня ряда превышает по своей величине каждый из предыдущих уровней, то величине присваивается значение 1, в остальных случаях она равна 0. Таким образом:
Наоборот, если значение уровня ряда меньше всех предыдущих, то присваивается значение 1.
Таким образом:
Показатели S и d асимптотически нормальные и имеют независимые распределения, но на них влияет порядок расположения уровней во времени. Показатель S применяется для обнаружения тенденции изменения в дисперсиях, d — для обнаружения тенденций в средней. После того, как для исследуемого ряда найдены фактические значения d и S, проверяется гипотеза о том, можно ли считать случайными разности d — 0 и S — μ.
Гипотезы можно проверять, применяя t-критерий Стьюдента, то есть:
где: μ — математическое ожидание величины S, определенное для случайного расположения уровней во времени;
, — средние квадратические ошибки величин S и d.
Значения μ, ,табулированы.
Если , то гипотеза об отсутствии тенденции в средней отвергается, следовательно в исходном временном ряду существует тренд.
Если , то гипотеза об отсутствии тенденции в дисперсиях отвергается, следовательно существует тенденция дисперсии и существует тренд.
Пример 2.3. Проверим наличие тенденции в ряду динамики численности населения на одного врача в Кемеровской области методом Фостера-Стюарта.
Решение.Отразим в таблице 2.3.,,,.
Таблица 2.3.