Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
TEORETIChNI_VIDOMOSTI_DO_PRAKTIChNOYi_ROBOTI_2.doc
Скачиваний:
40
Добавлен:
04.03.2016
Размер:
492.03 Кб
Скачать

5.1.2 Компонентный состав рядов динамики

Статистические методы исследования исходят из предположения о возможности представления уровней ряда в виде суммы нескольких компонент, отражающих закономерность и случайность развития:

Х(t) = F(t) + S(t) + С(t) +E(t):

где F(t) - тренд (долговременная тенденция) развития;

S(t) - сезонная компонента;

C(t) - циклическая компонента

E(t) - остаточная компонента.

К регулярным компонентам временных рядов, чаще всего, относятся: трендовая компонента и сезонная компонента, реже циклическая компонента, отличающая от сезонной большей длительностью цикла. Оба эти вида регулярных компонент часто присутствуют в ряде одновременно.

Тренд представляет собой устойчивое изменение показателя в течение длительного времени, определяет общее направление развития (тенденцию) анализируемого явления. Он является детерминированной компонентой, которая описывается с помощью линейной или нелинейной и монотонной неслучайной функцией F(t). На его основе формируются прогнозные оценки.

Сезонная компонента характеризует устойчивые внутригодичные колебания уровней. Это периодически повторяющаяся компонента, описываемая некоторой периодической функцией S(t). Она проявляется в некоторых показателях, которые представлены квартальными или месячными данными. Наличие устойчивых колебаний в суточных или недельных данных могут рассматриваться как циклические.

Остаточная компонента представляет собой расхождение между фактическими и расчетными значениями, т.е.E(t)=Y(t)-(F(t)+S(t)). Если модель построена хорошая, то E(t) является случайной, независимой и подчиняющейся нормальному закону распределения компонентой и несильно отличающаяся от нуля. В противном случае модель является плохой.

5.1.3. Требования к данным

Все математические методы обработки временных рядов наблюдений используют аппарат математической статистики, который требует, чтобы в исходных данных наблюдалась:

  • сопоставимость

  • полнота

  • однородность

  • устойчивость.

Невыполнение одного из этих требований делает бессмысленным применение любого математического аппарата исследования.

В блоке исходных данных могут отсутствовать некоторые значения. В этом случае большинство программ выдают соответствующую диагностику и осуществляют обработку пропущенных наблюдений.

Сопоставимость данных достигается в результате одинакового подхода к наблюдениям на разных этапах формирования ряда динамики. Уровни во временных рядах должны выражаться в одних и тех же единицах измерения, иметь одинаковый шаг наблюдений, рассчитываться для одного и того же интервала времени, по одной и той же методике, охватывать одни и те же элементы, относящиеся к неизменной совокупности.

Полнота данных связана с их количеством. Достаточное число наблюдений определяется в зависимости от цели проводимого исследования динамики. Если целью является описательный статистический анализ, то в качестве изучаемого можно выбрать очень короткий интервал времени (но не менее 5 наблюдений). Если же целью исследования является построение модели динамики, то число уровней исходного динамического ряда в этом случае должно не меньше, чем в три раза превышать период упреждения прогноза и быть не менее 10.

В случае использования квартальных или месячных данных для исследования сезонности и прогнозирования сезонных процессов, исходный временной ряд должен содержать данные не менее чем за четыре года, даже если требуется прогноз на 1-2 квартала (месяца). В противном случае эти данные будут обрабатываться без учета внутригодичных колебаний.

Однородность данных означает отсутствие нетипичных, аномальных наблюдений, а также изломов тенденций. Аномальность приводит к смещению оценок и, следовательно, к искажению результатов анализа. Формально она проявляется как сильный скачок (спад) с последующим примерным восстановлением предыдущего уровня.

Для диагностики аномальных наблюдений предложено несколько критериев. Один из них предполагает для всех или только для подозрительных на аномальность уровней вычислять среднее значение и среднеквадратическое отклонение нескольких соседних с ними. Если рассчитанная величина превышает критическое значение, наблюдение считается аномальным. Аномальные наблюдения необходимо исключить из временного ряда и заменить расчетными значениями.

Изломы тенденций свидетельствуют об изменении закономерностей протекания процесса или об изменении методики вычисления значений показателя. В этом случае также важно провести качественный анализ происходящих изменений или дождаться поступления нового наблюдения.

Устойчивость временного ряда отражает преобладание закономерности над случайностью в изменении уровней ряда. На графиках устойчивых временных рядов даже визуально прослеживается закономерность. На графиках неустойчивых рядов изменения последовательных уровней представляются хаотичными, и поэтому поиск закономерностей в формировании значений уровней таких рядов лишен смысла.

Обработка пропущенных наблюдений. Выделенные пользователем данные могут содержать нечисловые и пропущенные наблюдения. При любом методе обработки они должны быть предварительно устранены, т.е. заменены числовыми значениями. Обработку пропущенных наблюдений можно выполнить тремя способами, а именно, путем:

· интерполяции;

· аппроксимации;

· построения регрессионных зависимостей.

В соответствии с первым способом пропущенные наблюдения восстанавливаются путем использования стандартных интерполяционных формул (например, с использованием методов линейной и кубической интерполяции, интерполяции сплайнами, аппроксимацию полиномами), причем каждый показатель обрабатывается изолированно от других. При этом способе известные наблюдения не меняются.

Восстановление наблюдений при помощи аппроксимации сводится к подбору кривой роста, наилучшим образом отображающей особенности изменения исследуемого показателя. При этом пропущенные наблюдения заменяются на расчетные значения аппроксимирующей модели.

Восстановление наблюдений при помощи регрессионных зависимостей заключается в построении модели взаимосвязи показателя, который содержит пропущенные наблюдения, с одним или несколькими показателями, не содержащими пропущенные наблюдения.

Восстановление пропущенных наблюдений при всех описанных выше способах осуществляется лишь в том случае, если по каждому показателю количество пропущенных наблюдений не превышает половины всего объема наблюдений

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]