Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Статистика_лаб_раб.doc
Скачиваний:
27
Добавлен:
12.03.2015
Размер:
1.03 Mб
Скачать

5. Временное прогнозирование.

Прогнозирование на ВДР (временных динамических рядах), в которых наряду с общей тенденцией изменения переменных во времени, учитывается и «сезонная» составляющая, весьма успешно применяется и называется АРПСС – авторегрессии и проинтегрированного скользящего среднего. Он реализован в виде соответствующей процедуры ARIMAв ПППStatistica6.0. Вводится три типа параметров модели:

  • параметры авторегрессии (p),

  • порядок разности (d),

  • параметры скользящего среднего (q).

В обозначениях Бокса и Дженкинса модель записывается как АРПСС (p, d, q). Например, модель (0,1,1) содержит 0 (ноль) параметров авторегрессии (p) и один параметр скользящего среднего (q), который вычисляется для ряда после взятия разности с лагом 1(d).

Мультипликативная сезонная АРПСС представляет естественное развитие и обобщение обычной модели АРПСС на ВДР, в которых имеется периодическая сезонная компонента. В дополнении к несезонным параметрам – общей тенденции изменения ВДР, в модель вводятся сезонные параметры для определения лага (устанавливаемого на этапе идентификации модели). Аналогично параметрам простой модели АРПСС, эти параметры называются:

  • сезонная авторегрессия (ps),

  • сезонная разность (ds),

  • сезонное скользящее среднее (qs).

Таким образом, полная сезонная АРПСС может быть записана как АРПСС (p, d, q)(ps, ds, qs). Например, модель(0, 1, 1)(0, 1, 1) включает 0 регулярных параметров авторегрессии, 1 регулярный параметр скользящего среднего и один параметр сезонного скользящего среднего. Сезонный лаг, используемый для сезонных параметров, определяется на этапе анализа характеристик ИСД.

Результаты временного прогнозирования откликов представлены на рис. 9.-рис.11.

Рис.9

Рис.10

Рис.11

6. Корреляционный анализ.

Корреляция – это соотношение (взаимозависимость) случайных величин между собой. В качестве количественной меры оценки взаимосвязи между случайными величинами используется коэффициент линейной корреляции, вычисляемый для случайных величин хиупоnэкспериментальным данным по следующей формуле.

.

; ,

где: n- количество учитываемых интервалов времени;

m- количество изменяемых производственно-экономических факторов;

r- количество факторов внешней среды;

k- количество результативных показателей эффективностиyi(yj);

- значениеi-ой (j-ой) переменной наg-том учитываемом интервале времени.

Критическое значение коэффициента линейной корреляции:

;; (7.2.)

где – критическое значение критерия Стьюдента для рекомендуемого уровня значимости. Вычислив это значение, получимrкрит=0,387461.

Коэффициенты линейной корреляции принимают значения от -1 до +1. Значение, близкое к +1, указывает на наличие сильной положительной, близкой к линейной, зависимости между переменными.Значение, близкое к -1, указывает на наличие сильной отрицательной, близкой к линейной, зависимости между переменными. Значение, близкое к 0, указывает на независимость переменных друг от друга.

Коэффициенты линейной корреляции между факторами хi; и результативными показателями уj; приведены на рис.12.

Рис.12

7. Кластерный анализ

Таблицы для кластерного анализа приведены в Приложении 1.

Кластерный анализ предназначен для выделения совокупностей объектов с однородными показателями (признаками), что позволяет строить более простые математические модели для каждого кластера, чем для всей совокупности объектов в целом.

Поставим задачу выделения кластеров по показателям расстояния между признаками в группируемых объектах исследования (ОИ) с выполнением следующих условий.

гдеk– количество объектов;

- расстояние междуi-м иj-м объектами;

- символ Кронекера, принимающий значение 1, еслиi-ый иj-ый объекты входят в один и тот же кластер; и значение0, если не входят.

Признаки представляются либо в натурных единицах измерения, либо в стандартизированной форме, в которой их средние значения равны нулю, а стандартные отклонения равны единице. В стандартных процедурах для проведения кластерного анализа, как правило задается либо количество кластеров, либо пороговое значение для условия (1).

Условие (1) обеспечивает минимум расстояний между признаками объектов, вошедших в один и тот же кластер; а максимум этих расстояний между объектами, вошедшими в разные кластеры.

Технология проведения кластерного анализа включает в себя следующие этапы:

1.Стандартизация исходных статистических данных (выполняется в случаях, когда учитываемые признаки значительно отличаются по масштабам единиц измерения).

2.Вычисление расстояний между признаками объектов и суммарного расстояния между объектами по всем признакам и составление матрицы расстояний между объектами.

3.Поиск наименьшего расстояния между объектами и объединение двух объектов с наименьшим расстоянием между ними в один кластер.

4.Вычисление расстояний между объектами и формирующимися кластерами и преобразование матрицы расстояний между ними. Переход к пункту 3 и выполнение пунктов 3 и 4 до тех пор, пока не будут сгруппированы все объекты и сформированные кластеры в один общий кластер, после чего переход к пункту 5.

5.Выдача перечней объектов по выделенным кластерам и соответствующей дендрограммы с указанием расстояний между сформированными кластерами.

Кластерный анализ при выполнении РГР проводился с помощью пакета прикладной программы Statistiсa6.0 методомk-средних

Результатыкластеризации:

Numberofvariables: 16

Number of cases: 27

K-means clustering of cases

Missing data were casewise deleted

Number of clusters: 5

Solution was obtained after 3 iterations

Средние значения для каждого кластера:

Рис.13

Евклидовы расстояния и квадраты евклидовых расстояний между кластерами:

Рис.14

Результаты дисперсионного анализа:

Рис.15

Рис. 16

Далее, на рисунках 17-21 приведем таблицы описательных статистик для каждого из 5 кластеров.

Рис.17

Рис.18

Рис.19

Рис.20

Рис.21

Элементы 1-го кластера и расстояния:

Рис.22

Элементы 2-го кластера и расстояния:

Рис.23

Элементы 3-го кластера и расстояния:

Рис.24

Элементы 4-го кластера и расстояния:

Рис.25

Элементы 5-го кластера и расстояния:

Рис.26

Таблица 7 – Полученные кластеры

Кластер

1

2

3

4

5

2002 (1 кв.)

2001 (4 кв.)

2000 (1 кв.)

2004 (4 кв.)

1999(1 кв.)

2003 (3 кв.)

2002 (2 кв.)

2000 (2 кв.)

1999 (2 кв.)

2004 (1 кв.)

2002 (3 кв.)

2000 (3 кв.)

1999 (3 кв.)

2004 (2 кв.)

2002 (4 кв.)

2000 (4 кв.)

1999 (4 кв.)

2004 (3 кв.)

2003 (1 кв.)

2001 (1 кв.)

2005 (1 кв.)

2003 (2 кв.)

2001 (2 кв.)

2005 (2 кв.)

2003 (4 кв.)

2001 (3 кв.)

2005 (3 кв.)