- •П.Я. Бушин
- •Введение
- •Глава 1. Парная линейная регрессия и корреляция
- •1.1. Обычный метод наименьших квадратов (мнк) и его предпосылки
- •1.2. Оценки точности уравнения регрессии и его параметров
- •1.2.1. Стандартная ошибка оценки по регрессии
- •1.2.3. Интервальные оценки параметров уравнения регрессии
- •1.2.4. Проверка значимости параметров уравнения регрессии
- •1.2.7. Коэффициент ранговой корреляции Спирмена
- •1.3. Спецификация уравнения регрессии
- •0 1,22 1,42 2,58 2,78 4
- •1.4. Нелинейная корреляция и регрессия
- •1.4.2. Индекс корреляции
- •Глава 2. Множественная корреляция и регрессия
- •2.1. Множественный корреляционный анализ
- •2.1.1. Анализ матрицы парных коэффициентов корреляции
- •2.1.2. Частная и множественная корреляция
- •2.2. Линейная модель множественной регрессии
- •2.2.1. Уравнение множественной регрессии в натуральном масштабе
- •2.2.2.Стандартизованное уравнение множественной регрессии
- •2.2.3. Оценки точности уравнения множественной регрессии
- •2.2.4. Анализ остатков уравнения множественной регрессии на втокорреляцию
- •2.2.5. Пошаговый выбор переменных
- •0 0,9 1,83 2,17 3,1 4
- •2.3. Особые случаи использования мнк во множественной регрессии
- •2.3.1. Оценка параметров уравнения множественной регрессии в условиях мультиколлинеарности (пошаговый регрессионный анализ)
- •2.3.2. Оценка параметров уравнения множественной регрессии с автокоррелированными остатками
- •2.3.3. Оценка уравнения множественной регрессии с гетероскедастичными остатками (обобщенный мнк)
- •2.3.4. Регрессионные модели с переменной структурой (фиктивные переменные)
- •Глава 3. Анализ временных рядов
- •3.1. Характеристики временных рядов
- •3.2. Показатели точности прогноза
- •3.3. Анализ автокорреляций
- •3.4. Модели стационарных временных рядов
- •3.5. Модели нестационарных временных рядов
- •3.5.1. Прогноз по тренду
- •3.5.2. Прогнозирование на основе сезонной компоненты (сезонная декомпозиция временного ряда)
- •3.5.3. Прогноз по экспоненциально взвешенным скользящим средним (адаптивные методы прогнозирования)
- •Поквартальные данные продажи учебников
- •Расчет прогноза с учетом сезонной компоненты
- •Глава 4. Система одновременных эконометрических уравнений
- •4.1. Общие понятия о системах одновременных уравнений
- •4.2. Косвенный метод наименьших квадратов
- •4.3. Проблемы идентифицируемости
- •Библиографический список
- •Оглавление
- •Глава 1. Парная линейная регрессия и корреляция………………………………………4
- •Глава 2. Множественная корреляция и регрессия………………………………………..23
- •Глава 3. Анализ временных рядов………………………………………………………….58
- •Пример. Моделирование сезонной компоненты на основе
- •Учебное издание Павел Яковлевич Бушин эконометрика
Расчет прогноза с учетом сезонной компоненты
Год |
Квартал |
Прогноз по тренду |
Индекс сезонности |
Прогноз на очередной год |
4 |
1 2 3 4 |
21,78 22,03 22,28 22,53 |
0,906 0,486 1,395 1,218 |
(21,78)(0,909) = 19,80 (22,03)(0,486) = 10,71 (22,28)(1,395) = 31,08 (22,53)(1,218) = 27,44 |
Отметим, что здесь рассматривалась сезонная компонента с длиной сезонности, равной 4 (4 квартала). Если исходные данные представлены помесячной динамикой (12 месяцев), то и сезонная компонента будет содержать 12 индексов сезонности вместо четырех. Процедура их вычисления при этом остается аналогичной.
Пример. Подбор наилучшей модели прогноза (модель Винтера)
Приведем пример выбора метода прогнозирования с использованием ранее рассмотренной информации на основе процедуры ППП Statgraphics «Forecasting– прогнозирование», как это указано на рис. 58.
Рис. 58. Выбор процедуры «прогнозирование» в ППП Statgraphics
Процедура «Forecasting» предусматривает возможность выбирать среди нескольких моделей прогноза (в том числе и модель Винтера) наилучшую модель, ориентируясь на ошибки прогноза.
Для того чтобы можно было использовать модель Винтера, необходимо в установках процедуры прогнозирования указать длину сезонности, а это автоматически включает процедуру учета сезонности при любой выбранной модели, что и отражено в отчете (рис. 59). Данная процедура позволяет выбирать одновременно 5 типов моделей, которые можно сравнивать по точности на основе ранее рассмотренных показателей точности прогноза.
В нашем случае наиболее точной оказалась модель (В) – линейный тренд (с учетом сезонной компоненты). Точность моделей можно сравнивать по различным показателям, например, по столбцу RMSE– стандартной ошибке прогноза (рис. 59).
Рис. 59. Отчет о выборе модели прогнозирования в ППП Statgraphicsс указанием длины сезонности
Перечислим модели, отраженные в отчете на рис. 59. В позиции (А) была назначена модель линейного экспоненциального сглаживания Холта. Как и отмечалось, для этой модели необходимы два параметра сглаживания: и. В позиции (В) была назначена модель линейного тренда. В позиции (С) – модель простого экспоненциального сглаживания. В позиции (D) – модель Брауна линейного экспоненциального сглаживания. В позиции (Е) – модель Винтера. Как видим, в последнем случае понадобилось три параметра сглаживания:,и.
Тот факт, что модель Винтера оказалась наименее точной, не означает, что она не пригодна для прогнозирования с учетом сезонной компоненты. Если убрать из установок процедуры прогнозирования указание на присутствие сезонности (не указывать длину сезонности), то среди всех выбранных модель Винтера будет наиболее точной, как это видно из отчета на рис. 60, в котором перечислен тот же набор моделей без указания на сезонность (модель Винтера здесь заменена квадратичной моделью Брауна).
Как видим, все приведенные модели имеют ошибку прогноза существенно большую, чем модель Винтера на рис. 59.
Рис. 60. Отчет о выборе модели прогнозирования в ППП Statgraphicsс без указания длины сезонности
Отметим, что результаты прогнозирования по методу сезонной декомпозиции с линейным трендом, полученные ранее, оказались те же самые, что и при прогнозировании по линейному тренду на рис. 59 (сравните уравнение тренда на рис. 60 в позиции (В) и полученное в примере на основе табл. 3.1). Однако в последнем случае при проведении прогноза нет информации о составляющих элементов временного ряда (трендовой и сезонной), как это было получено ранее, но зато здесь прогноз может быть рассчитан в автоматическом режиме с указанием интервальных оценок.
Приведем прогноз по модели Винтера (рис. 61).
Рис. 61. Отчет о прогнозе по модели Винтера
На рис. 62 приведен график прогноза, иллюстрирующий результаты расчетов, приведенных на рис. 61.
Рис.62. График прогноза по модели Винтера
Пример. Моделирование сезонной компоненты на основе фиктивных переменных
Как отмечалось выше (п. 2.3.4), сезонную компоненту можно моделировать и на основе фиктивных переменных. Выберем в качестве примера аддитивную модель сезонной декомпозиции и проиллюстрируем ее сходство с моделью с фиктивными переменными.
Пусть имеются данные о продажах продукции фирмы (см. информацию в столбце Dataна рис. 63). Анализ горизонтального графика ряда (рис. 64) показал наличие тренда с сезонной компонентой. Применим метод сезонной декомпозиции (аддитивную модель), результаты которого показаны на рис. 63.
Рис. 63. Отчет о расчетах по методу сезонной декомпозиции по аддитивной модели
Рис. 64. Горизонтальный график ряда
Ниже приведены результаты усреднения сезонно-случайной компоненты в виде показателей, указывающих, на сколько усл. ден. единиц продажи выше или ниже средних по тренду.
Рис. 65. «Индекс» сезонности
Далее приведен график этих показателей (рис. 66). Слово «индекс» взят в кавычки потому, что здесь этот показатель выражен в абсолютных единицах изучаемого процесса (усл. ден. ед.), а не в долях или процентах, как это обычно присуще индексам в статистике.
Рис. 66. График «индекса» сезонности
По приведенным расчетным показателям заключаем, что продажи в первом квартале в среднем на 67,3 усл. ден. ед. меньше, чем по тренду, а в остальных кварталах – выше на соответствующую величину.
Приведенный ниже (рис. 67) график данных, исправленных на сезонность показывает наличие тренда, который можно принять за линейный. Рассчитаем по этим данным линейный тренд.
Рис. 67. График данных, исправленных на сезонность
Результаты расчета линейного тренда приведены ниже (рис. 68).
Рис. 68. Уравнение линейного тренда (R2 = 87,5%,d= 1,82)
Итак, уравнение тренда имеет вид
= 223.16 + 4.85t.
Проведем теперь моделирование сезонной компоненты с помощью фиктивных переменных. Как уже отмечалось, число таких переменных должно быть на единицу меньше, чем число уровней моделируемого явления. Т. к. у нас квартальные данные, то таких переменных будет три: х1, х2и х3. Каждая из них равна единице для соответствующего квартала и равна нулю – для остальных, как это отражено на рис. 69.
Рис. 69. Исходные данные для модели с фиктивными переменными
Результаты множественной регрессии с фиктивными переменными приведены на рис. 70.
Рис. 70. Отчет о множественной регрессии при моделировании сезонной компоненты с помощью фиктивных переменных
Итак, уравнение регрессии имеет вид (с округлением)
= 240.9 + 4,94t– 82,71x1– 5,27x2+ 14,04x3.
Таким образом, по сравнению с четвертым кварталом продажи в первом квартале ниже на 82,7 1 ед., во втором – ниже на 5,27 ед., а в третьем – выше на 14,04 ед. Средний постоянный уровень продаж равен 240.9 ед., а среднее ежеквартальное увеличение продаж равно 4,94 ед. (коэффициент при t).
Аналогичные результаты можно получить, сравнивая сезонные «индексы» для аддитивной модели. Так, разница между такими индексами для соответствующих кварталов следующая: S4–S1 = 20,26 – (–67,32) = 87,58;S4–S2 = 20,26 – 13,56 = 6,7;
S4–S3 = 20,26 – 33,49 = –13,23.
Задания для самостоятельной работы
Задание 1
К следующим временным рядам подобрать лучшую линию тренда в виде аналитической кривой:
а) 21,6 22,9 25,5 21,9 23,9 27,5 31,5 29,7 28,6 31,4 32,1 31,2;
б) 146 106 123 89 97 74 80 53 56 35.
Изобразить в системе координат исходные данные и выбранную линию тренда.
Ниже (рис. 71 и рис. 72) приведены отчеты о решении задач с помощью статистического ППП. Вам необходимо его проанализировать и сделать соответствующие выводы по аналогии с тренировочным примером.
Рис. 71. Информация для решения задачи а)
Рис. 72. Информация для решения задачи б)
Прогноз сделать по линейному и квадратичному тренду.
Задание 2
Имеется следующая информация о потреблении электроэнергии жителями города за 4 года по кварталам (рис.73 в столбце Data).
Используя результаты расчетов (рис. 73), построить график исходных данных и линию тренда по центрированным скользящим средним (столбец Trend-Cycle рис.73). Вычислить индексы сезонности, усреднив показатели сезонности (столбецSeasonality) по соответствующим кварталам (например, для 3-го квартала необходимо сосчитать среднюю арифметическую из чисел с номерами 3, 7, и 11 в столбцеSeasonalityи т. д.).
Рис. 73. Информация для анализа задачи из задания 2
Построить график индексов сезонности.
Спрогнозировать потребление электроэнергии по линии тренда (выбрать лучшую линию тренда по данным на рис. 58)
Рис. 74. Окно отчета о подборе линии тренда
Скорректировать прогноз по тренду с помощью индексов сезонности.
Задание 3
Для следующего ряда данных об объемах продаж некоторой фирмы по кварталам спрогнозировать объемы продаж на очередной 6-й год, выбрав наилучший тип модели:
350, 200, 150, 400, 550, 350, 250, 550, 550, 400, 350, 600, 750, 500, 400, 650, 850, 600, 450, 700.
Задание 4
Спрогнозировать на очередные 5 периодов процесс, характеризующийся следующими данными за 40 прошедших периодов, подобрав наилучший вид модели:
10,4 10,34 10,55 10,46 10,82 10,91 10,87 10,67 11,11 10,00 11,20 11,27 11,44 11,52 12,10 11,83 12,62 12,41 12,43 12,73 13,01 12,74 12,73 12,76 12,92 12,64 12,79 13,06 12,69 13,01 12,90 13,12 12,47 12,94 13,1 12,91 13,39 13,13 13,34 13,14.