Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика (лабораторные)

.pdf
Скачиваний:
177
Добавлен:
01.03.2016
Размер:
1.96 Mб
Скачать
yˆx1x2 x3

Полученное уравнение линейной трехфакторной регрессии имеет вид:

7,939992 5,011457 x1 0,738521x2 7,904669 x3 .

Для проверки статистической значимости коэффициентов регрессии воспользуемся t–критерием. Введем формулы-комментарии, как показано на рисунке

Позиционируясь в ячейке С38, выведем результаты использования статистической функции СТЬЮДРАСПОБР с аргументами: вероятностью0,1 и числу степеней свободы =16 (20–4=16). Таким образом, критическое значение tкр=1,745884. Для нахождения наблюдаемых значений t–статистики введем формулы согласно таблице:

 

 

 

 

Ячейка

 

 

 

 

 

 

Формула

 

 

 

 

 

С41

 

 

 

 

 

 

= С30/С31

 

 

 

 

 

С44

 

 

 

 

 

 

=В30/В31

 

 

 

 

 

С48

 

 

 

 

 

 

=А30/А31

 

Так как

 

tнабл 1

 

tкр,

 

tнабл2

 

tкр и

 

tнабл3

 

tкр, то коэффициенты при X1

 

 

 

 

 

 

иX 3 являются значимыми, а при X2 – незначимым. Внесем

соответствующие комментарии «значим», «незначим» и «значим» в ячейки D41, D44, D48. Таким образом, полученное уравнение регрессии не– приемлемо, поскольку коэффициент при переменной X2 незначим. Попытаемся улучшить модель, исключив из нее фактор X 2 , так как он

теснее связан с X 3 ( r2,3 0,69661), чем с X1 ( r1,3 0,615448).

Чтобы применить снова функцию ЛИНЕЙН, необходимо, чтобы дан– ные X1 и X 3 располагались рядом. Поэтому скопируем диапазон В2:С22 в

диапазон G2:H22, диапазон Е2:Е22 – в диапазон I2:I22. Применим

111

функцию ЛИНЕЙН к подготовленным данным и выведем массив значений этой функции в диапазон К4:М8.

Аналогично предыдущему случаю создадим шаблон для вывода уравнения регрессии, а также введем формулы-комментарии для нахождения критического и наблюдаемого значений t–статистики, как показано ниже:

Далее введем формулы согласно таблице:

 

 

 

 

 

Ячейка

Формула

 

 

 

 

 

 

L11

=M4

 

 

 

 

 

 

M11

=L4

 

 

 

 

 

 

O11

=K4

 

 

 

 

 

 

M17

=L4/L5

 

 

 

 

 

 

M20

=K4/K5

 

В ячейке М15 получим результаты функции СТЬЮДРАСПОБР с

аргументами: вероятность 0,1

и число степеней свободы 17(20–

3=17).

 

 

 

 

 

 

 

 

 

 

 

Уравнение регрессии имеет вид:

 

 

yˆx x

25,01131 5,602748x1 8,234207 x3 .

1

3

 

 

 

 

 

 

 

 

 

tкр и

 

tнабл3

 

 

tкр , то в полученном уравнении все

Так как

tнабл1

 

 

 

 

коэффициенты регрессии значимы. Внесем соответствующие комментарии

«значим», «значим» в ячейки N17 и N20.

Проверим значимость уравнения в целом на 5%-м уровне значимости. Для этого в ячейках L23 и K25 внесем формулы-комментарии Fкр= и

112

F

 

 

R2

 

n p 1

. В ячейке М23 найдем критическое значение F с

 

 

 

набл

1 R2

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

помощью статистической функции F.ОБР при 0,05,

1 2

и

 

 

2

17. В ячейке N25 вводим формулу «=K6/(1–K6)*(20–2–1)/2». Так как

Fнабл

 

Fкр

, то

уравнение

в целом также значимо. Комментарий

«уравнение значимо» запишем в ячейку О25.

 

 

 

 

 

 

 

 

 

 

 

Вопросы для самопроверки

 

 

 

 

 

1.

Каковы последствия нарушения допущения М i 0 ?

 

 

 

2.

Каковы

последствия

нарушения допущения

D

i

2

 

 

 

 

 

 

 

 

 

 

 

 

 

(появления гетероскедастичности)?

 

 

 

 

 

 

3.

Каким

образом

можно

обнаружить

и

устранить

гетероскедастичность?

 

 

 

 

 

 

 

4.

В чем суть теста Спирмена?

 

 

 

 

 

 

5. Каковы причины и последствия нарушения допущения

 

 

 

cov i , j 0 (автокорреляции)?

 

 

 

 

 

6.Каким образом проверяется наличие автокорреляции ошибок

модели?

7.Приведите общую схему применения критерия Дарбина–Уотсона.

8.В чем суть обобщенного МНК?

9.Что такое мультиколлинеарность и как ее устранить?

Лабораторная работа № 10

Тема: Временные ряды 10.1. Понятие о временных рядах.

Временной ряд – это совокупность значений какого-либо показателя за несколько последовательных моментов времени. Отдельные наблюдения, из которых состоит временной ряд, называются уровнями этого ряда и

обозначаются как y(t) или yt (t 1, N , N – число уровней). Под длиной временного ряда понимают количество входящих в него уровней.

Временные ряды делятся на моментные и интервальные. Если уровень временного ряда фиксирует значение изучаемого показателя на определенный момент времени, то этот ряд называется моментным. Если уровень временного ряда характеризует значение показателя за определенный период времени, то этот ряд является интервальным.

113

Если значения уровней временного ряда точно определены какойлибо математической функцией, то он называется детерминированным. Если же уровни временного ряда могут быть описаны с помощью функции распределения вероятностей, то он называется случайным.

Уровни случайного временного ряда могут быть непрерывными и дискретными случайными величинами.

Временной ряд называется стационарным, если его основные свойства остаются неизменными во времени. В противном случае ряд называется нестационарным.

Частным случаем стационарных временных рядов является случайный процесс, называемый белым шумом. Случайная последовательность значений y1 , y2 , , yN будет белым шумом, если M ( yt ) 0, элементы

являются некоррелированными, одинаково распределенными случайными величинами, имеющими постоянную дисперсию ( D yt 2 ). Белый шум

– абсолютно теоретический процесс, который реально не существует, однако он является очень важной математической моделью, широко применяемой при решении множества практических задач.

10.2. Основные компоненты уровней временного ряда.

Для описания и детального изучения временных рядов используются различные математические модели. Их идентификация предполагает выявление основных компонент, которые содержат изучаемые временные ряды.

Данные, представленные в виде временных рядов, могут содержать два вида компонент – систематическую и случайную составляющие. Систематическая составляющая является результатом влияния постоянно действующих факторов. Выделяют три основных систематических компоненты временного ряда:

тренд (долговременная тенденция) развития (T);

сезонная компонента (S);

цикличная компонента (С).

Тренд – это систематическая линейная или нелинейная компонента, плавно изменяющаяся во времени. Он описывает чистое влияние долговременных факторов.

Сезонная компонента – это периодические колебания уровней временного ряда в течение не очень длительного периода (до года). Сезонность отражает повторяемость экономических процессов в рамках одного года.

114

Цикличность – это периодические колебания, выходящие за рамки одного года. Промежуток времени между двумя соседними «вершинами» или «впадинами» в масштабах года считается длиной цикла. Цикличность отражает повторяемость экономических процессов (например, фазовый процесс развития экономики).

Систематические составляющие могут одновременно присутствовать во временном ряду.

Случайной составляющей называется случайный шум, или ошибка, воздействующая на временной ряд нерегулярно. Основными причинами случайного шума могут быть факторы резкого и внезапного воздействия (катастрофические колебания), а также воздействие текущих факторов, которое может быть связано, например, с ошибками наблюдений.

Отдельный уровень

временного

ряда

yt , представимый

в виде

функции от основных компонент yt

f (T, S,C, ), может быть отражен

в нескольких вариантах:

 

 

 

 

 

 

аддитивная форма

yt Tt St

Ct

t ;

 

 

мультипликативная форма

yt

Tt

St Ct

t ;

 

смешанная форма

yt Tt St

Ct t .

 

 

Выбор одной из

моделей

осуществляется на основе

анализа

структурных сезонных колебаний. Если амплитуда сезонных колебаний приближенно постоянна, используют аддитивную модель. Если амплитуда существенно меняется – возрастает или убывает, то используют мультипликативную модель.

Основная задача эконометрического исследования временного ряда направлена на выявление и описание систематических или регулярных компонент ряда. При исследовании временных рядов выделяют следующие основные этапы их анализа:

представление временного ряда в графическом виде;

описание поведения временного ряда;

выявление и исключение систематических компонент временного ряда;

сглаживание и фильтрация временного ряда (удаление случайных выбросов);

исследование случайной компоненты временного ряда, определение адекватности построенной математической модели;

прогнозирование будущих значений временного ряда на основе настоящих и предыдущих значений;

115

анализ взаимосвязей между различными временными рядами.

10.3. Моделирование тенденции временного ряда(построение тренда)

Для определения основной тенденции (тренда) в уровнях временного ряда применяют методы:

механического выравнивания (без построения количественной модели);

аналитического выравнивания (с построением количественной модели).

Однако перед тем как приступить к конкретному описанию трендового уравнения, необходимо доказать гипотезу о существовании основной тенденции (тренда) в изучаемом временном ряду. В настоящее время известно около 10 критериев для проверки гипотезы наличия тренда в ряду, различающихся как по мощности, так и по сложности математического аппарата.

После доказательства гипотезы о неслучайном движении временного ряда переходят к процессу моделирования тенденции исследуемого временного ряда. Методы механического выравнивания (сглаживание скользящими средними, экспоненциальное сглаживание и др.) применяются в том случае, если графически форма тренда не определяется. При этом исходные уровни ряда заменяются расчетными средними значениями меньшей колеблемостью.

Основным способом представления тренда в аналитическом виде является метод аналитического выравнивания с помощью функции времени или кривых роста. Его суть заключается в аппроксимации временного ряда определенной формой регрессионной зависимости. При этом в основном применяются те же методы, что и при работе с моделью парной и множественной регрессии.

Выбор формы кривой может осуществляться на основе метода конечных разностей (при равенстве интервалов между уровнями ряда) и принятого критерия качества уравнения регрессии (минимум суммы квадратов отклонений фактических значений уровней ряда от значений уровней, рассчитанных по уравнению тренда; коэффициент детерминации). От правильно подобранной модели тренда во многом зависит успешность при решении задачи прогнозирования уровней изучаемой временной зависимости.

Расчет параметров при аналитическом выравнивании чаще всего производится с помощью метода наименьших квадратов (МНК).

116

10.4. Моделирование сезонных и циклических колебаний

Существует несколько основных методов моделирования сезонных и циклических колебаний:

расчет сезонной компоненты и построение аддитивной или мультипликативной модели временного ряда;

применение сезонных фиктивных переменных;

анализ сезонности с помощью автокорреляционной функции;

использование рядов Фурье.

Рассмотрим подробно второй и третий методы на примере моделирования сезонных колебаний, так как циклические колебания моделируются аналогично. При этом подходе строится регрессионная модель, в которую помимо фактора времени включаются сезонные фиктивные переменные.

Фиктивной переменной называется атрибутивный или качественный фактор, представленный с помощью определенного цифрового кода. Самый распространенный пример применения фиктивных переменных – это определение разрыва в заработной плате у мужчин и женщин. Допустим, что построена регрессионная зависимость заработной платы

рабочих Y от их возраста X:

Y 0 1 X .

Однако данная регрессионная зависимость не способна в полной мере отразить вариацию результативного признака. Поэтому в модель необходимо ввести дополнительный фактор, например пол. Так как пол является качественным признаком, то нужно представить данную переменную в виде фиктивной:

1,

мужчина ,

D

0,

женщина .

 

Тогда регрессионную модель можно записать с учетом нового

фактора:

Y 0 1 X 2 D ,

где параметр 2 будет отражать в среднем разницу в заработной плате у мужчин и женщин.

Регрессионная модель, включающая в качестве фактора (факторов) фиктивную переменную, называется регрессионной моделью с переменной структурой.

117

Число сезонных фиктивных переменных в такой модели всегда должно быть на единицу меньше сезонов внутри года, т.е. должно быть равно величине L–1. Так, при моделировании годовых данных регрессионная модель помимо фактора времени должна содержать 11 фиктивных компонент (12–1). При моделировании поквартальных данных регрессионная модель должна содержать три фиктивных компоненты (4–1) и т.д.

Каждому из сезонов соответствует определенное сочетание фиктивных переменных. Сезон, для которого значения всех фиктивных переменных равны нулю, принимается за базу сравнения. Для остальных сезонов одна из фиктивных переменных принимает значение, равное единице. Например, если имеются поквартальные данные, то фиктивные переменные z2, z3, z4 будут принимать следующие значения для каждого из кварталов:

Квартал

Фиктивные переменные

 

 

 

 

 

 

z2

 

z3

z4

 

 

1

0

 

0

0

2

1

 

0

0

3

0

 

1

0

4

0

 

0

1

Тогда общий вид регрессионной модели с переменной структурой

будет следующим:

yt 0 1 t 2 z2 3 z3 4 z4 t .

Построенная модель регрессии является разновидностью аддитивной модели временного ряда. Для исследуемой регрессионной зависимости

базисным будет уравнение для первого квартала: yt 0 1 t t .

Частными случаями регрессионной зависимости будут уравнения

тренда для остальных кварталов:

 

 

yt

0

1 t 2

t

для второго квартала;

yt

0

1 t 3

t

для третьего квартала;

yt

0

1 t 4

t

для четвертого квартала.

Коэффициент 1 в данной регрессионной зависимости характеризует среднее абсолютное изменение уровней ряда под влиянием основной тенденции. Оценку сезонной компоненты для каждого сезона можно

118

рассчитать как разность между средним значением свободных членов всех частных регрессионных уравнений и величиной постоянного числа одного из уравнений.

Среднее значение свободных членов всех регрессионных уравнений

вычисляется по формуле

 

 

 

 

 

0 0 2

0 3 0 4 .

 

0

 

 

 

4

 

 

 

 

 

Тогда оценки сезонных отклонений при наличии поквартальных данных

могут быть рассчитаны следующим образом:

 

 

 

 

 

 

 

 

для первого квартала;

0

0

 

 

 

 

 

 

 

для второго квартала;

0

2

 

0

 

 

 

 

для третьего квартала;

0

3

0

 

 

0

4

 

 

 

 

 

0

для четвертого квартала.

В рассмотренной аддитивной модели сумма сезонных отклонений должна равняться нулю.

Сезонные компоненты временного ряда могут быть определены с помощью графика автокорреляционной функции – коррелограммы. Интерес представляют значимые выбросы или сильные автокорреляции, которые четко прослеживаются на корреллограмме.

10.5. Автокорреляция уровней временного ряда и выявление его структуры.

Если временной ряд является нестационарным, т.е. содержащим такие систематические составляющие, как тренд и цикличность, то значения каждого последующего уровня ряда корреляционно зависит от

предыдущих

значений.

Корреляционная

зависимость

между

последовательными

уровнями

временного

ряда

называется

автокорреляцией уровней ряда. Величина сдвига между рядами наблюдений y1, y2 , , yn и y1 , y2 , , yn называется временным лагом . Автокорреляция может быть определена с помощью выборочного коэффициента автокорреляции

 

 

 

 

cov yt , yt

 

 

 

 

 

 

 

 

 

 

r

 

 

 

yt yt yt yt

,

 

 

 

 

S yt S yt

 

 

S yt S yt

 

 

cov yt , yt

 

 

 

где

выборочная

ковариация переменных yt и yt ;

 

 

 

 

yt yt

– среднее арифметическое произведения двух рядов, взятых с

119

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

:

 

 

 

 

 

 

 

yi

yi

 

 

 

 

 

 

 

 

 

 

 

 

 

лагом

y

y

 

i 1

 

 

 

;

 

 

y

 

 

– значение

среднего

уровня

ряда

t

 

 

 

 

 

 

 

 

t

 

 

 

 

 

t

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

, , y

 

 

 

 

 

 

 

 

yi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

, y

:

 

 

y

 

 

 

i 1

;

 

 

y

 

значение

среднего

уровня

ряда

 

 

t

 

 

 

 

 

 

1

2

 

 

n

 

 

 

 

 

 

 

 

n

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y , y , , y

 

 

 

 

 

 

 

 

 

 

 

 

 

yi

 

S y

 

 

 

S y

 

 

 

 

 

:

 

 

 

y

 

 

 

 

 

i 1

 

 

;

 

и

средние

 

 

 

 

t

 

 

 

 

 

1

2

n

 

 

 

 

 

 

 

 

n

 

 

 

t

 

 

 

t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

квадратические

отклонения,

рассчитанные

соответственно

для

рядов

y1 , y2 , , yn

и y1 , y2 , , yn .

 

 

 

 

 

 

 

 

 

 

 

 

 

Лаг (сдвиг во времени) определяет порядок коэффициента автокорреляции. Если 1, то имеем коэффициент автокорреляции 1-го порядка, если 2 – то коэффициент автокорреляции 2-го порядка и т.д. С ростом величины лага на единицу число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается на единицу. В связи с этим рекомендуется максимальный порядок коэффициента

автокорреляции брать равным n4 , где n – число уровней временного ряда.

Рассчитав несколько последовательных коэффициентов автокорреляции, можно определить лаг , при котором автокорреляция r

наиболее высока, выявив тем самым структуру временного ряда. Выделяют следующие основные положения его анализа на основе автокорреляционных коэффициентов:

если наиболее высоким окажется значение коэффициента автокорреляции первого порядка r1 , то изучаемый ряд содержит только

трендовую компоненту;

если наиболее высоким окажется коэффициент автокорреляции порядка , то кроме трендовой компоненты исследуемый временной ряд содержит колебания с периодом , которые могут быть как циклическими, так и сезонными;

если же ни один из коэффициентов автокорреляции r где 1,T ,

не окажется значимым, то можно сделать одно из предположений:

- ряд не содержит трендовой и циклической компонент, а его колебания вызваны воздействием случайной компоненты, т.е. имеет место модель случайного тренда;

120