Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Бардасов - Эконометрика.pdf
Скачиваний:
358
Добавлен:
06.03.2016
Размер:
2.47 Mб
Скачать

4) наличие мультиколлинеарности в модели множественной регрессии может сделать ее непригодной для дальнейшего применения (например, для построения прогнозов).

Вопросы для самопроверки

1.Что такое мультиколлинеарность?

2.Какие показатели свидетельствуют о наличии мультиколлинеарности?

3. Чему равен определитель матрицы X T X в случае совершенной мультиколлинеарности?

4.Что можно сказать о смысле коэффициентов при объясняющих переменных в случае мультиколлинеарности?

5.Какое преобразование производят в гребневом методе, к чему оно приводит?

6.Каков порядок действий в методе последовательного увеличения числа объясняющих переменных?

7.Что показывает коэффициент корреляции?

8.Что показывает частный коэффициент корреляции?

ГЛАВА 7. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ В РЕГРЕССИОННЫХ МОДЕЛЯХ

Цель: научиться использовать в моделях качественные объясняющие переменные.

Методические указания

Необходимо понять и запомнить правило, по которому определяют необходимое число бинарных переменных, используемых для описания качественных признаков. Следует обратить внимание, как повлияет на модель аддитивная и мультипликативная модель использования бинарной переменной.

§1. Модель с одной фиктивной (бинарной) переменной

Врегрессионных моделях в качестве объясняющих переменных часто приходится использовать не только количественные (определяемые численно), но и качественные переменные. Например, спрос на некоторое благо может определяться ценой данного блага,

132

ценой на заменители данного блага, ценой дополняющих благ, доходом потребителей и т. д. (эти показатели определяются количественно). Но спрос может также зависеть от вкусов потребителей, их ожиданий, национальных и религиозных особенностей и т. д. А эти показатели представить в численном виде нельзя. Возникает проблема отражения в модели влияния таких переменных на исследуемую величину. Обычно в моделях влияние качественного фактора выражается в виде фиктивной (искусственной) переменной, которая отражает два противоположных состояния качественного фактора. Например, «фактор действует» — «фактор не действует», «курс валюты фиксированный» — «курс валюты плавающий», «сезон летний» — «сезон зимний» и т. д. В этом случае фиктивная переменная может выражаться в двоичной форме:

0, фактор не действует,

D =

1, фактор действует.

Например, D = 0, если потребитель не имеет высшего образования, D = 1, если потребитель имеет высшее образование; D = 0, если в обществе имеются инфляционные ожидания, D = 1, если инфляционных ожиданий нет.

Переменная D называется фиктивной (искусственной, двоичной) переменной (индикатором).

Таким образом, кроме моделей, содержащих только количественные объясняющие переменные (обозначаемые Xi), в регрессионном анализе рассматриваются также модели, содержащие лишь качественныепеременные(обозначаемыеDi), либотеидругиеодновременно.

Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются ANOVA-моделями (моделями дисперсионного анализа). Например, пусть Y — начальная заработная плата.

0, если претендент не имеет высшего образования,

D =

1, если претендент имеет высшее образование.

Тогда зависимость можно выразить моделью парной регрессии:

Y = β0 D .

(7.1)

133

При этом коэффициент β0 определяет среднюю начальную заработную плату при отсутствии высшего образования. Коэффициент

γуказывает, на какую величину отличаются средние начальные заработные платы при наличии и при отсутствии высшего образования

упретендента. Проверяя статистическую значимость коэффициента

γс помощью t-статистики либо значимость коэффициента детерми-

нации R2 с помощью F-статистики, можно определить, влияет или нет наличие высшего образования на начальную заработную плату.

Нетрудно заметить, что ANOVA-модели представляют собой кусочно-постоянные функции. Однако такие модели в экономике крайне редки. Гораздо чаще встречаются модели, содержащие как качественные, так и количественные переменные.

Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называются ANCOVA-

моделями (моделями ковариационного анализа).

Вначале рассмотрим простейшую ANCOVA-модель с одной количественной и одной качественной переменной, имеющей два альтернативных состояния:

Y = β0 1X D.

(7.2)

Пусть, например, Y — заработная плата сотрудника фирмы, X — стаж сотрудника, D — а пол сотрудника, т. е.

0, если сотрудник женщина,

D =

1, если сотрудник мужчина.

Тогда ожидаемое значение заработной платы сотрудников при x годах трудового стажа будет:

M(Y x,D =0 )= β0 1x для женщины,

M(Y x,D =0 )= β0 1x+γ=(β0 )1x — для мужчины.

Заработная плата в данном случае является линейной функцией от стажа работы. Причем и для мужчин, и для женщин заработная плата меняется с одним и тем же коэффициентом пропорциональности β1 . А вот свободные члены отличаются на величину γ. Про-

верив с помощью t-статистики статистические значимости коэф-

134

фициентов β0 и (β0 ) можно определить, имеет ли место в

фирме дискриминация по половому признаку. Если эти коэффициенты окажутся статистически значимыми, то, очевидно, дискриминация есть. Более того, при γ>0 она будет в пользу мужчин, при

γ<0 — в пользу женщин.

В данном случае пол сотрудников имеет два альтернативных значения, и в модели это отражается одной фиктивной переменной.

Можно получить следующее общее правило:

Если качественная переменная имеет k альтернативных значений, то при моделировании используются только (k 1) фик-

тивных переменных.

Если не следовать данному правилу, то при моделировании исследователь попадает в ситуацию совершенной мультиколлинеар-

ности или так называемую ловушку фиктивной переменной.

Значения фиктивной переменной можно изменять на противоположные. Суть модели от этого не изменится. Например, в модели можно положить, что:

1, если сотрудник женщина,

D =

0, если сотрудник мужчина.

Однако при этом знак коэффициента γ изменится на противоположный.

Значение качественной переменной, для которого принимается D = 0, называется базовым, или сравнительным. Выбор базового значения обычно диктуется целями исследования, но может быть и произвольным.

Иногда фиктивные переменные используют для объяснения поведения зависимой переменной. Например, если исследовать зависимость наличия автомобиля от дохода, пола субъекта и т. п., то зависимая переменная имеет как бы два возможных значения: 0, если машины нет, и 1, если машина есть. Для таких моделей нельзя применять обычный метод наименьших квадратов и используют другие методы.

Заметим, что фиктивные переменные могут применяться и для количественных переменных. Если в случае парной линейной рег-

135

рессии объясняющую перемену разбить на группы по возрастанию значений, то для описания m групп можно применить (m1) би-

нарную переменную. В результате получим аналог применяемой в теории статистики аналитической группировки. Но на вопросы сайта www.fepo.ru следует отвечать, что фиктивные переменные применяются только к качественным признакам.

Пример 7.1. Имеются следующие данные (X — стаж работы (лет), Y — зарплата (ден. ед.), D — пол работника (1 — женщины, 0 — мужчины) (табл. 7.1).

Таблица 7.1

Данные для исследования зарплаты в зависимости от пола работника

 

Y

X

D

 

 

10000

16

0

 

 

7178

2

1

 

 

7720

2

1

 

 

7808

3

1

 

 

8488

25

0

 

 

8375

15

0

 

 

8828

16

1

 

 

5743

0

1

 

 

9143

33

0

 

 

8967

29

1

 

 

8149

3

1

 

 

8010

16

0

 

 

6776

0

1

 

 

9383

19

0

 

 

7670

1

1

 

 

7897

2

1

 

 

9622

32

0

 

 

9622

21

1

 

 

7292

0

1

 

 

8551

34

0

 

 

 

 

 

 

В случае двух объясняющих переменных X и D имеем:

136

 

 

 

n

n

 

 

n

 

 

 

 

 

 

 

 

 

 

xi

 

Di

 

 

20

269

12

 

 

 

 

 

i=1

 

i=1

 

 

 

 

X

T

n

n

2

 

n

 

 

 

269

6561

 

 

 

X =

xi

xi

 

xi Di =

79 ;

 

 

 

i=1

i=1

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

79

12

 

 

 

n

n

 

 

n

2

 

 

 

 

 

 

 

xi Di

 

 

 

 

 

 

 

 

 

Di

Di

 

 

 

 

 

 

 

 

i=1

i=1

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yi

 

 

165222

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

T

n

 

 

 

 

 

 

 

 

 

 

 

 

X Y

=

xi yi = 2409103 .

 

 

 

 

 

 

 

 

i=1

 

 

 

93650

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Di yi

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

Произведя вычисления, получим эмпирическое уравнение регрессии:

ˆy =7505,4+60,68x100,7D .

Следовательно, с увеличением стажа работы на 1 год зарплата увеличивается на 60,68 ден. ед., зарплата женщин в среднем меньше, чем у мужчин на 100,7 ден. ед.

§2. Использование фиктивных переменных

всезонном анализе

Многие экономические показатели напрямую связаны с сезонными колебаниями. Например, спрос на туристические путевки, охлажденную воду и мороженое существенно выше летом, чем зимой. Спрос на обогреватели, шубы выше зимой. Некоторые показатели имеют существенные квартальные колебания и т. д.

Обычно сезонные колебания характерны для временных рядов. Устранение или нейтрализация сезонного фактора в таких моделях позволяет сконцентрироваться на других важных количественных и качественных характеристиках модели, в частности на общем направлении развития модели, так называемом тренде. Такое уст-

137

ранение сезонного фактора называется сезонной корректировкой. Существует несколько методов сезонной корректировки, одним из которых является метод фиктивных переменных.

Пусть переменная Y определяется количественной переменной X, причем эта зависимость существенно разнится по кварталам. Тогда общую модель можно представить в виде:

 

 

Y = β0 1X 1D12D2 3D3 ,

(7.3)

где D1

1, для второго квартала

 

=

в остальных случаях

 

 

0,

 

D2

1, для третьего квартала

 

=

 

 

 

0, в остальных случаях

 

D3

1,

для четвертого квартала

 

=

 

 

 

0, в остальных случаях

 

Заметим, что число кварталов равно четырем, следовательно, число фиктивных переменных должно быть равно трем. В нашем примере в качестве базы выбран 1 квартал. Если значения Y существенно различаются по кварталам (сезонам), то в уравнении (7.3) коэффициенты при фиктивных переменных по кварталам определяется следующими соотношениями:

M (Y D1 =0,D2 =0,D3 =0)= β0 1X — для I квартала,

M (Y D1 =1,D2 =0,D3 =0)=(β0 1)1X — для II квартала, M (Y D1 =0,D2 =1,D3 =0)=(β0 2)1X — для III квартала,

M (Y D1 =0,D2 =0,D3 =1)=(β0 3)1X — для IV квартала. Легко видеть, что в модели (7.3) рассматриваются такие ситуации, при которых квартальные различия отражаются лишь в различии свободных членов моделей. Если же различия затрагивают и изменения коэффициента пропорциональности, то этот факт может

быть отражен в следующей модели:

Y = β0 1X 1D12D2 3D3

+

4D1X 5D2X 6D3X .

(7.4)

 

138

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]