Добавил:

Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.

Вуз:

Тюменская государственная академия мировой экономики, управления и права

Предмет:

[НЕСОРТИРОВАННОЕ]

Файл:

Бардасов - Эконометрика.pdf

Скачиваний:

358

Добавлен:

06.03.2016

Размер:

2.47 Mб

Скачать

☆

<<< < Предыдущая 18 19 20 21 22 23 24 25 26 27 28 2930 / 5330 31 32 33 34 35 36 37 38 39 40 41 42 > Следующая >>>

4) наличие мультиколлинеарности в модели множественной регрессии может сделать ее непригодной для дальнейшего применения (например, для построения прогнозов).

Вопросы для самопроверки

1.Что такое мультиколлинеарность?

2.Какие показатели свидетельствуют о наличии мультиколлинеарности?

3. Чему равен определитель матрицы X T X в случае совершенной мультиколлинеарности?

4.Что можно сказать о смысле коэффициентов при объясняющих переменных в случае мультиколлинеарности?

5.Какое преобразование производят в гребневом методе, к чему оно приводит?

6.Каков порядок действий в методе последовательного увеличения числа объясняющих переменных?

7.Что показывает коэффициент корреляции?

8.Что показывает частный коэффициент корреляции?

ГЛАВА 7. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ В РЕГРЕССИОННЫХ МОДЕЛЯХ

Цель: научиться использовать в моделях качественные объясняющие переменные.

Методические указания

Необходимо понять и запомнить правило, по которому определяют необходимое число бинарных переменных, используемых для описания качественных признаков. Следует обратить внимание, как повлияет на модель аддитивная и мультипликативная модель использования бинарной переменной.

§1. Модель с одной фиктивной (бинарной) переменной

Врегрессионных моделях в качестве объясняющих переменных часто приходится использовать не только количественные (определяемые численно), но и качественные переменные. Например, спрос на некоторое благо может определяться ценой данного блага,

132

ценой на заменители данного блага, ценой дополняющих благ, доходом потребителей и т. д. (эти показатели определяются количественно). Но спрос может также зависеть от вкусов потребителей, их ожиданий, национальных и религиозных особенностей и т. д. А эти показатели представить в численном виде нельзя. Возникает проблема отражения в модели влияния таких переменных на исследуемую величину. Обычно в моделях влияние качественного фактора выражается в виде фиктивной (искусственной) переменной, которая отражает два противоположных состояния качественного фактора. Например, «фактор действует» — «фактор не действует», «курс валюты фиксированный» — «курс валюты плавающий», «сезон летний» — «сезон зимний» и т. д. В этом случае фиктивная переменная может выражаться в двоичной форме:

0, фактор не действует,

D =

1, фактор действует.

Например, D = 0, если потребитель не имеет высшего образования, D = 1, если потребитель имеет высшее образование; D = 0, если в обществе имеются инфляционные ожидания, D = 1, если инфляционных ожиданий нет.

Переменная D называется фиктивной (искусственной, двоичной) переменной (индикатором).

Таким образом, кроме моделей, содержащих только количественные объясняющие переменные (обозначаемые Xi), в регрессионном анализе рассматриваются также модели, содержащие лишь качественныепеременные(обозначаемыеDi), либотеидругиеодновременно.

Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются ANOVA-моделями (моделями дисперсионного анализа). Например, пусть Y — начальная заработная плата.

0, если претендент не имеет высшего образования,

D =

1, если претендент имеет высшее образование.

Тогда зависимость можно выразить моделью парной регрессии:

Y = β0 +γD +ε.

(7.1)

133

При этом коэффициент β0 определяет среднюю начальную заработную плату при отсутствии высшего образования. Коэффициент

γуказывает, на какую величину отличаются средние начальные заработные платы при наличии и при отсутствии высшего образования

упретендента. Проверяя статистическую значимость коэффициента

γс помощью t-статистики либо значимость коэффициента детерми-

нации R2 с помощью F-статистики, можно определить, влияет или нет наличие высшего образования на начальную заработную плату.

Нетрудно заметить, что ANOVA-модели представляют собой кусочно-постоянные функции. Однако такие модели в экономике крайне редки. Гораздо чаще встречаются модели, содержащие как качественные, так и количественные переменные.

Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называются ANCOVA-

моделями (моделями ковариационного анализа).

Вначале рассмотрим простейшую ANCOVA-модель с одной количественной и одной качественной переменной, имеющей два альтернативных состояния:

Y = β0 +β1X +γD+ε.

(7.2)

Пусть, например, Y — заработная плата сотрудника фирмы, X — стаж сотрудника, D — а пол сотрудника, т. е.

0, если сотрудник женщина,

D =

1, если сотрудник мужчина.

Тогда ожидаемое значение заработной платы сотрудников при x годах трудового стажа будет:

M(Y x,D =0 )= β0 +β1x для женщины,

M(Y x,D =0 )= β0 +β1x+γ=(β0 +γ)+β1x — для мужчины.

Заработная плата в данном случае является линейной функцией от стажа работы. Причем и для мужчин, и для женщин заработная плата меняется с одним и тем же коэффициентом пропорциональности β1 . А вот свободные члены отличаются на величину γ. Про-

верив с помощью t-статистики статистические значимости коэф-

134

фициентов β0 и (β0 +γ) можно определить, имеет ли место в

фирме дискриминация по половому признаку. Если эти коэффициенты окажутся статистически значимыми, то, очевидно, дискриминация есть. Более того, при γ>0 она будет в пользу мужчин, при

γ<0 — в пользу женщин.

В данном случае пол сотрудников имеет два альтернативных значения, и в модели это отражается одной фиктивной переменной.

Можно получить следующее общее правило:

Если качественная переменная имеет k альтернативных значений, то при моделировании используются только (k −1) фик-

тивных переменных.

Если не следовать данному правилу, то при моделировании исследователь попадает в ситуацию совершенной мультиколлинеар-

ности или так называемую ловушку фиктивной переменной.

Значения фиктивной переменной можно изменять на противоположные. Суть модели от этого не изменится. Например, в модели можно положить, что:

1, если сотрудник женщина,

D =

0, если сотрудник мужчина.

Однако при этом знак коэффициента γ изменится на противоположный.

Значение качественной переменной, для которого принимается D = 0, называется базовым, или сравнительным. Выбор базового значения обычно диктуется целями исследования, но может быть и произвольным.

Иногда фиктивные переменные используют для объяснения поведения зависимой переменной. Например, если исследовать зависимость наличия автомобиля от дохода, пола субъекта и т. п., то зависимая переменная имеет как бы два возможных значения: 0, если машины нет, и 1, если машина есть. Для таких моделей нельзя применять обычный метод наименьших квадратов и используют другие методы.

Заметим, что фиктивные переменные могут применяться и для количественных переменных. Если в случае парной линейной рег-

135

рессии объясняющую перемену разбить на группы по возрастанию значений, то для описания m групп можно применить (m−1) би-

нарную переменную. В результате получим аналог применяемой в теории статистики аналитической группировки. Но на вопросы сайта www.fepo.ru следует отвечать, что фиктивные переменные применяются только к качественным признакам.

Пример 7.1. Имеются следующие данные (X — стаж работы (лет), Y — зарплата (ден. ед.), D — пол работника (1 — женщины, 0 — мужчины) (табл. 7.1).

Таблица 7.1

Данные для исследования зарплаты в зависимости от пола работника

Y	X	D
10000	16	0
7178	2	1
7720	2	1
7808	3	1
8488	25	0
8375	15	0
8828	16	1
5743	0	1
9143	33	0
8967	29	1
8149	3	1
8010	16	0
6776	0	1
9383	19	0
7670	1	1
7897	2	1
9622	32	0
9622	21	1
7292	0	1
8551	34	0

В случае двух объясняющих переменных X и D имеем:

136

∑xi

∑Di

269

i=1

269

6561

X =

∑xi

∑xi Di =

79 ;

i=1

∑xi Di

∑Di

i=1

∑yi

165222

i=1

X Y

∑xi yi = 2409103 .

i=1

93650

∑Di yi

i=1

Произведя вычисления, получим эмпирическое уравнение регрессии:

ˆy =7505,4+60,68x−100,7D .

Следовательно, с увеличением стажа работы на 1 год зарплата увеличивается на 60,68 ден. ед., зарплата женщин в среднем меньше, чем у мужчин на 100,7 ден. ед.

§2. Использование фиктивных переменных

всезонном анализе

Многие экономические показатели напрямую связаны с сезонными колебаниями. Например, спрос на туристические путевки, охлажденную воду и мороженое существенно выше летом, чем зимой. Спрос на обогреватели, шубы выше зимой. Некоторые показатели имеют существенные квартальные колебания и т. д.

Обычно сезонные колебания характерны для временных рядов. Устранение или нейтрализация сезонного фактора в таких моделях позволяет сконцентрироваться на других важных количественных и качественных характеристиках модели, в частности на общем направлении развития модели, так называемом тренде. Такое уст-

137

ранение сезонного фактора называется сезонной корректировкой. Существует несколько методов сезонной корректировки, одним из которых является метод фиктивных переменных.

Пусть переменная Y определяется количественной переменной X, причем эта зависимость существенно разнится по кварталам. Тогда общую модель можно представить в виде:

		Y = β0 +β1X +γ1D1+γ2D2 +γ3D3 +ε,	(7.3)
где D1	1, для второго квартала
где D1	=	в остальных случаях
	0,	в остальных случаях
D2	1, для третьего квартала
D2	=
	0, в остальных случаях
D3	1,	для четвертого квартала
D3	=
	0, в остальных случаях

Заметим, что число кварталов равно четырем, следовательно, число фиктивных переменных должно быть равно трем. В нашем примере в качестве базы выбран 1 квартал. Если значения Y существенно различаются по кварталам (сезонам), то в уравнении (7.3) коэффициенты при фиктивных переменных по кварталам определяется следующими соотношениями:

M (Y D1 =0,D2 =0,D3 =0)= β0 +β1X — для I квартала,

M (Y D1 =1,D2 =0,D3 =0)=(β0 +γ1)+β1X — для II квартала, M (Y D1 =0,D2 =1,D3 =0)=(β0 +γ2)+β1X — для III квартала,

M (Y D1 =0,D2 =0,D3 =1)=(β0 +γ3)+β1X — для IV квартала. Легко видеть, что в модели (7.3) рассматриваются такие ситуации, при которых квартальные различия отражаются лишь в различии свободных членов моделей. Если же различия затрагивают и изменения коэффициента пропорциональности, то этот факт может

быть отражен в следующей модели:

Y = β0 +β1X +γ1D1+γ2D2 +γ3D3	+
+γ4D1X +γ5D2X +γ6D3X +ε.	(7.4)
+γ4D1X +γ5D2X +γ6D3X +ε.

138

<<< < Предыдущая 18 19 20 21 22 23 24 25 26 27 28 2930 / 5330 31 32 33 34 35 36 37 38 39 40 41 42 > Следующая >>>

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]

#
21.11.2019420.35 Кб27Voprosy i otveti_po_Munitsipalke.doc
#
22.11.2019135.17 Кб4Voprosy_po_Speranskomu.doc
#
06.03.2016750.08 Кб11Zakonodatelstvo TO.doc
#
06.03.2016557.06 Кб37Zemelnoe pravo.doc
#
05.09.201921.36 Кб2Александр 3.docx
#
06.03.20162.47 Mб358Бардасов - Эконометрика.pdf
#
06.03.20163.05 Mб10Бембель. БЖД. РУП.doc
#
06.03.20161.13 Mб15БЖД.docx
#
06.03.2016331.55 Кб9билеты 2015.docx
#
18.11.2018479.23 Кб19введение в ЭТ (лекции)_часть2.doc
#
06.03.2016233.47 Кб47Внутренняя среда.doc