- •ОГЛАВЛЕНИЕ
- •ПРЕДИСЛОВИЕ
- •МЕТОДИЧЕСКИЕ МАТЕРИАЛЫ
- •РАБОЧАЯ ПРОГРАММА ДИСЦИПЛИНЫ
- •РЕКОМЕНДАЦИИ ПО САМОСТОЯТЕЛЬНОЙ РАБОТЕ СТУДЕНТА
- •ТЕОРЕТИЧЕСКИЕ МАТЕРИАЛЫ
- •ГЛАВА 1. СТАТИСТИЧЕСКИЕ ПОНЯТИЯ И РАСПРЕДЕЛЕНИЯ
- •§ 1. Введение
- •§ 2. Суть регрессионного анализа
- •§ 3. Некоторые статистические определения
- •§ 4. Нормальное (гауссовское) распределение
- •§ 5. (хи-квадрат)-распределение
- •§ 6. Распределение Стьюдента (t-распределение)
- •§ 7. F-распределение (распределение дисперсионного отношения)
- •§ 8. Статистическая проверка гипотез
- •§ 9. Определение критических значений распределений Стьюдента и Фишера с использованием программы Microsoft Office Excel
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 2. ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. УСЛОВИЯ ГАУССА–МАРКОВА
- •§ 1. Основные понятия
- •§ 2. Метод наименьших квадратов
- •§ 3. Предпосылки метода наименьших квадратов
- •§ 4. Анализ точности определения оценок коэффициентов регрессии
- •§ 5. Проверка статистической значимости коэффициентов парной линейной регрессии
- •§ 6. Интервальные оценки коэффициентов линейного уравнения регрессии
- •§ 7. Доверительные интервалы для зависимой переменной
- •§ 8. Проверка общего качества уравнения регрессии. Коэффициент детерминации
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 3. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
- •§ 1. Определение параметров уравнения регрессии
- •§ 2. Расчет коэффициентов множественной линейной регрессии
- •§ 3. Дисперсии и стандартные ошибки коэффициентов
- •§ 4. Проверка статистической значимости коэффициентов уравнения регрессии
- •§ 5. Интервальные оценки коэффициентов теоретического уравнения регрессии
- •§ 6. Проверка общего качества уравнения регрессии
- •§ 7. Проверка равенства двух коэффициентов детерминации
- •§ 8. Проверка гипотезы о совпадении уравнений регрессии для двух выборок
- •§ 10. Частные уравнения регрессии
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 4. АВТОКОРРЕЛЯЦИЯ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ
- •§ 1. Суть и причины автокорреляции
- •§ 2. Последствия автокорреляции
- •§ 3. Обнаружение автокорреляции. Критерий Дарбина–Уотсона
- •§ 4. Методы устранения автокорреляции
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 5. ГЕТЕРОСКЕДАСТИЧНОСТЬ СЛУЧАЙНЫХ ВОЗМУЩЕНИЙ
- •§ 1. Общие понятия
- •§ 2. Последствия гетероскедастичности
- •§ 3. Обнаружение гетероскедастичности
- •§ 4. Методы смягчения проблемы гетероскедастичности
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 6. МУЛЬТИКОЛЛИНЕАРНОСТЬ
- •§ 1. Общие понятия и последствия мультиколлнеарности
- •§ 2. Определение мультиколлинеарности
- •§ 3. Методы устранения мультиколлинеарности
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 7. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ В РЕГРЕССИОННЫХ МОДЕЛЯХ
- •§ 1. Модель с одной фиктивной (бинарной) переменной
- •§ 3. Сравнение двух регрессий
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 8. НЕЛИНЕЙНАЯ РЕГРЕССИЯ
- •§ 1. Общие понятия
- •§ 2. Степенные модели (логарифмические)
- •§ 3. Обратная модель (гиперболическая)
- •§ 4. Полиномиальная модель
- •§ 5. Показательная модель (лог-линейная)
- •§ 6. Выбор формы модели
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 9. ВРЕМЕННЫЕ РЯДЫ
- •§ 1. Общие понятия
- •§ 2. Моделирование тренда временного ряда
- •§ 4. Стационарные ряды
- •§ 5. Процесс авторегрессии AR(p)
- •§ 6. Процессы скользящего среднего MA(q)
- •§ 7. Комбинированные процессы авторегрессии-скользящего среднего ARMA(p, q)
- •§ 8. Модели ARMA, учитывающие наличие сезонности
- •§ 9. Нестационарные временные ряды. Процессы авторегрессии и проинтегрированного скользящего среднего ARIMA(p, k, q)
- •§ 10. Регрессионные модели с распределенными лагами
- •§ 11. Полиномиально распределенные лаги Ш. Алмон
- •Резюме
- •Вопросы для самопроверки
- •ГЛАВА 10. СИСТЕМЫ ОДНОВРЕМЕННЫХ УРАВНЕНИЙ
- •§ 1. Общие понятия
- •§ 2. Идентификация структурной формы модели
- •§ 3. Косвенный метод наименьших квадратов
- •§ 4. Двухшаговый метод наименьших квадратов
- •§ 5. Трехшаговый метод наименьших квадратов
- •Резюме
- •Вопросы для самопроверки
- •ЗАКЛЮЧЕНИЕ
- •ЗАДАНИЯ ДЛЯ КОНТРОЛЯ
- •Тесты для самоконтроля
- •Ключи к тестам для самоконтроля
- •Контрольная работа
- •Вопросы к зачету (экзамену)
- •ГЛОССАРИЙ
- •СПИСОК ЛИТЕРАТУРЫ
4) наличие мультиколлинеарности в модели множественной регрессии может сделать ее непригодной для дальнейшего применения (например, для построения прогнозов).
Вопросы для самопроверки
1.Что такое мультиколлинеарность?
2.Какие показатели свидетельствуют о наличии мультиколлинеарности?
3. Чему равен определитель матрицы X T X в случае совершенной мультиколлинеарности?
4.Что можно сказать о смысле коэффициентов при объясняющих переменных в случае мультиколлинеарности?
5.Какое преобразование производят в гребневом методе, к чему оно приводит?
6.Каков порядок действий в методе последовательного увеличения числа объясняющих переменных?
7.Что показывает коэффициент корреляции?
8.Что показывает частный коэффициент корреляции?
ГЛАВА 7. ФИКТИВНЫЕ ПЕРЕМЕННЫЕ В РЕГРЕССИОННЫХ МОДЕЛЯХ
Цель: научиться использовать в моделях качественные объясняющие переменные.
Методические указания
Необходимо понять и запомнить правило, по которому определяют необходимое число бинарных переменных, используемых для описания качественных признаков. Следует обратить внимание, как повлияет на модель аддитивная и мультипликативная модель использования бинарной переменной.
§1. Модель с одной фиктивной (бинарной) переменной
Врегрессионных моделях в качестве объясняющих переменных часто приходится использовать не только количественные (определяемые численно), но и качественные переменные. Например, спрос на некоторое благо может определяться ценой данного блага,
132
ценой на заменители данного блага, ценой дополняющих благ, доходом потребителей и т. д. (эти показатели определяются количественно). Но спрос может также зависеть от вкусов потребителей, их ожиданий, национальных и религиозных особенностей и т. д. А эти показатели представить в численном виде нельзя. Возникает проблема отражения в модели влияния таких переменных на исследуемую величину. Обычно в моделях влияние качественного фактора выражается в виде фиктивной (искусственной) переменной, которая отражает два противоположных состояния качественного фактора. Например, «фактор действует» — «фактор не действует», «курс валюты фиксированный» — «курс валюты плавающий», «сезон летний» — «сезон зимний» и т. д. В этом случае фиктивная переменная может выражаться в двоичной форме:
0, фактор не действует,
D =
1, фактор действует.
Например, D = 0, если потребитель не имеет высшего образования, D = 1, если потребитель имеет высшее образование; D = 0, если в обществе имеются инфляционные ожидания, D = 1, если инфляционных ожиданий нет.
Переменная D называется фиктивной (искусственной, двоичной) переменной (индикатором).
Таким образом, кроме моделей, содержащих только количественные объясняющие переменные (обозначаемые Xi), в регрессионном анализе рассматриваются также модели, содержащие лишь качественныепеременные(обозначаемыеDi), либотеидругиеодновременно.
Регрессионные модели, содержащие лишь качественные объясняющие переменные, называются ANOVA-моделями (моделями дисперсионного анализа). Например, пусть Y — начальная заработная плата.
0, если претендент не имеет высшего образования,
D =
1, если претендент имеет высшее образование.
Тогда зависимость можно выразить моделью парной регрессии:
Y = β0 +γD +ε. |
(7.1) |
133
При этом коэффициент β0 определяет среднюю начальную заработную плату при отсутствии высшего образования. Коэффициент
γуказывает, на какую величину отличаются средние начальные заработные платы при наличии и при отсутствии высшего образования
упретендента. Проверяя статистическую значимость коэффициента
γс помощью t-статистики либо значимость коэффициента детерми-
нации R2 с помощью F-статистики, можно определить, влияет или нет наличие высшего образования на начальную заработную плату.
Нетрудно заметить, что ANOVA-модели представляют собой кусочно-постоянные функции. Однако такие модели в экономике крайне редки. Гораздо чаще встречаются модели, содержащие как качественные, так и количественные переменные.
Модели, в которых объясняющие переменные носят как количественный, так и качественный характер, называются ANCOVA-
моделями (моделями ковариационного анализа).
Вначале рассмотрим простейшую ANCOVA-модель с одной количественной и одной качественной переменной, имеющей два альтернативных состояния:
Y = β0 +β1X +γD+ε. |
(7.2) |
Пусть, например, Y — заработная плата сотрудника фирмы, X — стаж сотрудника, D — а пол сотрудника, т. е.
0, если сотрудник женщина,
D =
1, если сотрудник мужчина.
Тогда ожидаемое значение заработной платы сотрудников при x годах трудового стажа будет:
M(Y x,D =0 )= β0 +β1x для женщины,
M(Y x,D =0 )= β0 +β1x+γ=(β0 +γ)+β1x — для мужчины.
Заработная плата в данном случае является линейной функцией от стажа работы. Причем и для мужчин, и для женщин заработная плата меняется с одним и тем же коэффициентом пропорциональности β1 . А вот свободные члены отличаются на величину γ. Про-
верив с помощью t-статистики статистические значимости коэф-
134
фициентов β0 и (β0 +γ) можно определить, имеет ли место в
фирме дискриминация по половому признаку. Если эти коэффициенты окажутся статистически значимыми, то, очевидно, дискриминация есть. Более того, при γ>0 она будет в пользу мужчин, при
γ<0 — в пользу женщин.
В данном случае пол сотрудников имеет два альтернативных значения, и в модели это отражается одной фиктивной переменной.
Можно получить следующее общее правило:
Если качественная переменная имеет k альтернативных значений, то при моделировании используются только (k −1) фик-
тивных переменных.
Если не следовать данному правилу, то при моделировании исследователь попадает в ситуацию совершенной мультиколлинеар-
ности или так называемую ловушку фиктивной переменной.
Значения фиктивной переменной можно изменять на противоположные. Суть модели от этого не изменится. Например, в модели можно положить, что:
1, если сотрудник женщина,
D =
0, если сотрудник мужчина.
Однако при этом знак коэффициента γ изменится на противоположный.
Значение качественной переменной, для которого принимается D = 0, называется базовым, или сравнительным. Выбор базового значения обычно диктуется целями исследования, но может быть и произвольным.
Иногда фиктивные переменные используют для объяснения поведения зависимой переменной. Например, если исследовать зависимость наличия автомобиля от дохода, пола субъекта и т. п., то зависимая переменная имеет как бы два возможных значения: 0, если машины нет, и 1, если машина есть. Для таких моделей нельзя применять обычный метод наименьших квадратов и используют другие методы.
Заметим, что фиктивные переменные могут применяться и для количественных переменных. Если в случае парной линейной рег-
135
рессии объясняющую перемену разбить на группы по возрастанию значений, то для описания m групп можно применить (m−1) би-
нарную переменную. В результате получим аналог применяемой в теории статистики аналитической группировки. Но на вопросы сайта www.fepo.ru следует отвечать, что фиктивные переменные применяются только к качественным признакам.
Пример 7.1. Имеются следующие данные (X — стаж работы (лет), Y — зарплата (ден. ед.), D — пол работника (1 — женщины, 0 — мужчины) (табл. 7.1).
Таблица 7.1
Данные для исследования зарплаты в зависимости от пола работника
|
Y |
X |
D |
|
|
10000 |
16 |
0 |
|
|
7178 |
2 |
1 |
|
|
7720 |
2 |
1 |
|
|
7808 |
3 |
1 |
|
|
8488 |
25 |
0 |
|
|
8375 |
15 |
0 |
|
|
8828 |
16 |
1 |
|
|
5743 |
0 |
1 |
|
|
9143 |
33 |
0 |
|
|
8967 |
29 |
1 |
|
|
8149 |
3 |
1 |
|
|
8010 |
16 |
0 |
|
|
6776 |
0 |
1 |
|
|
9383 |
19 |
0 |
|
|
7670 |
1 |
1 |
|
|
7897 |
2 |
1 |
|
|
9622 |
32 |
0 |
|
|
9622 |
21 |
1 |
|
|
7292 |
0 |
1 |
|
|
8551 |
34 |
0 |
|
|
|
|
|
|
В случае двух объясняющих переменных X и D имеем:
136
|
|
|
n |
n |
|
|
n |
|
|
|
|
|
|
|
|
|
|
∑xi |
|
∑Di |
|
|
20 |
269 |
12 |
|
|||
|
|
|
|
i=1 |
|
i=1 |
|
|
|
|
||||
X |
T |
n |
n |
2 |
|
n |
|
|
|
269 |
6561 |
|
|
|
|
X = |
∑xi |
∑xi |
|
∑xi Di = |
79 ; |
||||||||
|
|
|
i=1 |
i=1 |
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
12 |
79 |
12 |
|
||||
|
|
n |
n |
|
|
n |
2 |
|
|
|
||||
|
|
|
|
∑xi Di |
|
|
|
|
|
|
|
|||
|
|
∑Di |
∑Di |
|
|
|
|
|
|
|||||
|
|
i=1 |
i=1 |
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑yi |
|
|
165222 |
|
|
|
||
|
|
|
|
|
i=1 |
|
|
|
|
|
||||
|
|
|
|
T |
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
X Y |
= |
∑xi yi = 2409103 . |
|
|
||||||
|
|
|
|
|
|
i=1 |
|
|
|
93650 |
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑Di yi |
|
|
|
|
|
|
|||
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
Произведя вычисления, получим эмпирическое уравнение регрессии:
ˆy =7505,4+60,68x−100,7D .
Следовательно, с увеличением стажа работы на 1 год зарплата увеличивается на 60,68 ден. ед., зарплата женщин в среднем меньше, чем у мужчин на 100,7 ден. ед.
§2. Использование фиктивных переменных
всезонном анализе
Многие экономические показатели напрямую связаны с сезонными колебаниями. Например, спрос на туристические путевки, охлажденную воду и мороженое существенно выше летом, чем зимой. Спрос на обогреватели, шубы выше зимой. Некоторые показатели имеют существенные квартальные колебания и т. д.
Обычно сезонные колебания характерны для временных рядов. Устранение или нейтрализация сезонного фактора в таких моделях позволяет сконцентрироваться на других важных количественных и качественных характеристиках модели, в частности на общем направлении развития модели, так называемом тренде. Такое уст-
137
ранение сезонного фактора называется сезонной корректировкой. Существует несколько методов сезонной корректировки, одним из которых является метод фиктивных переменных.
Пусть переменная Y определяется количественной переменной X, причем эта зависимость существенно разнится по кварталам. Тогда общую модель можно представить в виде:
|
|
Y = β0 +β1X +γ1D1+γ2D2 +γ3D3 +ε, |
(7.3) |
где D1 |
1, для второго квартала |
|
|
= |
в остальных случаях |
|
|
|
0, |
|
|
D2 |
1, для третьего квартала |
|
|
= |
|
|
|
|
0, в остальных случаях |
|
|
D3 |
1, |
для четвертого квартала |
|
= |
|
|
|
|
0, в остальных случаях |
|
Заметим, что число кварталов равно четырем, следовательно, число фиктивных переменных должно быть равно трем. В нашем примере в качестве базы выбран 1 квартал. Если значения Y существенно различаются по кварталам (сезонам), то в уравнении (7.3) коэффициенты при фиктивных переменных по кварталам определяется следующими соотношениями:
M (Y D1 =0,D2 =0,D3 =0)= β0 +β1X — для I квартала,
M (Y D1 =1,D2 =0,D3 =0)=(β0 +γ1)+β1X — для II квартала, M (Y D1 =0,D2 =1,D3 =0)=(β0 +γ2)+β1X — для III квартала,
M (Y D1 =0,D2 =0,D3 =1)=(β0 +γ3)+β1X — для IV квартала. Легко видеть, что в модели (7.3) рассматриваются такие ситуации, при которых квартальные различия отражаются лишь в различии свободных членов моделей. Если же различия затрагивают и изменения коэффициента пропорциональности, то этот факт может
быть отражен в следующей модели:
Y = β0 +β1X +γ1D1+γ2D2 +γ3D3 |
+ |
+γ4D1X +γ5D2X +γ6D3X +ε. |
(7.4) |
|
138