Ведение в социально - экономическую статистику. Учебник. Новосибирск, 2004. 739 с
.pdf284 |
Глава 8. Нарушение гипотез основной линейной модели |
3.Рассматривается регрессионная модель X = Zα + ε. Пусть α = AX — это любая несмещенная оценка параметра α. Полагая, что E (εε ) = σ2Ω, покажите, что матрица ковариации α превышает матрицу ковариации αомнк = (Z Ω−1Z)−1Z Ω−1X на какую-то положительно полуопределенную матрицу.
4. Докажите, что σ2 |
= |
(x − zα) Ω−1 (x − zα) |
есть оценка σ2 . |
омнк |
|
N − n − 1 |
|
|
|
5.Какое преобразование матрицы наблюдений перед оценкой регрессии полезно сделать, если среднеквадратические отклонения ошибок регрессии пропорциональны какому-либо фактору?
6.Оценивается регрессия по 10 наблюдениям. Известно, что дисперсия ошибок для первых 5 наблюдений в два раза больше, чем дисперсия ошибок остальных 5 наблюдений. Опишите процедуру оценивания этой регрессии.
7.Рассмотрите регрессию xt = α1t + β + εt , t = 1, . . . , 5, где
E(εt) = 0, E(ε2t ) = σ2t2, E(εtεs) = 0, при t = s. Пусть ε = (ε1, ε2, ε3, ε4 , ε5) и E(εε ) = σ2Ω.
–определите Ω;
–найдите Ω−1 ;
– найдите матрицу ковариации МНК-оценки параметра α = |
α1 ; |
|
β |
– найдите матрицу ковариации ОМНК-оценки параметра α = |
α1 . |
|
β |
8.Рассмотрите регрессию xt = α1t + εt , t = 1, . . . , 5,
где E(εt) = 0, E(ε2t ) = σ2t2 , E(εtεs) = 0, t = s. Если x = (6, 4, 9, 8, 7) :
–определите оценку МНК для α1 и ее дисперсию;
–определите оценку ОМНК для α1 и ее дисперсию;
–сравните эти оценки друг с другом и сделайте вывод.
9.Рассматривается модель X = Zα + ε, где εi — нормально и независимо распределенная случайная величина с E (εi) = 0 и E ε2i = σi2 = eyiγ .
286 |
Глава 8. Нарушение гипотез основной линейной модели |
|||||||||
|
|
|
|
|
1 |
r |
r2 |
· · · |
rN −1 |
|
|
Ω = |
|
1 |
|
r |
1 |
r |
· · · |
rN −2 |
|
|
|
|
r2 |
r |
1 |
· · · |
rN −3 . |
|||
|
|
|
|
|||||||
|
|
− r |
2 |
|||||||
|
1 |
|
. |
. |
. |
. |
||||
|
|
|
|
|
. |
. |
. |
.. |
. |
. |
|
|
|
|
|
. |
. |
. |
|
. |
|
|
|
|
|
|
rN −1 |
rN −2 |
rN −3 · · · |
1 |
14.Найдите D0D0 , где D0 — это матрица размерности (N −1)×N , полученная из матрицы D путем удаления первой строки, и сравните ее с матрицей Ω−1.
15.Какое преобразование матрицы наблюдений перед оценкой регрессии полезно сделать, если ошибки в каждом наблюдении имеют одинаковую дисперсию и коррелированы с ошибками в предыдущем наблюдении?
16.Почему при использовании критерия Дарбина—Уотсона требуется знать два критических значения для расчетной статистики?
17.Фактическое значение dc статистики Дарбина—Уотсона равно 0.5. Что это означает? Какое преобразование следует применить к этой модели (запишите формулу)?
18.В регрессионной модели X = Zα + ε существует автокорреляции ошибок первого порядка и ρ = 0.6. Предположим, что
|
4 |
|
2 |
1 |
|
|
8 |
|
5 |
1 |
|
X = |
6 |
, Z = |
2 |
1 |
, |
|
|
|
|||
|
2 |
|
1 |
1 |
|
|
9 |
|
10 |
1 |
|
–найдите преобразованные наблюдения Dx и Dz;
–найдите ОМНК-оценки параметра α;
– найдите фактическое значение dc статистики Дарбина—Уотсона по остаткам после применения ОМНК.
288 |
Глава 8. Нарушение гипотез основной линейной модели |
2.Демиденко Е.З. Линейная и нелинейная регрессия. — М.: «Финансы и статистика», 1981. (Гл. 1).
3.Джонстон Дж. Эконометрические методы. — М.: «Статистика», 1980. (Гл. 7, 8).
4.Доугерти К. Введение в эконометрику. — М.: «Инфра-М», 1997. (Гл. 7).
5.Дрейпер Н., Смит Г. Прикладной регрессионный анализ: В 2-х книгах. Кн.1 — М.: «Финансы и статистика», 1986. (Гл. 2, 3).
6.Кейн Э. Экономическая статистика и эконометрия. — М.: «Статистика», 1977. Вып. 2. (Гл. 15).
7.Лизер С. Эконометрические методы и задачи. — М.: «Статистика», 1971. (Гл. 2).
8.Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика — начальный курс. — М.: Дело, 2000. (Гл. 6, 7, 9).
9.Маленво Э. Статистические методы эконометрии. Вып. 1. — М.: «Статистика», 1975. (Гл. 10).
10.Тинтер Г. Введение в эконометрию. — М.: «Статистика», 1965. (Гл. 6).
11.Baltagi, Badi H. Econometrics, 2nd edition, Springer, 1999. (Ch. 5).
12.Davidson, Russel, Mackinnon, James. Estimation and Inference in Econometrics, N 9, Oxford University Press, 1993. (Ch. 16).
13.William E., Griffiths R., Carter H., George G. Judge Learning and Practicing econometrics, N 9 John Wiley & Sons, Inc., 1993. (Ch. 9, 15, 16).
14.Greene W.H. Econometric Analysis, Prentice-Hall, 2000. (Ch. 9, 12, 13).
15.Judge G.G., Hill R.C., Griffiths W.E., Luthepohl H., Lee T. Introduction to the Theory and Practice of Econometric. John Wiley & Sons, Inc., 1993. (Ch 8, 9).
16.Maddala G.S. Introduction to Econometrics, 2nd ed., Prentice Hall, 1992. (Ch. 5, 6, 7).
Глава 9
Целочисленные переменные
врегрессии
9.1.Фиктивные переменные
С помощью фиктивных или псевдопеременных, принимающих дискретные, обычно целые значения, в регрессию включают качественные факторы.
Уточнение обозначений:
Z — N × n-матрица наблюдений за «обычными» независимыми факторами;
α — n-вектор-столбец параметров регрессии при этих факторах;
Z0 = 1N ; β0=β.
В этих обозначениях уравнение регрессии записывается следующим образом:
X = Zα + Z0β0 + ε.
Пусть имеется один качественный фактор, принимающий два значения (например: «мужчина» и «женщина», если речь идет о модели некоторой характеристики отдельных людей, или «годы войны» и «годы мира» — в модели, построенной на временных рядах наблюдений, которые охватывают периоды войны и мира и т.д.). Ставится вопрос о том, влияет ли этот фактор на значение свободного члена регрессии.
290 |
Глава 9. Целочисленные переменные в регрессии |
ZG = {zijG} — N ×2-матрица наблюдений за качественным фактором (матрица фиктивных переменных): ziG1 равен единице, если фактор в i-м наблюдении принимает первое значение, и нулю в противном случае; ziG2 равен единице, если фактор в i-м наблюдении принимает второе значение, и нулю в противном случае.
β1
β =
β2
—двухкомпонентный вектор-столбец параметров при фиктивных переменных. Исходная форма регрессии с фиктивными переменными:
X = Zα + Z0β0 + ZGβ + ε.
Поскольку сумма столбцов матрицы равна Z0 , оценка параметоров непосредственно по этому уравнению невозможна.
Проводится преобразование фиктивных переменных одним из двух способов.
а) В исходной форме регрессии исключается один из столбцов матрицы фиктивных переменных, в данном случае — первый.
¯G — матрица фиктивных переменных без первого столбца;
Z
¯ |
1 |
1 |
0 |
C = |
−1 |
. |
|
|
0 |
1 |
Тогда эквивалентная исходной запись уравнения имеет вид:
0 |
¯G ¯ |
β0 |
|
+ ε, |
|||
X = Zα + Z |
, Z C |
||
|
|
β |
и после умножения матрицы ¯ справа на вектор параметров получается за-
C
пись уравнения регресии, в которой отсутствует линейная зависимость между факторами-регрессорами:
|
|
|
|
0 |
¯0 |
¯G ¯ |
|
|
|
|
X = Zα + Z |
β |
+ Z β + ε, |
¯0 |
= β |
0 |
¯ |
− β1 . |
|
|
где β |
|
+ β1, β = β2 |
|
|
После оценки этих параметров можно определить значения исходных параметров β0 и β, предполагая, что сумма параметров при фиктивных переменных
292 |
|
|
|
|
|
|
|
|
|
Глава 9. Целочисленные переменные в регрессии |
||||||||
|
|
|
β |
0 |
|
|
|
¯0 |
|
|
|
|
|
|
|
|
||
|
1k β = 0, C¯ |
|
= |
|
β |
|
, ZGC = ZG . |
|
|
|
||||||||
|
|
|
|
¯ |
|
|
|
|||||||||||
|
|
|
β |
|
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
β |
|
|
|
|
|
|
|
|
|
|||
Можно показать, что |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
1 |
|
|
−1k−1 |
β0 |
= |
β¯0 |
, или |
||||
|
|
|
|
|
|
|
0 Ik−1 − 1k−1 |
β |
|
β¯ |
|
|||||||
|
|
|
1 1 |
|
(I |
|
|
|
1 1k−1) β¯0 |
= |
β0 |
, |
||||||
|
|
|
|
|
k−1 |
|
|
k−1 − k |
|
β¯ |
|
|||||||
|
|
|
0 |
|
|
Ik−1 − k1 1k−1 |
|
β |
|
|||||||||
где |
k−1 |
|
k−1 |
— |
(k |
− |
1) |
× |
(k |
− |
1)-матрица, состоящая из единиц; и далее по- |
|||||||
1k−1 = 1 |
1 |
|
|
|
|
|
казать, что результаты оценки параметров уравнения с фиктивными переменными при использовании обоих указанных подходов к устранению линейной зависимости факторов-регрессоров одинаковы.
В дальнейшем для устранения линейной зависимости столбцов значений фиктивных переменных используется способ «б».
После оценки регрессии можно применить t-критерий для проверки значимости влияния качественного фактора на свободный член уравнения.
Если k слишком велико и приближается к N , то на параметры при фиктивных переменных накладываются более жесткие ограничения (чем равенство нулю их суммы). Так, например, если наблюдения проведены в последовательные моменты времени, и вводится качественный фактор «время», принимающий особое значение в каждый момент времени, то ZG = IN , и обычно предполагается, что значение параметра в каждый момент времени (при фиктивной переменной каждого момента времени) больше, чем в предыдущий момент времени на одну и ту же величину. Тогда роль матрицы C играет N -вектор-столбец T , состоящий из чисел натурального ряда, начиная с 1, и β = T βT , где βT — скаляр. Уравнение регрессии с фактором времени имеет вид (эквивалентная исходной форма уравнения при использовании способа «б» исключения линейной зависимости фиктивных переменных):
X = Zα + Z0β0 + T βT + ε.
Метод фиктивных переменных можно использовать для проверки влияния качественного фактора на коэффициент регрессии при любом обычном факторе. Исходная форма уравнения, в которое вводится качественный фактор для параметра α, имеет следующий вид:
X = Zα + Z0β0 + Zj ¯ ZGαj + ε,