Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика (лабораторные)

.pdf
Скачиваний:
177
Добавлен:
01.03.2016
Размер:
1.96 Mб
Скачать

если

2

tb j

3 , то коэффициент j считается сильно статистически

значимым. Вероятность ошибки в данном случае при достаточном числе наблюдений не превосходит 0,001.

Выбор большего или меньшего значения определяется степенью

значимости для исследователя исходной гипотезы H 0 .

 

 

Интервальная оценка неизвестного коэффициента j

имеет вид:

 

bj têð S(bj ),bj têð S(bj )

 

(8.5)

Такой интервал называется доверительным интервалом для j c

уровнем доверия (доверительной вероятностью) 1– , или

(1– )-

доверительным интервалом, или 100(1– )-процентным

доверительным

интервалом.

 

 

Важно отметить, что проверку значимости отдельных коэффициентов регрессии изложенными методами можно проводить лишь в том случае, когда оценки коэффициентов регрессии между собой некоррелированы,

т.е. K(bi bj) = 0, i j.

Замечание. Выбор конкретного значения определяет компромисс между желанием получить более короткий доверительный интервал и желанием обеспечить более высокий уровень доверия. Попытка повысить

уровень доверия 1

приводит к большому значению têð t

. Но

 

2

;n p 1

 

 

длина доверительного интервала пропорциональна têð , следовательно,

увеличение уровня доверия (уменьшение уровня значимости) сопровождается увеличением ширины доверительного интервала при тех же статистических данных.

Проверка общего качества уравнения регрессии эквивалентна проверке гипотезы об одновременном равенстве нулю всех коэффициентов регрессии при объясняющих переменных:

H0 : 1

2 ... p

0 .

(8.6)

Если данная гипотеза

принимается,

то это означает, что

все

коэффициенты генерального уравнения множественной регрессии равны нулю, т.е. между зависимой переменной и независимыми переменными не существует реальной связи, а общее качество уравнения регрессии будет невысоким (регрессионное уравнение будет статически незначимым). Альтернативная гипотеза H1 о статической значимости предполагает, что

хотя бы один из истинных параметров регрессии отличен от нуля.

81

Fнабл

Проверка данной гипотезы осуществляется на основе дисперсионного анализа сравнения объясненной и остаточной дисперсий:

H 0 : (объясненная дисперсия)=(остаточная дисперсия),

H1 : (объясненная дисперсия)>(остаточная дисперсия).

Нулевая гипотеза проверяется с помощью F–критерия:

 

 

F

объясненна я

дисперсия

 

yˆi

y 2 / p

 

,

(8.7)

остаточная

дисперсия

yi yˆi

2 / n p 1

 

 

 

 

где p – количество переменных, n – количество наблюдений.

Числитель в F –отношении (8.7) представляет собой объясненную вариацию Y , деленную на число степеней свободы p , т.е. дисперсию,

объясненную независимыми переменными ( Qôàê

/ p ).

 

Знаменатель F –отношения

(8.7) характеризует

необъясненную

вариацию, деленную на число

степеней

свободы

n p 1, т.е.

необъясненную дисперсию ( Qост / n p 1).

При выполнении предпосылок МНК построенная F –статистика имеет распределение Фишера с числами степеней свободы 1 p и 2 n p 1.

Если при требуемом уровне значимости Fнабл F ; p;n p 1 , то гипотеза H 0 отклоняется в пользу H1 . Это означает, что объясненная дисперсия

существенно больше остаточной, а следовательно, уравнение регрессии достаточно качественно отражает динамику изменения зависимой переменной Y . Из этого следует, что уравнение регрессии является значимым, т.е. хотя бы один из коэффициентов регрессии отличен от нуля. Если же F ; p;n p 1 , то гипотеза H 0 принимается. Это дает основание

считать, что совокупное влияние объясняющих переменных модели несущественно, а следовательно, общее качество уравнения множественной регрессии невысоко.

Как и в случае парной регрессии, важнейшей характеристикой качества всего уравнения в целом является коэффициент множественной детерминации R2 , измеряющий долю полной вариации переменной Y , объясняемую множественной регрессией:

 

2

 

yˆi y 2 yi yˆi 2

1

yˆi

yˆi

2

1

ei2

R

 

 

 

 

 

 

. (8.8)

 

yi y 2

yi

y

2

yi y 2

Для множественной регрессии коэффициент детерминации является неубывающей функцией числа объясняющих переменных и характеризует

82

долю объясненной вариации результативного признака за счет рассматриваемых в регрессии p факторов. Влияние других, не учтенных

в модели факторов, оценивается как 1 R 2 с соответствующей остаточной дисперсией Se2 .

При дополнительном включении в уравнение регрессии ( p 1) -го фактора коэффициент детерминации должен возрастать, а остаточная

дисперсия уменьшаться:

R 2

R 2

и S 2

S 2 .

 

p 1

p

p 1

p

Иногда при расчете коэффициента детерминации для получения несмещенных оценок в числителе и знаменателе дроби, вычитаемой из единицы, делается поправка на число степеней свободы. Вводится так

называемый

скорректированный

(исправленный)

коэффициент

детерминации:

 

 

 

 

 

 

 

 

 

 

 

 

1 (1 R2 )

n 1

R2

 

p

 

R2 ).

 

R 2

(1

(8.9)

 

 

 

 

n p 1

n p 1

 

 

 

 

 

 

 

 

 

Обычно приводятся значения R2 , так и R 2 , являющиеся суммарными мерами общего качества уравнения регрессии. Так как существует достаточно примеров неправильно специфицированных моделей, имеющих высокие коэффициенты детерминации, то поэтому они выступают как один из ряда показателей, который нужно проанализировать, чтобы уточнить строящуюся модель.

Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F –критерия Фишера. Выдвигается гипотеза о статистической значимости коэффициента детерминации:

H0 : Rr2 0,

 

 

 

 

 

 

H : R2 0 .

 

 

 

 

 

 

 

 

 

 

 

1

 

r

 

 

 

 

 

 

 

 

Для проверки данной гипотезы используется

F –статистика:

 

 

 

 

 

 

 

 

F

 

R 2

 

n p 1

.

 

 

 

 

 

 

 

 

 

 

1 R2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

 

 

 

Величина

F

при

 

выполнении предпосылок МНК

и

при

справедливости

H 0

имеет распределение Фишера с числами степеней

свободы 1 p

и 2

n p 1. Если при требуемом уровне значимости

F

F

F

 

, то H

0

отклоняется в пользу

H

. Это значит,

что

R2

набл

кр

; p;n p 1

 

 

 

 

 

 

 

 

1

 

 

 

значимо и уравнение регрессии достаточно качественно отражает динамику изменения зависимой переменной Y . R2 оценивает значимость

83

не только уравнения в целом, но и фактора X j , дополнительно

включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации зависимой переменной Y . Кроме того, при наличии в модели нескольких факторов они могут быть введены в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для его оценки включения фактора, например X j , в модель может

служить частный F –критерий, т.е. Fx j . Он построен на сравнении

прироста факторной дисперсии, обусловленного влиянием дополнительного включенного фактора X j , с остаточной дисперсией на

одну степень свободы по регрессионной модели в целом:

 

 

 

 

 

F

Ryx2

...x

...x

Ryx2

 

...x

j 1

x

j 1

...x

 

 

n p 1

,

 

 

 

 

 

 

 

 

 

1

 

j

 

p

 

 

 

1

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x j

 

 

1 Ryx2

 

...x ...x

p

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где Ryx2

...x

...x

 

– коэффициент множественной детерминации для модели с

1

j

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

полным

набором

факторов;

 

Ryx2

...x

 

 

x

 

 

...x

 

 

 

 

тот же показатель,

но

 

без

 

 

 

 

 

 

 

 

 

 

1

 

j 1

 

j 1

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

включения в модель фактора

X j ;

 

 

n

 

число наблюдений;

p

– число

включенных в линейной модели факторов.

 

 

 

 

 

 

 

 

 

 

Фактическое

значение

 

частного

 

 

 

F –критерия сравнивается

с

табличным при уровне значимости и числам степеней свободы 1

1 и

2 n p 1.

Если фактическое

 

значение

 

Fx j

превышает

F ; 1 ; 2

,

то

дополнительное включение в модель фактора X j

в модель оправдано и

коэффициент частной регрессии bj

при факторе X j

статистически значим.

Если же Fx j F ; 1 ; 2

, то дополнительное включение в модель фактора Xj не

увеличивает существенно долю объясненной вариации признака Y , следовательно, нецелесообразно его включение в модель; коэффициент регрессии при данном факторе в этом случае статистически незначим.

С помощью частного F –критерия можно проверить значимость всех

коэффициентов

регрессии

в

предположении,

что

каждый

соответствующий

фактор Xj

вводится в

уравнение

множественной

регрессии последним. Зная

величину

Fx

в случае

линейной

 

 

 

 

 

j

 

 

84

множественной регрессии,

можно определить и t –критерий для

 

 

 

 

коэффициентов регрессии при

j -м факторе tb j , а именно: tbj Fx j .

Наряду с R 2 во множественном корреляционно-регрессионном анализе рассматривается показатель, равный корню квадратному из R 2 :

 

 

 

 

 

 

 

 

 

R

 

 

 

( yˆi

y)2

 

 

R

2

.

 

( yi

y)2

 

 

 

 

 

 

 

Величина R ryyˆ называется коэффициентом множественной

корреляции и отражает тесноту связи между зависимой и одновременно несколькими независимыми переменными. Он всегда неотрицателен и из– меняется от 0 до 1.

Таким образом, показателями качества уравнения регрессии выступают множественная стандартная ошибка Se , коэффициенты

множественной детерминации R 2 и R 2 .

Для проверки статистической значимости вычисленного уравнения множественной регрессии используется два типа проверок. Первый тип связан с проверкой существенности каждого коэффициента множественной регрессии j :

 

 

 

 

 

H0 : j

0;

 

 

 

 

 

H1 : j

0.

 

Проверка нулевой гипотезы осуществляется с помощью t –критерия

tb j

 

bj

 

, где

S(bj ) – стандартная ошибка bj .

 

 

S (bj

)

 

 

 

 

 

Второй тип тестирования характеризует совместную способность p

независимых переменных объяснять зависимую переменную. В этом случае проверяется нулевая гипотеза

 

H0 : 1 2 ... p

0 ,

 

 

 

осуществляемая с помощью

F –критерия

 

 

 

 

 

F

 

( yˆi y)2

/ p

 

 

 

 

 

( yi y)2 /(n p 1)

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

F

 

 

R2 / p

 

 

 

R2

 

n p 1

.

(1 R2 ) /(n p

 

 

 

 

 

 

1) 1 R2

 

p

85

Уравнение множественной линейной регрессии можно использовать в качестве модели прогнозирования. Как и в случае парной линейной регрессии, различают точечный и интервальный прогнозы.

Пусть объясняющие переменные X0, X1,. . . ., Xp приняли значения, задаваемые вектором X 0 (1, x10 , , x0p )T . Точечный прогноз по уравнению

регрессии осуществляется путем подстановки вектора Х0 в оценку детерминированной составляющей (условного математического ожидания) Мх(Y):

p

 

p

x j

x X 0 T b.

yˆx0 b0 b1 x10 bp x0p b0 bj

x0j

y bj

j 1

 

j 1

 

 

В силу того, что bj ( j 0, p) – несмещенные оценки неизвестных параметров j , то прогноз является несмещенным.

Доверительная оценка для индивидуального значения y0 зависимой

переменной Y M

X

(Y ) при

Х0

 

с надежностью 1 определяется

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

как

 

 

 

 

 

( X 0 )T b t

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

0

êð

S

e

 

 

 

( X 0 )T ( X T X ) 1 X 0 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

têð Se 1

1

 

 

 

 

,

 

 

 

 

( yˆ x

 

(x j x j ) c jk (xk xk )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

p

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

j ,k 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где S

f

 

S 2

S 2

 

S

e

1 (X 0 )T

(X T X ) 1 X 0

– стандартная

ошибка

 

 

e

 

 

yˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

прогноза.

Очевидно, точность интервальной оценки будет зависеть от значения стандартной ошибки регрессии Se , которая в свою очередь уменьшается с

ростом числа степеней свободы n p 1. С увеличением числа факторных переменных p должно увеличиваться количество наблюдений n . В практических расчетах считается, что n должно в три–четыре раза превышать p .

Задача 8.1. По данным бюджетного обследования одиннадцати случайно выбранных семей изучалась зависимость накопления Y от дохода X1 и имущества X2. Получены данные:

Y

2

7

5

4

2

7

6

5

4

2

7

X1

40

55

45

30

30

60

50

45

30

60

50

X 2

60

40

40

15

90

30

30

15

60

90

100

Требуется:

86

а) получить уравнение множественной линейной регрессии; б) найти стандартные ошибки регрессии и коэффициентов регрессии; в) осуществить прогнозирование.

Решение.

а) Загрузим Excel, сохраним файл под названием «лаб8.хls», заполним лист, как показано на рисунке:

Для оценки параметров модели необходимо:

 

1)

Найти матрицу X T . Поскольку матрица X

имеет размерность

11 3 ,

то транспонированная матрица будет размерности 3 11 . В ячейке

А17 введите

обозначение

X T . Щелкните по

ячейке В16, затем

выполните

команды

меню

ФОРМУЛЫ fxВставить

функцию Ссылки и Массивы ТРАНСП, в появившемся поле для ввода массива укажите диапазон G3:I13, нажмите ОК. Для вывода всего массива выделите диапазон из 3 строк и 11 столбцов В16:L18, нажмите

F2, затем одновременно Ctrl + Shift + Enter .

2) Найти матрицу X T X . В ячейке А21 введите обозначение X T Õ . Находясь в ячейке B20, выполните действия ФОРМУЛЫ fx

Вставить функцию Математические МУМНОЖ ОК, заполнив

Аргументы функции, как показано ниже

87

Нажмите после этого ОК.

Способом, описанным ранее, выведите весь массив в диапазон

B20:D22.

3) Найти

матрицу

1

.

Для этого в

ячейке F21 введите

X T X

комментарий

X T X 1

. Находясь в ячейке G20,

выполните действия:

ФОРМУЛЫ

fx

 

Вставить

функцию

Математические МОБР ОК, заполнив Аргументы функции, как показано ниже

Нажмите ОК.

Выведите весь массив в диапазон G20:I22.

4) Найти матрицу

 

1

X T . Для этого в ячейке A25 введите

X T X

 

1

X T =.

Находясь в ячейке

B24, выполните

комментарий X T X

 

действия:

 

ФОРМУЛЫ fx

Вставить

функцию Математические МУМНОЖ ОК, заполнив Аргументы функции, как показано ниже

Нажмите ОК.

Выведите весь массив в диапазон В24:L26.

5)

Найти

матрицу

1

X T Y .

Для

этого

в

ячейке

A29

b X T X

 

введите

комментарий

1

X T Y =.

Находясь

в ячейке

С28,

b X T X

выполните

действия: ФОРМУЛЫ fx

Вставить

функцию

Математические МУМНОЖ ОК, заполнив Аргументы функции,

как показано ниже

Нажмите ОК.

88

Выведите весь массив в диапазон С28:С30.

Найденные оценки параметров регрессии имеют вид: b0 2,013437 , b1 0,086004 , b2 0,02407 . Для вывода уравнения регрессии создайте шаблон:

В ячейки Е29, F29, Н29 ввести соответственно формулы «=С28», «=С29», «=С30». Тогда уравнение множественной линейной регрессии имеет вид: yˆ 2,013437 0,086004x1 0,02407x2 .

б) Для нахождения стандартных ошибок регрессии и коэффициентов регрессии в ячейках А33, Е33, G33, I33, K33 введем соответственно

формулы-комментарии Se

2

1

 

ei2 ,

Se ,

S(b0 ) ,

S(b1 ) ,

n k 1

 

 

 

 

 

 

S(b2 ) . Для расчета ei2 (yi yˆi )2 в ячейке D2

введем обозначение

( yi yˆi )2 , в ячейке D3 – формулу «=(A3–(C$28+C$29*B3+C$30*C3))^2»,

продолжим ее на диапазон D3:D13. В ячейке D14 найдем сумму элементов столбца, для чего введем формулу «=СУММ(D3:D13)».Получим

ei2 25,84435 .

Далее введите формулы согласно таблице:

 

 

Ячейка

Формула

 

 

С33

=D14/(11-2-1)

 

 

F33

=КОРЕНЬ(C33)

 

 

H33

=F33*КОРЕНЬ(G20)

 

 

J33

=F33*КОРЕНЬ(H21)

 

 

L33

=F33*КОРЕНЬ(I22)

 

Имеем: стандартная ошибка регрессии Se 1,797372 , стандартные

ошибки коэффициентов регрессии S(b0 ) 2,483274 ,

S(b1 ) 0,049862 ,

S(b2 ) 0,018629 .

Внимание! Получить те же самые результаты параметров множественной регрессии линейного вида гораздо проще, воспользовавшись функцией ЛИНЕЙН. Для этого, находясь в ячейке А37,

выполните действия: ФОРМУЛЫ fx Вставить функцию

ЛИНЕЙН ОК, заполнив окно, как показано ниже:

89

Нажмите ОК.

Далее, как и в случае парной регрессии, выведите весь массив в диапазон из 5 строк и 3 столбцов: А37:С41. Как видно, применение функции ЛИНЕЙН в случае множественной регрессии совершенно аналогично применению в случае парной регрессии. Отличие состоит в том, что в качестве известных значений Х выступает не один, а несколько рядов переменных, которые вводятся в виде единой матрицы. Значения константы и статистики имеют тот же смысл, что и в случае с парной регрессией. В выводимой функцией ЛИНЕЙН таблице результатов представлены следующие параметры:

b2

b1

b0

S(b2 )

S(b1 )

S(b0 )

R 2

S(Y )

 

Fрасч

 

 

Qфакт

Qост

 

в) Поскольку одна из основных целей построения эконометрических моделей – прогнозирование, воспользуемся полученными результатами для составления прогноза.

Пусть требуется найти:

1)прогнозируемое накопление семьи, имеющей доход 50 усл. ед. и имущество в 30 усл. ед.;

2)прогнозируемое изменение накопления в случае, если доход семьи возрастет на 10 усл. ед., а стоимость имущества не изменится;

3)прогнозируемое изменение накопления в случае, если доход семьи возрастет на 10 усл. ед., а стоимость имущества увеличится на 20 усл. ед.

Заполните фрагмент листа, как показано ниже:

90