Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика (лабораторные)

.pdf
Скачиваний:
177
Добавлен:
01.03.2016
Размер:
1.96 Mб
Скачать

ОТРЕЗОК. Функция НАКЛОН служит для определения углового коэффициента связи b1 , а функция ОТРЕЗОК – для определения

свободного члена уравнения b0 . Для этого на панели соответствующих функций необходимо ввести адреса диапазонов Y и X .

Найдем коэффициент детерминации

R 2 . Для этого

в ячейке В32

введем формулу-комментарий для его

вычисления:

R 2

var( yˆ)

.

var( y)

 

 

 

 

Очевидно, у нас пока нет возможности рассчитать его, поскольку нам неизвестны значения yˆ . Для этого нужно дополнить исходную таблицу

несколькими столбцами. С этой целью в нижеприведенных ячейках введите обозначения:

Ячейка

Обозначение

G2

^

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

H2

 

 

 

 

 

( y y) 2

 

 

 

 

I2

( y y) 2

 

^

 

 

 

 

 

 

 

 

J2

( y y) 2

 

^

 

 

 

 

G13

 

 

 

 

 

 

y

 

 

H13

var( y)

 

 

 

 

 

 

I13

^

 

 

 

 

var( y)

 

 

J13

var(e)

 

 

 

 

 

 

Чтобы получить в столбце G значения yˆ , нужно подставить значения

X в уравнение регрессии. Для этого в ячейке G3 введем формулу «=D29+D25*B3». Однако если вы продолжите эту формулу на ячейки G3:G10, то получите неверные значения. Возникает вопрос – почему? Дело в том, что, копируя формулы, Excel автоматически их изменяет. Например, в ячейку G4 скопировалась формула «=D30+D26*B4». Однако коэффициенты b0 ,b1 хранятся в ячейках D25 и D29, и нам не требуется,

чтобы в формуле они изменялись. В таком случае говорят об абсолютной адресации. Щелкните дважды по ячейке G3, чтобы отредактировать ее. Внесите изменения в формулу, чтобы она выглядела следующим образом: «=$D$29+$D$25*B3». Теперь можете снова скопировать формулу на диапазон G3:G10.

31

Замечание. Операция фиксирования адреса ячейки выполняется с помощью символа $. Ввод символа $ перед именем столбца предохраняет от изменений по столбцам, ввод символа $ перед номером строки – от изменений по строкам. Для ввода абсолютных (фиксированных) адресов ячеек удобнее пользоваться клавишей F4, что приводит к появлению символа $ перед именем столбца и номера строки. В ячейках введите формулы согласно таблице:

Ячейка

Формула

H3

=(C3-$C$12)^2

I3

=(G3-$C$12)^2

J3

=(C3-G3)^2

Теперь выделите все три ячейки и, пользуясь автозаполнением, продолжите формулы на диапазон H3:J10. Выделите диапазон ячеек F11:F12 и продолжите формулы на диапазон F11:J12.

Убедитесь в том, что число в ячейке H11 равно сумме чисел, находящихся в ячейках I11 и J11.

Исходные данные и расчетные показатели составят табл. 2.1:

Табл.2.1

Теперь можно рассчитать коэффициент детерминации. Для этого в ячейке D32 введите формулу «=I12/H12». Полученное значение свидетельствует о том, что около 97,43% вариации Y объясняется регрессией Y на(по) X.

32

Внимание! В Excel коэффициент детерминации можно найти с помощью опции Мастер функций. Для этого щелкните по ячейке E32,

выполните команды меню ФОРМУЛЫ fx Вставить функцию Статистические КВПИРСОН ОК. В появившемся окне введите аргументы функции, как показано на рис. 2.1:

Рис. 2.1

и нажмите ОК. Убедитесь, что результаты совпадают.

Проверим при уровне значимости 0,05 гипотезу о статистической

значимости

коэффициента

 

 

детерминации R2:

H

0

: R2 0 при

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

конкурирующей

 

гипотезе

 

H

1

: R2 0 (коэффициент

 

 

детерминации

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

статистически значим).

 

 

 

 

 

 

 

 

 

 

 

 

В ячейке

 

B34

 

введем

формулу-комментарий

для

нахождения

статистики F:

F

 

 

 

R2

(n 2)

. В ячейке D35 введем формулу «=D32*(8–

 

 

 

 

 

 

 

 

набл

 

 

1

R2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2)/(1–D32). Поскольку H

1

: R2

0, то критическая область правосторонняя.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В ячейке Е35 введем комментарий Fкр , в ячейке F35 выведем результаты применения функции F.ОБР. В качестве аргументов функции выступают

уровень

значимости 0,05 , числа

степеней свободы

1 1 (число

коэффициентов перед неизвестной

X ) и 2 6 (объем выборки – число

коэффициентов

перед

неизвестной

1). Получим

Fкр =

5,99. Так как

F

F

, то гипотезу

H

0

: R2 0 отвергаем в пользу альтернативной H1,

набл

кр

 

 

 

 

 

 

 

 

т.е.

R2 статистически значим. Для отражения этого вывода в строке под

номером

37

введем

 

комментарий:

« Fнабл Fкр ,

то

коэффициент

детерминации статистически значим».

 

 

 

Замечание. Теперь воспользуемся встроенными возможностями Excel.

В ячейках H17:I21 выведем статистические данные, воспользовавшись функцией ЛИНЕЙН (ее описание имеется в задаче 1.1 лабораторной работы №1). Очевидно, сравнивая значения b0 (ячейка I17), b1 (ячейка

H17), R2 (ячейка H19) и Fнабл (ячейка H20) с ранее полученными

значениями, убедимся в полезности использования функции ЛИНЕЙН для эконометрического анализа.

33

Примечание: Формулы-комментарии не являются обязательными для ввода, их написание преследует дидактическую цель: студент не должен щелкать по кнопкам, не понимая,

что

находит. Мы надеемся, что таким образом фор-

мулы откладываются в памяти.

 

 

 

 

б) Пусть зависимость расходов на питание

Y

от

времени

t

описывается уравнением вида Y 0 1t , где

t

время.

Он

определяется как 1 для 1998г., 2 – для 1999г. и т.д.

Найдем выборочное

уравнение регрессии

yˆ b0 b1t , где b0 , b1 – оценки неизвестных пара–

метров 0 , 1 .

 

 

 

 

 

Внимание! Поскольку нам подходит табл. 2.1, за исключением значений переменной X, мы можем скопировать предыдущий лист в текущем файле, не создавая новый файл, и в нем вносить необходимые изменения. Для этого нужно переместить курсор на имя текущего листа

«Лист1», находящееся внизу окна слева , затем нажать одновременно CTRL + ALT +левую кнопку мыши, и, не отпуская кнопок, перемещать курсор вправо. При этом рядом с курсором появляется значок в виде листа бумаги с крестиком на нем. Тогда можно отпустить все кнопки, и рядом с надписью «Лист1» появится надпись «Лист1(2)». Данный лист является точной копией предыдущего. Его можно переименовать. Для этого нужно дважды щелкнуть по надписи «Лист1(2)», изменить имя на новое, например, «врем. ряд», затем щелкнуть левой клавишей мыши по любой ячейке листа.

Теперь можно изменить формулы. В ячейках B2, B13, D2, D13, E2, E13, B17, B22, B25, B29, Н27 измените x на t . Очистите ячейки B3:B10 и введите числа 1, 2, 3, 4, 5, 6, 7, 8. Excel автоматически пересчитает значения в ячейках, содержащие формулы.

Таким образом, уравнение регрессии имеет вид: yˆ 3,428571 3,238095t .

В среднем расходы на питание за год увеличиваются на 3,24 усл. ед.

Значение R2 0,974294

свидетельствует о том, что около 97,43%

вариации переменной Y

объясняется регрессией.

 

Проверим значимость коэффициента детерминации. Вычислим

значение статистики F: Fнабл 227,4098. При уровне значимости 0,05 и

числам степеней свободы 1 1 и 2 6 Fкр = 5,99. Так как

Fнабл Fкр , то

гипотезу H

0

: R2 0 отвергаем, т.е. R2 статистически значим.

 

 

 

 

 

34

2. Остаточная дисперсия и стандартные ошибки коэффициентов регрессии.

Для найденных выше уравнений регрессии найдем стандартную ошибку регрессии, а также стандартные ошибки коэффициентов регрессии. Осуществим проверку гипотез, относящихся к коэффициентам

регрессии. Найдем доверительный

интервал для 1 при 5%-м уровне

значимости .

 

Вернемся к зависимости Y от

X . Для этого щелкнем по надписи

«Лист1». Введем формулы-комментарии, как показано на рис.2.2:

 

 

Рис.2.2

Заполните ячейки согласно таблице:

 

Ячейка

 

Формула

 

D45

 

=КОРЕНЬ(8/(8-2)*J12)

 

D49

 

=D45*КОРЕНЬ(D12/8/D17)

 

D52

 

=D45/КОРЕНЬ(8*D17)

Сравните полученные значения с результатами, найденными с помощью функции ЛИНЕЙН: значение стандартной ошибки регрессии находится в ячейке I19 и равно 1,391585; значение стандартной ошибки

параметра b0 находится

в ячейке I18 и равно 1,021048; значение

стандартной ошибки параметра b1

хранится в ячейке H18 и равно 0,071575.

Как можно заметить, результаты совпадают.

Для закрепления материалов лабораторных работ №1 и №2 можно

проверить гипотезу о значимости коэффициента корреляции .

Выдвигаем гипотезы:

H 0

: 0,

 

: 0.

 

H1

35

Рассчитаем статистику t

 

 

 

R2

(n 2)

 

. Заполним ячейки, как

набл

1

R2

 

 

 

 

 

 

 

 

 

 

 

 

показано на рис.2.3:

Рис.2.3

В ячейке D40 ведем формулу «=КОРЕНЬ(D32*(8–2)/(1–D32))».

Критическое значение t находится

по таблице распределения

Стьюдента при уровне значимости 0,05

и числе степеней свободы

n 2 8 2 6 . Чтобы найти его посредством Excel, позиционируем курсор в ячейке F40, затем выполним команды меню ФОРМУЛЫ fx

Вставить функцию Статистические СТЬЮДЕНТ.ОБР.2Х ОК,

заполнив поля, как указано на рис.2.4:

 

 

 

 

 

.

 

 

 

 

 

Рис.2.4

 

 

 

При

этом в ячейке

F40 появится значение tкр =2,446912. Так как

 

tнабл

 

tкр ,

то гипотезу H0

о равенстве нулю коэффициента корреляции

 

 

отвергаем в пользу гипотезы H1 , т.е. коэффициент корреляции значимо отличается от нуля. Соответственно в строке под номером 42 введем комментарий « tнабл tкр , то коэффициент корреляции статистически

значим».

3. Оценка значимости коэффициентов регрессии. Доверительная оценка.

Для проверки значимости параметров регрессии рассчитаем статистики t(b0 ),t(b1 ) . Заполним ячейки, как показано на рис.2.5:

36

Рис.2.5

Введем формулы согласно таблице:

 

 

 

 

Ячейка

 

Формула

 

 

 

 

 

 

 

 

 

F49

 

=D29/D49

 

 

 

 

 

 

 

 

 

F52

 

=D25/D52

 

 

 

 

 

 

 

 

Ранее в ячейке F40 было найдено

têð = 2,446914. Так как

 

t(b0 )

 

tкр ,

 

 

 

 

 

 

t(b1 )

 

tкр , то коэффициенты регрессии

b0 , b1 также значимы.

В ячейках

 

 

G49 и G52 введем комментарии, как показано ниже:

В п.2 настоящей работы было найдено уравнение линейной

регрессии yˆ 4,507937 1,079365x. Выдвинем гипотезу

H 0 : 1 1,

которую следует проверить при уровне значимости

0,01.

Конкурирующая гипотеза H1 : 1 1.

 

Введем комментарии:

 

Вячейке С57 введем формулу для расчета статистики «=(D25-1)/D52».

Вячейке E57 с помощью описанной выше функции СТЬЮДЕНТ.ОБР.2Х

по уровню значимости 0,01 и числу степеней свободыn 2 8 2 6 найдем критическое значение критерия t: tкр=3,707. Так как tнабл 1,108832 tкр 3,707, то гипотеза H 0 принимается. В строке 60 запишем соответствующий комментарий.

37

Найдем доверительную оценку для параметра 1 . Любое значение 1 ,

совместимое

с

оценкой

b1 ,

удовлетворяет

условию:

b1 têð S(b1 ) 1 b1 têð S(b1 ). В ячейке G57 введем 1 , а в ячейках F57 и H57 введем соответственно формулы для вычисления границ доверительного интервала «=D25–E57*D52», «=D25+Е57*D52». Таким образом, 0,814006 1 1,344733691 .

Совершенно аналогичным образом можно найти доверительный интервал для коэффициента 0 . Выполните это самостоятельно!

Внимание! В Excel имеется функция ПРЕДСКАЗ, которая вычисляет будущее значение Y по существующим парам значений X и Y с использованием линейной регрессии.

Внимание! Гораздо больше возможностей для получения уравнения линейной регрессии и проведения анализа представляет инструмент

Регрессия, включенный в Пакет анализа.

Установите курсор в ячейке А63. Далее выполните команды меню

ДАННЫЕ Анализ данных Регрессия ОК. Входной интервал Y $C$3:$C$10 – это значения, для которых делается прогноз. Входной интервал X $B$3:$B$10 – это переменные, влияющие на прогноз. Их может быть в Excel до 16 (столбцов). Выходной интервал $A$63 – это ячейка, начиная с которой будет выведен результат. Установите также флажок График подбора и (или) График остатков. Флажок Константа-

ноль устанавливают, чтобы линия регрессии прошла через начало координат. Нажимаем ОК. Результат работы инструмента показан на рис.2.6:

38

Рис.2.6

Пример 2.2. Зависимость расходов на питание Y от личного дохода X

 

Год

2001

 

2002

 

2003

2004

2005

 

х

2

 

6

 

 

10

14

18

 

у

9

 

10

 

 

12

19

20

имеет вид:

 

 

 

 

 

 

 

 

 

 

 

yˆ 6,25 0,775x

 

 

 

 

 

 

 

1,65

0,143

 

 

 

(в скобках указаны стандартные ошибки коэффициентов). Проверьте гипотезу Н0: 1 = 1,5, используя Пакет анализа MS Excel и

сравните полученные данные с решением примера.

Решение.

Наблюдаемое значение критерия t b1 1 0,775 1,5 5,06 .

S (b1 ) 0,143

Число степеней свободы n 2 3. Тогда при уровне значимости

39

=0,05 по таблице

 

 

 

t–распределения находим tкр

= 5,8. Поскольку

tнабл

=

5,06 < tкр = 5,8, то гипотеза Н0 принимается.

 

 

 

Пример 2.3.

По данным примера 2.2

оцените значимость

коэффициента регрессии b1 = 0,775 и постройте доверительный интервал для 1 при 5%-м уровне значимости . Используйте Пакет анализа MS Excel и сравните с приведенным решением.

Решение.

 

 

 

 

 

b1

0,775

 

Наблюдаемое значение критерия t

 

 

 

5,4.

S (b1 )

0,143

При = 5%

 

и = 3 по таблице t–распределения находим tкр = 3,18.

Поскольку

 

tнабл

 

= 5,4 > 3,18 = tкр, то гипотеза Н0 отклоняется, т.е.

 

 

коэффициент регрессии b1 = 0,775 статистически значим. Доверительный интервал для 1 имеет вид:

0,775 – 3,18 0,143 < 1 0,775 + 3,18 0,143

или

0,32 < 1,23.

Вопросы для самопроверки

7.Охарактеризуйте составные части эконометрической модели.

8.Что такое функция регрессии?

9.Каков содержательный смысл параметра 1 ?

10.Опишите сущность метода наименьших квадратов.

11.Какие допущения лежат в основе классической модели линейной регрессии?

12.Какими свойствами обладают МНК–оценки классической ли– нейной эконометрической модели?

13.Каковы признаки качественной эконометрической модели?

14.Можно ли обнаружить ошибки спецификации с помощью исследования остаточного члена?

15.Каким образом осуществляется проверка полученной эконометрической модели?

16. Что такое коэффициент детерминации?

Лабораторная работа № 3

Тема. Графики

При анализе каждой регрессионной модели большое значение имеет графическая информация. Графическое представление помогает

40