Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика (лабораторные)

.pdf
Скачиваний:
177
Добавлен:
01.03.2016
Размер:
1.96 Mб
Скачать

2000

5

15

25

 

75

 

10,763636

14,44

0,190413

17,946777

2001

6

17

36

 

102

11,636364

33,64

0,190413

28,768595

2002

7

15

49

 

105

12,509091

14,44

1,713719

6,204628

2003

8

12

64

 

96

 

13,381818

0,64

 

4,760331

1,909422

2004

9

13

81

 

117

14,254545

3,24

 

9,330248

1,573884

2005

10

10

100

100

15,127273

1,44

 

15,423471

26,288926

 

55

112

385

688

112

191,6

62,836364

128,76363

Итого

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5,5

11,2

38,5

68,8

11,2

19,16

6,283636

12,876364

Средне

 

y

 

 

 

 

 

 

 

y

 

 

ˆ

var e

x

 

x

2

 

 

xy

е

 

 

 

 

 

 

 

 

 

var y

 

var y

Интересно заметить, что при изменении исходных данных в Excel не изменились автоматически результаты функции ЛИНЕЙН и результаты, полученные с применением инструмента Регрессия из Анализа данных. Это связано с изменением числа наблюдений и добавлением строк. Поэтому следует очистить ячейки H19:I23 и в данный диапазон ячеек снова вывести статистические результаты для новых значений переменных. Аналогично аннулируйте результаты инструмента Регрессия для прошлых данных и получите для новых данных.

Итак, непосредственно и с помощью встроенных возможностей программы мы нашли, что уравнение регрессии имеет вид: yˆ 6,4 0,872727 x .

Коэффициент детерминации R2 0,327956 , т.е. 32,8% вариации зависимой переменной (ежегодное потребление овощей), объясняется линейной регрессией. Значимость коэффициента детерминации проверяем

по F–тесту:

Fнабл =3,903982, Fкр 5,32. Поскольку

Fнабл Fкр , то

нулевая

гипотеза H0

о не–значимости коэффициента R2

принимается,

т.е. R2

статистически незначим. Таким образом, следует скорректировать комментарий в строке 39.

Для нахождения S 2 и S введите следующие формулы-комментарии:

и формулы:

Ячейка

Формула

D42

=10/(10-2)*I14

D44

=КОРЕНЬ(D42)

51

Остаточная дисперсия и стандартная ошибка регрессии равны

соответственно: S 2 16,09545

и S 4,011914 .

Рассмотрим нелинейную регрессию вида yˆ b0 b1 x .

Измените имя созданного выше листа с «Лист1» на «Вид1». Создайте копию этого листа под названием «Вид2», как было описано в лабораторной работе № 2. Активизируйте лист «Вид2» и работайте в нем.

 

 

 

Решение данной задачи через использование замены z x

сводится

к

 

нахождению параметров линейной регрессии yˆ a bz.

 

Скопируйте диапазон В2:В12 в диапазон А2:А12, очистите ячейки

В2:В12. В ячейке В2 введите z. В ячейке В3 введите

формулу

«=КОРЕНЬ(А3)». Размножьте формулу на диапазон В3:В12. Во всех

 

 

 

остальных комментариях замените х на z, а в ячейке I29 – x на

x .

Получаемая при этом таблица должна принять следующий вид:

 

 

Внимание! Поскольку при редактировании, как уже было сказано, могут самопроизвольно изменяться размеры формул, целесообразнее набрать их заново.

Очистите диапазон ячеек А33:Е35 и введите формулы, как показано ниже:

52

В ячейках Е34 и G34 введите соответственно формулы «=КОРЕНЬ(1– J13/H13)» и «= Е34*Е34». В формуле, расположенной в ячейке D37, следует поменять D34 на G34.

 

 

 

 

Получили уравнение регрессии

yˆ 1,394713 4,364058 x .

Индекс корреляции rxy

 

. Связь тесная.

 

0,670114

Качество подгонки оцениваем индексом детерминации:

R2 rxy2 0,449053 ,

т.е. 44,91% вариации зависимой переменной (ежегодное потребление овощей) объясняется регрессией.

Значимость индекса детерминации R 2 проверяем по F–тесту:

 

 

Fнабл

 

 

кр

 

, то нулевая гипотеза H0

о незначимости

 

6,52046 F

5,317655

 

 

 

 

R 2 отвергается в

 

пользу

альтернативной

H1, т.е. R2

статистически

значим.

 

 

 

 

 

 

 

 

 

 

(Не забудьте проверить истинность комментария в строке 39!).

Остаточная дисперсия S 2 и стандартная ошибка регрессии S

e

равны

 

 

 

 

 

 

e

 

 

 

соответственно:

 

 

 

 

 

 

 

 

 

 

S

2

 

n

var e 13,195174 ;

S 3,632516 .

 

 

 

n 2

 

 

 

 

e

 

 

e

 

 

 

 

 

 

 

 

 

 

 

 

Рассмотрим нелинейную регрессию вида yˆ b0 b1 1x .

Сделайте копию листа «Вид2» под названием «Вид3», активизируйте новый лист и работайте в нем.

Решение данной задачи через использование замены z 1x сводится к

нахождению параметров линейной регрессии yˆ b0 b1 z .

Очистите ячейки В3:В12. В ячейке В3 введите формулу «=1/А3», скопируйте ее на диапазон В3:В12. Получим таблицу 4.1.

Изменяя в ячейке I29 x на 1x , получим уравнение регрессии

53

Fнабл

yˆ 15,10192 13,3218 1x .

Индекс корреляции rxy 0,800539 . Связь тесная.

Коэффициент детерминации R2 0,640863 , т.е. 64,09% вариации зависимой переменной (ежегодное потребление овощей) объясняется линейной регрессией. Так как 14,2756 Fкр 5,32, то нулевая гипотеза

о незначимости R 2 отвергается в пользу альтернативной H1, т.е. R 2

статистически значим. (Проверьте правильность комментария в строке

39!)

Остаточная дисперсия S 2

и стандартная ошибка регрессии

S

e

равны

e

 

 

 

 

соответственно: S 2 8,601340 и

S 2,932804 .

 

 

 

Табл.4.1

б) Сравним три рассмотренные модели:

Уравнение регрессии

Коэффициент

Проверка

Стандартная

мо–

 

 

 

(индекс)

R2

с

ошибка

де-

 

 

 

детерминации

помощью

 

Ли

 

 

 

 

 

F–теста

 

 

1.

yˆ 6,4 0,872727 x

R2

0,327956

Незначим

Se 4,011914

 

 

 

 

 

 

 

 

 

2.

 

 

 

2

0,449053

Значим

 

S 3,632516

ˆ

 

 

R

 

 

e

 

y 1,394713 4,364058 x

 

 

 

 

 

 

 

 

 

 

 

54

3.

 

1

 

R2 0,640863

Значим

Se 2,932804

 

yˆ

15,10192 13,3218

 

 

 

 

 

 

x

 

 

 

 

Из трех вариантов модели третья является наилучшей.

Вопросы для самопроверки

1.Укажите классы нелинейных моделей.

2.Что понимается под спецификацией модели?

3.Что понимается под линеаризацией модели?

4.Какие виды нелинейных зависимостей поддаются линеаризации?

5.Приведите примеры использования гиперболической функции.

Лабораторная работа № 5

Тема: Нелинейная регрессия по оцениваемым параметрам

К данному классу нелинейных моделей относятся регрессионные модели, в которых результативная переменная Y нелинейно связана с

параметрами 0 , 1 , , ð

 

уравнения регрессии. К такому типу

регрессионных моделей относятся функции:

 

 

 

 

 

 

 

1)

степенная

Y

0

X 1

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2)

показательная

Y

0

X ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

3)

логарифмическая параболическая

Y

0

X

X 2

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

 

4)

экспоненциальная

 

 

 

Y e 0 1 X ;

 

 

 

 

 

 

 

 

 

5)

обратная

 

Y

 

 

 

 

 

1

;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

1

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

6)

Гомперца

 

Y k

1X

 

;

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

7) логистическая (кривая Перла–Рида)

Y

 

 

 

 

k

 

 

и др.

 

 

 

 

1

1

e 0 X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Показательная, логарифмическая и экспоненциальная функции называются кривыми насыщения, потому что дальнейший прирост результативной переменной зависит от уже достигнутого уровня функции. Они используются в основном для описания процессов, которые имеют предел роста в изучаемом периоде, например в демографии.

Кривые Гомперца и Перла–Рида относятся к так называемым S– образным, которые являются кривыми насыщения с точкой перегиба. Они описывают два последовательных процесса: один с ускорением развития, другой с замедлением достигнутого развития. Данный тип кривых применяется в демографии, страховании, при решении задач о спросе на новый товар и др.

55

Второй класс нелинейных моделей условно подразделяется на два типа:

нелинейные модели внутренне линейные (подлежащие линеаризации);

нелинейные модели внутренне нелинейные (не подлежащие линеаризации).

Метод наименьших квадратов можно применять к нелинейным регрессионным моделям только в том случае, если возможна их линеаризация, т.е. если они нелинейны по факторным переменным или нелинейны по параметрам, но внутренне линейны. При использовании линеаризуемых функций, затрагивающих преобразования зависимой переменной Y, следует особенно проверять наличие предпосылок МНК. При нелинейных соотношениях рассматриваемых признаков, приводимых к линейному виду, возможны проверка значимости коэффициентов регрессии и интервальное оценивание параметров нелинейной функции.

Так, например, для показательной зависимости Y

0

X сначала

 

1

строят доверительные интервалы для параметров нового преобразованного уравнения lnY ln 0 X ln 1 ln , т.е. для ln 0 и для ln 1 , а затем с

помощью обратного преобразования определяются доверительные интервалы для коэффициентов исходного соотношения.

Если же взять показательную функцию, включающую случайную ошибку аддитивно, т.е.

Y 0 1 X ,

то данную модель уже невозможно привести к линейному виду с помощью логарифмирования. Она является внутренне нелинейной.

В общем случае оценки параметров нелинейных уравнений регрессии осуществляют путем использования алгоритмов и программ, реализующих численные методы. Современные статистические пакеты программ для персональных компьютеров позволяют оценить параметры нелинейных уравнений регрессии любого типа.

Задача 5.1. По данным задачи 2.1 лабораторной работы №2 получить уравнения регрессии вида:

 

а) ˆy a xb ;

б) ˆy a ebt .

 

 

 

 

Решение.

 

 

 

 

 

 

 

а)

Прологарифмировав

обе

части

уравнения,

 

получим

ln yˆ ln a b ln x . Введем

в

рассмотрение новые переменные

ˆ

ˆ

Y

ln y ,

X ln x ,

C ln a . Получим

линейное уравнение вида

ˆ

C bX .

Y

56

Коэффициенты уравнения C, b найдем как коэффициенты уравнения линейной регрессии методом наименьших квадратов.

Откройте новый файл, сохраните его под названием «лаб5.хls». Откройте файл «лаб2.хls», скопируйте диапазон А2:С13, вернитесь в окно «лаб5.хls», выделите ячейку А2 и вставьте фрагмент. Если некоторые формулы выходят за границы таблицы, расширьте соответствующие строки. Далее введите в ячейки формулы-комментарии:

 

Ячейка

Обозначение

 

D2

X ln x

 

E2

Y ln y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

F2

 

 

 

X 2

 

G2

 

 

 

XY

 

H2

 

 

 

Y

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I2

 

 

 

 

 

yˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J2

(y y)2

 

 

 

 

 

 

 

 

 

 

 

 

 

K2

(yˆ y)2

 

 

 

 

 

 

 

 

 

 

 

 

 

L2

(y yˆ)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M2

A

 

y yˆ

 

100

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

E13

 

 

 

 

Y

 

 

 

 

 

 

 

F13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

G13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

XY

 

 

 

 

 

 

H13

 

 

 

Y

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

I13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

J13

 

 

var( y)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

K13

 

 

 

 

 

 

^

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

var( y)

 

 

 

 

 

 

 

 

L13

 

 

var(e)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M13

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

A

 

 

 

 

 

 

 

Введите формулы согласно таблице:

 

 

 

 

 

 

 

 

 

 

 

 

Ячейка

Формула

 

D3

=LN(B3)

 

E3

=LN(C3)

57

F3

=D3*D3

G3

=D3*E3

H3

=E3*E3

Диапазон ячеек D3:H3 размножьте на диапазон D3:H10, а диапазон С11:С12 – на диапазон С11:M12.

Введите формулы-комментарии для расчета коэффициентов линейной регрессии и шаблон для вывода уравнения регрессии, как показано ниже:

В ячейке D17 введите формулу для расчета «=(G12–E12*D12)/(F12–

D12*D12)», в ячейке D20 – «=E12–D17*D12», в ячейке D22 – «=EXP(D20)».

Получим линейное уравнение регрессии

ˆ

1,463901 0,57688 X , т.е.

Y

ln yˆ 1,463901 0,57688ln x . Потенцируя данное уравнение, имеем:

yˆ e1,463901 0,57688 ln x e1,463901 x0,57688 = 4,322789 x0,57688.

Для того чтобы получить данные последнего (окончательного)

уравнения, введите формулы следующим образом:

 

 

 

Формула

 

 

Ячейка

 

 

 

 

В25

 

=G17

 

 

D25

 

=F17

 

 

B27

 

=D22

 

 

D26

 

=F17

 

Теоретические значения результата

yˆ получают, подставляя в данное

уравнение фактические значения

x . Для этого в ячейке I3 следует ввести

формулу «=D$22*B3^D$17» и размножить ее на диапазон I3:I10. Для

дальнейшего заполнения таблицы введите формулы:

 

Ячейка

 

Формула

 

58

A 11,9%

J3

= (C3-C$12)^2

K3

= (I3-C$12)^2

L3

=(C3-I3)^2

M3

=ABS((C3-I3)/C3)*100

Размножьте диапазон ячеек J3:M3 на диапазон J3:M10. В результате таких операций получим фрагмент таблицы:

Для расчета индекса корреляции в ячейку А30 введем формулу-

 

 

 

 

 

 

~

 

 

( y yˆ)2

 

 

комментарий xy

 

1

 

 

 

 

, а в ячейке D30 формулу для его

 

 

 

( y y)2

 

 

 

 

 

вычисления «=КОРЕНЬ(1–L11/J11)». Кроме индекса корреляции, другим показателем тесноты связи является средняя ошибка аппроксимации. В нашем примере она равна при допустимом пределе значений 7–

10%.

Те же самые результаты можно получить, воспользовавшись функцией ЛИНЕЙН, в которой в качестве известных значений Y выступает диапазон Е3:Е10, известных значений X – D3:D10. Выведите матрицу результатов в диапазон F17:G21 и сравните с полученным ранее результатом.

б) Рассмотрим уравнение экспоненциального временного ряда в виде

yˆ a ebt . Прологарифмировав обе

части

уравнения,

получим

ln yˆ ln a b t . Введем в рассмотрение

новые

переменные

ˆ

ˆ

Y

ln y ,

59

C ln a . Получим линейное уравнение вида ˆ . Коэффициенты

Y C bt

уравнения C, b найдем при помощи программы Excel.

Для этого в файле «лаб2.хls» активизируйте лист «врем. ряд». В нем выделите ячейки А2:С10 и скопируйте их в буфер. В файле «лаб5.хls» активизируйте «Лист2» и, щелкнув по кнопке А2, вставьте фрагмент из буфера. В ячейке D2 введите обозначение Y ln y , в ячейке D3 формулу

«=LN(С3)», размножьте ее на диапазон D3:D10. Для ускорения расчетов сразу воспользуйтесь результатами функции ЛИНЕЙН, выведя их в диапазон В12:С16, заполнив поля, как показано ниже:

Создайте шаблон для вывода уравнений:

Введем формулы в ячейках: Е15 – «=С12», G15 – «=B12», Е17 –

«=EXP(C12)», G16 – «=В12».

Преобразованное

уравнение имеет вид

ˆ

1,896027 0,198556t , а

Y

исходное уравнение –

yˆ 6,659385 e0,198556 t .

 

 

Примечание: В Excel предусмотрена возможность непосредственного нахождения параметров экспоненциальной кривой y t . Для этого

существует функция ЛГРФПРИБЛ, порядок вычисления которой аналогичен применению функции ЛИНЕЙН. Для нахождения значений, , щелкнув по ячейке В19, выполните команды меню ФОРМУЛЫ fx

Вставить функцию Статистические ЛГРФПРИБЛ ОК.

Заполните аргументы функции по приведенному образцу

60