Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Бураева Е.В.. Учебно-методическое пособие для самостоятельного работы по дисциплине «Эконометрика» для студентов заочного отделения, обучающихся по направлению подготовки 38.03.01 Экономика

.pdf
Скачиваний:
8
Добавлен:
15.11.2022
Размер:
1.07 Mб
Скачать

11

между количественными характеристиками социально-экономических систем. Они строятся в тех случаях, когда известно, что зависимость между

факторами существует и требуется получить ее математическое описание.

Связь, при которой каждому значению аргумента соответствует не одно, а несколько значений функций и между аргументом и функцией нельзя

установить строгой зависимости, называется корреляционной.

Простая (парная) регрессия представляет собой регрессию между

двумя переменными – у и х, т.е. модель вида

y =

ˆ

(x),

(2.1)

f

где у – зависимая переменная (результативный признак);

х – независимая, или объясняющая, переменная (признак-фактор).

Различают линейные и нелинейные регрессии.

Линейная регрессия: y = a+b*x+ .

(2.2)

Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные

по оцениваемым параметрам:

 

 

полиномы разных степеней y = a+b1*x+b2*x2+b3*x3+

(2.3)

 

равносторонняя гипербола y = a+b/x+

(2.4)

 

и регрессии, нелинейные по оцениваемым параметрам

 

 

степенная y = a*xb *

(2.5)

 

показательная y = a*bx *

(2.6)

 

экспоненциальная y = e a+b*x *

(2.7)

Спецификация модели – формулировки вида модели, исходя из соответствующей теории связи между переменными. В парной регрессии

выбор вида математической функции y =

ˆ

(x) может быть осуществлен

f

тремя методами: графический, аналитический, экспериментальный.

Простейшей системой корреляционной связи является линейная связь между двумя признаками – парная линейная корреляция. Уравнение парной линейной корреляционной связи называется уравнением парной регрессии и имеет вид:

 

12

Ŷ = a+bx,

(2.8)

где ŷ – среднее значение результативного признака у при

определенном значении факторного признака х;

а – свободный член уравнения;

b – коэффициент регрессии, измеряющий среднее отношение

отклонения результативного признака от его средней величины к отклонению факторного признака от его средней величины на одну единицу его измерения – вариация у, приходящаяся на единицу вариации х.

построение уравнения регрессии сводится к оценке ее параметров.

Для оценки параметров регрессий, линейных по параметрам, используют

Метод наименьших квадратов (МНК) МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических

значений результативного признака у от теоретических ŷ минимальна,т.е.

(y – ŷ)2

min

Система нормальных уравнений:

 

na + b x = y

 

a x + b x2 = xy

(2.9)

Можно решить эту систему уравнений по исходным данным или

использовать формулы, вытекающие из этой системы:

 

a = y b * x,

(2.10)

 

 

 

 

 

 

 

b=

y * x

y * x

,

(2.10а)

 

 

 

 

 

 

x 2 x 2

 

Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции rxy для линейной регрессии (-1 rxy 1);

 

 

 

 

 

 

 

 

rxy= b *

x

 

 

y * x y * x

,

(2.11)

 

 

 

 

y

 

 

x * y

 

и индекс корреляции pxy – для нелинейной регрессии (0 pxy 1):

 

 

 

 

 

 

 

 

 

 

 

 

 

( y yˆx )2

.

 

pxy=

1

2 ост =

1

(2.12)

 

 

 

2 y

 

( y yˆ )2

 

Оценку качества построенной модели даст коэффициент (индекс)

13

детерминации, а также средняя ошибка аппроксимации.

Средняя ошибка аппроксимации – среднее отклонение расчетных значений от фактических:

 

 

 

1

*

 

y yˆ

 

*100%

 

 

 

 

(2.13)

 

А

 

 

 

 

 

 

n

 

y

 

 

 

 

 

 

 

 

 

 

 

 

Допустимый предел значений А - не более 8 – 10%.

 

Средний

 

 

 

на сколько

коэффициент эластичности Э показывает,

процентов в среднем по совокупности изменится результат y от своей средней величины при изменении фактора x на 1% от своего среднего значения:

 

 

 

 

 

x

(2.14)

 

 

 

 

 

 

 

 

 

 

Э f (x) * y .

Задача дисперсионного анализа состоит в анализе дисперсии

зависимой переменной:

 

Правило сложения дисперсий:

 

( yi -

 

)2 = (ŷx -

 

)2 + (yi - ŷx)2

(2.15)

y

y

где (yi - y )2 – общая сумма квадратов отклонений – общая дисперсия;

x - y )2 – сумма квадратов отклонений, обусловленная регрессией

(это объясненная или факторная дисперсия)

(yi - ŷx)2 – остаточная сумма квадратов отклонений.

Долю дисперсии, объясняемую регрессией, в общей дисперсии

результативного признака y характеризует коэффициент (индекс)

детерминации R2;

 

2

 

( yˆ x y)2

 

R

 

 

.

(2.16)

 

( y y )2

F-тест – оценивание качества уравнения регрессии – состоит в проверке гипотезы Но о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического

Fфакт и критического (табличного) Fтабл значений F-критерия Фишера.

Любая сумма квадратов отклонений связана с числом степеней

14

свободы, которое связано с числом единиц совокупности n и с числом

определяемых по ней констант (m).

 

Dобщ= ( yi -

 

 

)2 / (n-1)

 

y

 

Dфакт= (ŷx -

 

)2 / m

(2.17)

y

Dост= (yi - ŷx)2 /n-m-1

 

Определение

 

 

дисперсии на одну степень

свободы приводит

дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-критерия

F = Dфакт/Dост =

 

r2

* (n-2)

(2.18)

 

r2

1

 

 

где F-критерий для проверки нулевой гипотезы Но: Dфакт = Dост.

Табличное значение F-критерия – это максимальная величина отношения дисперсий, которая может иметь место при случайном их расхождении для данного уровня вероятности ( ) наличия нулевой гипотезы

(уровень значимости - вероятность отвергнуть правильную гипотезу при условии, что она верна). Вычисленное значение F-отношения признается достоверным (отличным от единицы), если оно больше табличного. В этом случае нулевая гипотеза об отсутствии связи признаков отклоняется и делается вывод о существенности этой связи: Fфакт Fтабл – Но отклоняется.

Если эта величина окажется меньше табличного, то вероятность нулевой гипотезы выше заданного уровня (например, 0, 05) и она не может быть отклонена без серьезного риска сделать неправильный вывод о наличии связи. В этом случае уравнение регрессии считается статистически незначимым. Но не отклоняется.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей, т.е. о незначимом их отличии от нуля.

Оценка значимости коэффициентов регрессии и корреляции с помощью t-

критерия Стьюдента проводится путем сопоставления их значений с

15

величиной ошибки:

tb

b

; ta

b

; tr

b

.

(2.19)

 

 

 

 

mb

ma

mr

 

Случайные ошибки параметров линейной регрессии и коэффициента корреляции определяются по формулам:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

( y yˆ x )2

/(n 2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mb

 

 

 

S 2 ост

 

 

 

S

ост

 

;

 

 

 

 

 

 

 

 

(x x)2

 

 

(x x)2

ч

 

 

 

 

 

 

 

 

 

 

 

 

 

* n

 

 

 

 

 

 

(2.20)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

*

 

 

m

 

 

( y yˆ x )2

*

 

x 2

 

 

S 2

ост *

 

x 2

 

S

 

 

x 2

 

;

a

(n 2)

n * (x x)2

n2 * 2 x

ост

n * x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

mr xy

1 r 2 xy

 

(2.21)

n 2

 

 

 

сравнивая фактическое и критическое (табличное) значения t-

статистики принимаем или отвергаем гипотезу Но.

Если tтабл tфакт, то Но отклоняется, т.е. a, b, r не случайно отличаются от нуля и сформировались под влиянием систематически действующего фактора x. Если tтабл tфакт, то гипотеза Но не отклоняется и признается случайная природа формирования a, b, r.

Рекомендуемая литература: 1; 2; 3; 4; 5; 6; 8; 9; 10.

Контрольные вопросы:

1.В чем состоят ошибки спецификации модели?

2.Перечислите задачи и ограничения корреляционно-регрессионного анализа.

3.Какими методами может быть осуществлен выбор вида математической функции в парной регрессии?

4.Раскройте методику вычисления параметров парного линейного уравнения регрессии.

5.Поясните смысл коэффициента регрессии, назовите способы его оценивания, покажите, как он используется для расчета мультипликатора в функции потребления.

16

6.Что такое число степеней свободы и как оно определяется для факторной и остаточной сумм квадратов?

7.Какова концепция F-критерия Фишера?

8.Как оценивается значимость параметров уравнения регрессии?

9.В чем отличие стандартной ошибки положения линии регрессии от

средней ошибки прогнозируемого индивидуального значения результативного признака при заданном значении фактора?

10.Какой нелинейной функцией может быть заменена парабола второй степени, если не наблюдается смена направленности связи признаков?

11.Запишите все виды моделей, нелинейных относительно:

включаемых переменных;

оцениваемых параметров.

12.В чем отличие применения МНК к моделям, нелинейным относительно включаемых переменных и оцениваемых параметров?

13.Как определяются коэффициенты эластичности по разным видам регрессионных моделей?

14.Назовите показатели корреляции, используемые при нелинейных соотношениях рассматриваемых признаков.

Тема 3: Множественная корреляция и регрессия (ОПК-2; ОПК-3)

При изучении темы необходимо понять, что в реальных социально-

экономических системах на результативный признак всегда влияют множество факторных признаков. Четко уяснить, что основная цель множественной регрессии – построить модель с большим числом факторов,

определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель. Студент должен уметь выбрать факторы, включаемые в модель, распознавать коллинеарные факторы, избавляться от мультиколлинеарности; выбирать форму уравнения регрессии; строить уравнения множественной регрессии в стандартизованной и естественной форме; давать оценку параметров уравнения множественной

17

регрессии и качеству построенной модели в целом, оценку надежности

результатов множественной регрессии и корреляции.

Множественная регрессия – уравнение связи с несколькими

независимыми переменными:

 

Y=f(x1,x2,…,xp),

(3.1)

где y

- зависимая переменная (результативный признак);

x1,x2,…,xp – независимые переменные (факторы).

Для построения уравнения множественной регрессии чаще

используются следующие функции:

 

линейная

- y=a+b1*x1+b2*x2+…+bp*xp+

(3.2)

степенная

- y=a*x1b1*x2b2*…*xpbp *

(3.3)

экспонентная - y=еa+b1*x1+b2*x2+…+bp*xp+

(3.4)

 

1

 

гипербола

- y

 

(3.5)

y a b1* x1 b2 * x2 bp * xp

Можно использовать и другие функции, приводимые к линейному

виду.

Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Для линейных уравнений и нелинейных уравнений, приводимых к линейным, строится следующая система нормальных уравнений, решение которых позволяет получить оценки параметров регрессии:

y n * a b1 * x1 b2 *

x2 ... bp * x p ,

 

 

 

 

 

a * x1 b1 * x12

b2 * x1 * x2 bp

* x p

 

 

 

yx1

* x1

,

(3.6)

 

 

 

 

 

 

..........

.......... .......... .......... ..........

.......... .......... .......... ..........

..........

.........

 

,

yxp a * x p b1 * x1 * x p b2 * x2 * x p ...

bp * x p 2 .

 

 

 

 

 

 

 

 

для ее решения может быть применен метод определителей:

a

a

, b

b

 

 

bp

 

 

 

1 ,..., b

p

 

,

(3.7)

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

n

x1

x2 ...

 

 

x1

x1

2

x2 * x1 ...

где

x2

x1 * x2

x2

2 ...

 

...

...

 

... ...

 

x p

x1 * x p

x2 * x p ...

18

x p

x p * x1

x p * x2 - определитель системы

...

x p 2

a, b1 ,... bp - частные определители; которые получаются путем замены соответствующего столбца матрицы определителя системы данными левой части системы.

Другой вид уравнения множественной регрессии – уравнение регрессии в стандартизованном масштабе:

t y 1 * tx1 2 * tx2 ... p * txp ,

(3.8)

 

 

 

 

 

 

 

 

 

 

где t y

 

y y

, t xi

 

xi xi

- стандартизованные переменные;

 

 

 

 

 

 

y

 

xi

 

i

- стандартизованные коэффициенты регрессии.

 

К уравнению множественной регрессии в стандартизованном масштабе

применим МНК. Стандартизованные коэффициенты регрессии ( -

коэффициенты) определяются из следующей системы уравнений:

ryx1 1

2 * rx 2 x1

3 * rx3x1

... p * rxpx1

 

 

 

 

 

 

 

 

1

* rx 2 x1 2

3 * rx3x 2

... p * rxpx 2

 

 

 

 

 

ryx 2

 

 

 

(3.9)

.......... .......... .......... .......... .......... .......... .......... .........

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

yxp

 

1

* r

 

2

* r

 

3

* r

...

p

 

 

 

 

 

 

 

xpx1

 

 

xpx 2

 

x3xp

 

 

 

 

 

 

Связь

 

 

 

коэффициентов

множественной

регрессии

bi

со

стандартизованными коэффициентами i описывается соотношением:

 

bi i *

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3.10)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Параметр a определяется как a y b1 * x1 b2 * x2

... bp * xp .

(3.11)

Средние коэффициенты эластичности для линейной регрессии

рассчитываются по формуле:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x j

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Эyxj b j *

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(3.12)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для расчета частных коэффициентов эластичности применяются

 

 

 

 

 

 

 

19

следующая формула:

 

 

 

 

 

Эyxi

bi

*

 

xi

 

 

 

(3.13)

yˆ x *x ,x

,...,x

,x

,...,x

 

 

 

 

p

 

 

 

i 1 2

i 1

i 1

 

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:

Ryx x ,...,x

 

1

2 yоос

 

(3.14)

 

2

y

1 2

p

 

 

 

 

 

 

 

 

 

 

Значение индекса множественной корреляции лежит в пределах от 0 до

1 и должно быть больше или равно максимальному парному индексу корреляции:

 

 

ryxi

 

 

 

 

 

 

 

R

yx1x2

(i 1, p).

 

 

(3.15)

 

,...,x p

 

 

 

 

 

 

 

 

 

Индекс

множественной

корреляции

для

уравнения

в

стандартизованном масштабе можно записать в виде

 

 

 

 

 

 

 

 

 

 

 

 

R

yx1x2

 

i

* ryxi

 

 

(3.16)

 

,...,xp

 

 

 

 

 

 

 

 

 

При линейной зависимости коэффициент множественной корреляции можно определит через матрицу парных коэффициентов корреляции:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ryx1x 2,...,xp

1

 

r

,

 

 

 

 

 

 

(3.17)

 

r11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

ryx1

ryx 2

...

ryxp

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ryx1

1

 

rx1 x 2 ... rx1 xp

 

 

 

 

 

 

r

ryx 2

rx 2 x1

1

...

rx 2 xp

определитель

матрицы

парных

 

.

.

 

. . .

 

 

 

 

 

 

 

ryxp

rxpx1

rxpx 2

...

1

 

 

 

 

 

 

коэффициентов корреляции;

 

 

 

 

 

 

 

rx1 x 2 ... rx1 xp

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

r11

 

rx 2 x1

1

...

rx 2 xp

определитель

матрицы

межфакторной

 

 

... ... ... ...

 

 

 

 

 

 

 

 

 

rxpx1

rxpx 2

...

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

корреляции.

Частные коэффициенты (или индексы) корреляции, измеряющие влияние на y фактора xi при неизменном уровне других факторов можно

20

определить по формуле:

 

 

1 R

2

 

 

r yxi*x1x2…x i-1 x i+1…xp = 1

 

yx1x 2...xi...xp

(3.18)

1 R 2

 

 

 

yx1x 2...xi 1xi 1...xp

 

 

Частные коэффициенты корреляции изменяются в пределах от –1 до 1.

Качество построенной модели в целом оценивает коэффициент

(индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции ( Ryx2 1x1,...xp ).

Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:

 

 

(n 1)

 

 

R2

1 (1 R2 )

 

 

(3.19)

(n m

1)

 

 

 

где n – число наблюдений; m – число факторов.

Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:

F

 

R 2

*

n m 1

(3.20)

 

R 2

m

 

1

 

 

Частный F-критерий оценивает статистическую значимость присутствия каждого их факторов в уравнении. В общем виде для фактора xi

частный F-критерий определиться как

F

 

Ryx2

1...xi...xp Ryx2

1...xi 1xi 1...xp

*

n m 1

(3.21)

 

 

 

 

частxi

 

 

1 R2

 

1

 

 

 

 

 

 

 

 

 

yx1...xi...xp

 

 

 

Оценка значимости коэффициентов чистой регрессии с помощью t-

критерия Стьюдента сводиться к вычислению значения

 

bi

 

 

 

tbi

Fxi

(3.22)

 

 

mbi

 

где mbi – средняя квадратическая ошибка коэффициента регрессии bi, она может быть определена как

mbi

y

*

 

1

Ryx2

1...xp

 

 

*

1

 

(3.23)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

*

1

Rxix2

1...xp

 

n m 1

 

 

 

 

 

При построении

 

 

уравнения множественной регрессии может

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]