Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
практикум_эконометрика.doc
Скачиваний:
9
Добавлен:
05.05.2019
Размер:
2.04 Mб
Скачать
    1. Множественная регрессия

МЕТОДИЧЕСКИЕ УКАЗАНИЯ

Множественная регрессия – уравнение связи с несколькими независимыми переменными:

,

где y- зависимая переменная (результативный признак);

- независимые переменные (факторы).

Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов. Для линейных уравнений строится следующая система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии:

Для ее решения может быть применен метод определителей:

….,

где - определитель системы;

- частные определители, которые получаются путем замены соответствующего столбца матрицы определителя системы данными левой части системы.

Другой вид уравнения множественной регрессии – уравнение регрессии в стандартизованном масштабе:

где - стандартизованные переменные;

- стандартизованные коэффициенты регрессии.

К уравнению множественной регрессии в стандартизованном масштабе применим МНК. Стандартизованные коэффициенты регрессии определяются из следующей системы уравнений:

Связь коэффициентов множественной регрессии со стандартизованными коэффициентами описывается соотношением

.

Параметр a определяется как .

На практике часто бывает необходимо сравнение влияния на зависимую переменную различных объясняющих переменных, когда последние выражаются разными единицами измерения. В этом случае используют коэффициент эластичности, который показывает на сколько процентов (от средней) измениться в среднем Y при увеличении только на 1%:

.

Для расчета частных коэффициентов эластичности применяется следующая формула:

.

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:

,

а для уравнения в стандартизованном масштабе:

.

Для проверки общего качества уравнения регрессии используется коэффициент множественной детерминации, который рассчитывается как квадрат индекса множественной корреляции:

.

Значимость уравнения множественной регрессии в целом оценивается с помощью F – критерия Фишера:

,

где n – число наблюдений;

m – число факторов.

Частный F – критерий оценивает статистическую значимость присутствия каждого из факторов в уравнении:

.

Оценка значимости коэффициентов чистой регрессии с помощью t- критерия Стьюдента сводится к вычислению значения .

РЕШЕНИЕ ТИПОВЫХ ЗАДАЧ

Пример

Дана множественная регрессия z=a+b1*x+b2*y, где x, y, z приведены в таблице.

z

х

у

60,34

2,3

6,33

58,89

3,33

0,03

56,74

3,16

0,23

43,97

2,43

0,15

25,93

1,34

0,28

34,38

1,68

1,17

60,47

1,91

8,58

78,32

3,54

5,29

54,94

2,64

2,53

68,3

3,42

2,59

21,96

1,12

0,22

40,97

1,94

1,89

82,15

3,3

7,9

23,42

1,05

1,08

48,46

2,31

2,35

Задание

1. Постройте матрицу парных коэффициентов корреляции. Рассчитайте коэффициенты множественной детерминации, используя в качестве зависимой переменой каждый фактор.

2. Постройте уравнение множественной регрессии в линейной форме с полным набором факторов.

3. Оцените статическую значимость по уравнению регрессии и его параметров с помощью критериев Фишера и Стьюдента.

Решение

1.1 Матрицу парных коэффициентов корреляции переменных можно рассчитать, используя инструмент анализа данных Корреляция. Для этого:

  • в главном меню последовательно выберем пункты Сервис/Анализ данных/Корреляция. Щелкнем по кнопке ОК;

  • заполним диалоговое окно ввода данных и параметров вывода

  • результаты вычислений – матрица коэффициентов парной корреляции – представлены в табл.

Матрица коэффициентов парной корреляции

 

 

 

z

x

y

z

1

 

x

0,894011939

1

 

y

0,668907272

0,264986117

1

1.2 Для того, чтобы рассчитать коэффициенты множественной детерминации необходимо найти

1= =0,770891

2= = 0,464632

Расчет линейного коэффициента множественной корреляции выполним с использованием коэффициентов rzx, rzy и 1, 2:

Rzxy= = =0,999991

Коэффициент детерминации:

Rzxy2=0,9999922=0,999981.

2. Линейное уравнение множественной регрессии z от х и у имеет вид:

z=a+b1*x+b2*y. Для расчета его параметров применим метод стандартизации переменных и построим искомое уравнение в стандартизированном масштабе: tz=1*tx+2*ty

Получим уравнение:

tz=0,770891*tx+0,464632*ty

Для построения уравнения в естественной форме рассчитаем b1, b2, используя формулы для перехода от i к bi:

i=bi , bi=i ,

где x,z,y - стандартные отклонения по х, у, z

b1= =17,00657

b2= =3,001403

Значение а определим из соотношения:

a=z-b1*x-b2*y=50,616-17,00657*2,364666667-3,001403*2,708=2,273329

zxy=2,273329+17,00657*x+3,001403*y

3. Общий F-критерий Фишера проверяет гипотезу H0 о статистической значимость уравнения регрессии и показателя тесноты связи (R2=0):

Fфакт= 321637

где n-число наблюдений,

m – число факторов.

F-табл=3,88 ,=0,05

Сравнивая Fтабл и Fфакт, приходим к выводу о необходимости отклонить гипотезу H0, так как Fтабл =3,88<Fфакт=321637. С вероятностью 1-=0,95 делаем заключение о статической значимости уравнения в целом и показателя тесноты связи Rzxy, которые сформировались под неслучайным воздействием факторов х и у.

Частные F-критерии – Fx и Fy оценивают статистическую значимость присутствия факторов х и у в уравнении регрессии, оценивают целесообразность включения в уравнение одного фактора после другого фактора.

Fxфакт= =355444,1

Fтабл=4,75 =0,05

Сравнивая Fтабл и Fфакт, приходим к выводу о целесообразности включения в модель фактора х после фактора у, так как Fхфакт=3554444,1 >Fтабл. Гипотезу H0 о несущественности прироста R2z за счет включения дополнительного фактора х отклоняем и приходим к выводу о статически полтвержденной целесообразности включения фактора х после у.

Целесообразность включения фактора у после фактора х проверяет Fy:

Fyфакт= =129122,9

Низкое значение Fyфакт свидетельствует о статистической незначимости прироста r2zx за счет включения в модель фактора у после фактора х. Следовательно, подтверждается нулевая гипотеза H0 о нецелесообразности включения в модель фактора у. Это означает, что парная регрессионная модель является статистически значимой и, что нет необходимости улучшать ее, включая дополнительный фактор у.

Оценка с помощью t-критерия Стьюдента: рассчитывается для коэффициентов регрессии линейного уравнения как квадратный корень из соответствующего частного F-критерия Фишера:

tb1= 596,1913;

tb2= 359,3368

=0,05 df=15-2-1=12, tтабл=2,1788. Сравнивая tтабл и tфакт , приходим к выводу, что так как tb1 и tb2 >2,1788, коэффициенты регрессии b1, b2 являются статистически значимыми, надежными, на них можно опираться в анализе и прогнозе.

КОНТРОЛЬНЫЕ ЗАДАНИЯ

Задание:

  1. Рассчитайте параметры линейного уравнения множественной регрессии с полным перечнем факторов.

  2. Дайте сравнительную оценку силы связи факторов с результатом с помощью средних (общих) коэффициентов эластичности.

  3. Оцените статистическую значимость параметров регрессионной модели с помощью t-критерия; нулевую гипотезу о значимости уравнения и показателей тесноты связи проверьте с помощью F-критерия.

  4. Оцените качество уравнения через среднюю ошибку аппроксимации.

  5. Рассчитайте матрицы парных и частных коэффициентов корреляции и на их основе и по t-критерию для коэффициентов регрессии отберите информативные факторы в модель. Постройте модель только с информативными факторами и оцените ее параметры.

  6. Рассчитайте прогнозное значение результата, если прогнозные значения факторов составляют 80% от их максимальных значений.

  7. Рассчитайте ошибки и доверительный интервал прогноза для уровня значимости 5 или 10%(λ=0,05; λ=0,10).

  8. Оцените полученные результаты, выводы оформите в аналитической записке.

Задача 1

Имеются следующие данные по сельскохозяйственным предприятиям районов Пензенской области за 2000 г.

Производство молока, тонн, y

Поголовье коров в с/х предприятиях, голов, x1

Надоено молока в расчете на 1 корову молочного стада, кг., x2

Башмаковский

8617

4513

1981

Б-Демьяновский

2775

2125

1317

Бековский

1567

1531

1208

Белинский

6929

5742

1298

Бессоновский

10461

4566

2375

Вадинский

1992

2590

954

Городищенский

5348

3987

1269

Земетченский

3791

2842

1276

Иссинский

2679

2283

1241

Каменский

13727

7570

1852

Камешкирский

2642

2047

1305

Колышлейский

7084

4889

1492

Кондольский

2828

1801

1608

Кузнецкий

6989

3295

2128

Лопатинский

5086

3635

1288

Лунинский

6827

3145

2191

М-Сердобинский

1648

1367

1248

Мокшанский

7591

5240

1533

Наровчатский

4261

3230

1381

Неверкинский

3747

2977

1386

Н-Ломовский

6159

4471

1476

Никольский

5424

3389

1754

Пачелмский

4176

2572

1623

Пензенский

23702

8488

2869

Сердобский

7874

3841

2027

Сосновоборский

1685

1815

1007

Тамалинский

9485

6659

1458

Шемышейский

3078

2065

1475

Задача 2

Имеются следующие данные по Пензенской области

Валовой сбор сахарной свеклы, тыс. тонн, y

Урожайность сахарной свеклы, ц/га, x1

Посевные площади сахарной свеклы, тыс. га, x2

Минеральные удобрения, кг,

x3

1990

604,3

140

55,5

73,1

1991

634,1

116

55,0

62,1

1992

829,0

155

51,9

45,6

1993

613,7

149

39,5

26,2

1994

286,3

77

40,1

6,2

1995

522,5

140

39,4

4,5

1996

400,7

117

35,1

1,7

1997

303,3

110

33,6

2,8

1998

317,5

99

52,7

1,6

1999

633,3

129

46,4

1,9

2000

387,0

114

33,7

3,1

2001

391,7

127

36,3

3,1

2002

355,6

120

57,3

7,8

Задача 3

По Пензенской области известны значения пяти признаков

Год

Численность постоянного населения, тыс. чел.,y

Число родившихся, чел., x1

Число умерших, чел., x2

Число иммигрантов, тыс. чел., x3

Число эмигрантов, тыс. чел., x4

1990

1547,3

19431

17564

9562

2956

1991

1552,0

17584

18600

11258

2658

1992

1554,3

15634

19556

12462

2222

1993

1561,8

13772

22939

2568

2128

1994

1563,3

13500

25158

1998

2019

1995

1566,0

12817

23427

1765

1765

1996

1562,1

11999

23268

2135

1562

1997

1558,6

11517

23050

3251

1256

1998

1551,2

11568

22516

4964

1163

1999

1546,3

11034

24820

4568

956

2000

1530,6

11172

25331

3465

799

2001

1517,6

11080

24680

2126

599

2002

1504,1

11645

25584

1610

502

2003

1449,2

12150

25801

1521

417

2004

1406,3

12251

25711

1375

357

Задача 4

Изучается зависимость средней ожидаемой продолжительности жизни населения г. Пенза от нескольких факторов по данным, представленным в таблице

Год

y

x1

x2

x3

1991

66,2

0,38

282

16,5

1992

64,3

2,3

244

16,8

1993

65,1

28,4

219

17,4

1994

64,0

86,5

208

17,3

1995

64,6

125,3

190

17,4

1996

65,9

256,2

180

17,6

1997

66,2

488,4

190

17,9

1998

66,7

549,7

166

18,3

1999

66,3

856,6

172

19,1

2000

66,5

1259,9

135

19,8

2001

66,0

1708,3

171

20,1

2002

65,7

2221,4

164

21,3

2003

65,7

2764,9

183

21,4

2004

64,5

3414,2

156

21,6

y- ожидаемая продолжительность жизни при рождении, число лет

x1- денежные доходы (в среднем на душу в месяц, руб.)

x2- число детей, умерших в возрасте до 1 года, чел

x3- средняя обеспеченность населения жильем, м2 на 1 жителя

Задача 5

Имеются следующие данные по Пензенской области

Год

Валовой сбор зерна, тыс. тонн, y

Урожайность зерна, ц/га, x1

Посевные площади зерна, тыс. га, x2

Минеральные удобрения, кг, x3

1990

1841,2

16,3

1358,7

73,1

1991

1321,3

10,7

1282,4

62,1

1992

2102,2

16,4

1293,6

45,6

1993

1485,3

13,6

1250,4

26,2

1994

1355,0

13,5

1050,5

6,2

1995

873,3

8,3

1150,2

4,5

1996

1257,1

12,0

1090,0

1,7

1997

1781,3

16,7

1076,7

2,8

1998

762,0

9,6

1070,5

1,6

1999

835,5

12,8

980,3

1,9

2000

840,3

10,5

823,4

3,1

2001

1046,4

15,1

756,3

3,1

2002

1170,5

15,5

790,6

7,8

Задача 6

Имеются следующие данные по Пензенской области

Года

Среднедушевые денежные доходы населения, руб. (до 1998 г. тыс. руб.), Y

Средний размер назначенных месячных пенсий, руб. (до 1998 г. тыс. руб.), X1

Средняя номинальная начисленная заработная плата, руб. (до 1998 г. тыс. руб.), X2

1990

0,19

0,11

0,25

1991

0,39

0,41

0,43

1992

2,4

3,4

3,6

1993

29,1

38,9

35,0

1994

112,8

106,4

123,2

1995

301

212,2

261,2

1996

451

288,0

444,1

1997

562

328,9

546,0

1998

541

382,7

598,2

1999

936

495,0

911,4

2000

1234

801,2

1258,0

2001

1668

1113,6

1752,3

2002

2163

1395,6

2501,1

Задача 7

Имеются следующие данные по Пензенской области

Год

Валовой региональный продукт, млн. руб., (до 1998г.-млрд.руб.), Y

Объем промышленной продукции, млн. руб., (до 1998г.-млрд.руб.), X1

Продукция сельского хозяйства, млн. руб., (до 1998г.-млрд.руб.), X2

Оборот розничной торговли, млн. руб., (до 1998г.-млрд.руб.), X3

1990

9,3

4,5

3,4

2,2

1991

29,9

9,8

3,7

21

1992

331,2

96,4

39,3

215

1993

1256,9

712

282

825

1994

3165,5

1934

968

2568

1995

7475,3

5086

2483

3872

1996

11390,7

6917

3514

5302

1997

11898,4

8279

3666

6269

1998

11433,6

7596

3103

6654

1999

19652,3

12674

7151

11054

2000

27377,9

17895

7883

13763,5

2001

34552,6

22226

10254

17090,1

2002

48354,6

24718

11982

20910,0

Задача 8

Имеются следующие данные по Пензенской области

Год

Доходы бюджета, млн. руб., (до 1998г.-млрд.руб.), Y

Расходы бюджета, млн. руб., (до 1998г.-млрд.руб.), X1

Поступления налогов и сборов, млн. руб., (до 1998г.-млрд.руб.), X2

1990

10,8

11,1

12,2

1991

11,3

11,5

12,6

1992

12,8

12,9

14,5

1993

138

701

756,9

1994

446

644

665,2

1995

1241

1322,3

1482,3

1996

1804

1785,4

2034,8

1997

2071,9

2287,7

2538,4

1998

1817

1775,6

2124,7

1999

2663,9

2668,1

3685,6

2000

3518,4

3395,6

4108,4

2001

5757,8

5678

5909,3

2002

8557,9

8447,2

9148,6

Задача 9

Имеются следующие данные по Пензенской области

Год

Численность населения в трудоспособном возрасте, тыс. чел.,Y

Численность постоянного населения, тыс. чел.,X1

Среднедушевые денежные доходы населения, руб. (до 1998 г. тыс. руб.), X2

1990

840,4

1547,3

0,19

1991

840,2

1552,0

0,39

1992

845,4

1554,3

2,4

1993

871,9

1561,8

29,1

1994

876,4

1563,3

112,8

1995

876,8

1566,0

301

1996

874,6

1562,1

451

1997

878,4

1558,6

562

1998

884,0

1551,2

541

1999

890,3

1546,3

936

2000

894,6

1530,6

1234

2001

892,3

1517,6

1668

2002

889,1

1504,1

2163

Задача 10

Имеются следующие данные по Пензенской области

Год

Численность населения в трудоспособном возрасте, тыс. чел.,Y

Численность постоянного населения, тыс. чел.,X1

Численность безработных, тыс. чел., X2

Численность зарегистрированных безработных, тыс. чел., X3

1990

840,4

1547,3

29,4

9,1

1991

840,2

1552,0

34,7

9,9

1992

845,4

1554,3

37,0

11,6

1993

871,9

1561,8

47,5

17,5

1994

876,4

1563,3

64,8

30,6

1995

876,8

1566,0

102,6

47,0

1996

874,6

1562,1

108,3

46,4

1997

878,4

1558,6

83,8

41,0

1998

884,0

1551,2

122,1

27,4

1999

890,3

1546,3

79,5

14,2

2000

894,6

1530,6

86,3

12,6

2001

892,3

1517,6

103,9

13,2

2002

889,1

1504,1

53,1

19,1

Задача 11

Имеются следующие данные по Пензенской области

Год

Продукция сельского хозяйства, млн. руб., (до 1998г.-млрд.руб.), Y

Продукция растениеводства, млн. руб., (до 1998г.-млрд.руб.), X1

Продукция животноводства, млн. руб., (до 1998г.-млрд.руб.), X2

1990

3,4

1,5

1,9

1991

3,7

1,6

2,1

1992

39,3

19,5

19,8

1993

282

128,1

153,6

1994

968

480,4

487,3

1995

2483

1252,7

1230,7

1996

3514

2106,9

1407,3

1997

3666

2198,9

1466,4

1998

3103

1540,8

1513,0

1999

7151

3949,2

3067,1

2000

7883

4545,5

3337,5

2001

10254

5452,8

4801,2

2002

11982

6740,0

5242,0

Задача 12

Имеются следующие данные по Пензенской области

Год

Численность постоянного населения, тыс. чел.,Y

Численность городского населения, тыс. чел.,X1

Численность сельского населения, тыс. чел.,X2

1990

1547,3

983,5

563,8

1991

1552,0

987,6

564,4

1992

1554,3

989,8

564,5

1993

1561,8

991,3

570,5

1994

1563,3

997,4

565,9

1995

1566,0

998,0

568

1996

1562,1

995,7

566,4

1997

1558,6

993,7

564,9

1998

1551,2

989,4

561,8

1999

1546,3

984,2

562,1

2000

1530,6

980,1

550,5

2001

1517,6

979,2

538,4

2002

1504,1

973,4

530,7

Задача 13

Имеются следующие данные по Пензенской области

Год

Число собственных легковых автомобилей на 1000 чел. населения, штук, Y

Среднедушевые денежные доходы населения, руб. (до 1998 г. тыс. руб.), X1

Средняя номинальная начисленная заработная плата, руб. (до 1998 г. тыс. руб.), X2

1990

47,2

0,19

0,25

1991

51,6

0,39

0,43

1992

58,2

2,4

3,6

1993

57,0

29,1

35,0

1994

64,4

112,8

123,2

1995

68,7

301

261,2

1996

77,7

451

444,1

1997

80,7

562

546,0

1998

87,4

541

598,2

1999

92,6

936

911,4

2000

101,2

1234

1258,0

2001

104,8

1668

1752,3

2002

108,8

2163

2501,1

Задача 14

Известны следующие данные по г.Пенза.

Год

Перевозки пассажиров автобусами общего пользования, млн. чел., Y

Число автобусов общего пользования на 100000 чел., штук, X1

Численность городского населения, тыс. чел.,X2

1990

252,7

113

983,5

1991

226,2

97

987,6

1992

186,7

91

989,8

1993

178,4

89

991,3

1994

151,0

85

997,4

1995

231,9

98

998,0

1996

243,2

97

995,7

1997

247,2

96

993,7

1998

249,0

99

989,4

1999

252,7

96

984,2

2000

226,6

92

980,1

2001

205,2

86

979,2

2002

127,1

82

973,4

Задача 15

Имеются следующие данные по г. Пенза.

Год

Средняя обеспеченность населения жильем, м2 на 1 жителя, Y

Наличие жилищного фонда, тыс. м2 , X1

Численность городского населения, тыс. чел.,X2

1990

14,1

8012,9

983,5

1991

14,7

8124,5

987,6

1992

15,0

8303,2

989,8

1993

15,5

8566,0

991,3

1994

16,3

8726,3

997,4

1995

16,9

8952,5

998,0

1996

17,3

9125,3

995,7

1997

17,5

9275,0

993,7

1998

17,8

9391,0

989,4

1999

18,1

9462,1

984,2

2000

18,3

9628,0

980,1

2001

18,6

9743,7

979,2

2002

19,1

9987,9

973,4