Добавил:
Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Эконометрика.-1

.pdf
Скачиваний:
0
Добавлен:
05.02.2023
Размер:
1.84 Mб
Скачать

Но при этом, конечно, следовало увеличить объем выборки n , так как надежность статистических выводов существенно зависит от отношения объема выборки n к общему числу всех параметров регрессионной модели: чем больше величина отношения n /( p + 1) ,тем точнее соответствующие оценки, тем надежнее статистические выводы.

[Заголовок 1] 9. Тест Чоу [.]

Задача 1. По данным табл.9.1, используя критерий Г.Чоу, выяснить, можно ли считать одной и той же линейную регрессию Y по X для юношей и девушек.

Табл.9.1 – Исходные данные

Число решенных

Пол

Число решенных

Пол

студента

задач

 

студен

студента

задач

 

студент

 

 

 

та

 

 

 

а

 

 

 

 

 

 

 

 

i

xi

yi

 

i

xi

yi

 

1

10

6

муж.

7

6

3

жен.

 

 

 

 

 

 

 

 

2

6

4

жен.

8

7

4

муж.

 

 

 

 

 

 

 

 

3

8

4

муж.

9

9

7

муж.

 

 

 

 

 

 

 

 

4

8

5

жен.

10

6

3

жен.

 

 

 

 

 

 

 

 

5

6

4

жен.

11

5

2

муж.

 

 

 

 

 

 

 

 

6

7

7

муж.

12

7

3

жен.

 

 

 

 

 

 

 

 

Решение. По n1 =6 парам наблюдений ( xi , yi ) для юношей— (10;6),

(8;4), (7;7), (7;4), (9;7), (5;2) (1-ая выборка) и по n2 = 6 парам наблюдений для девушек—(6;4), (8;5), (6;4), (6;3), (6;3), (7;3) (2-ая выборка) рассчитаем уравнения регрессии:

)

+ 0,783x

(äëÿ

1 − é

âû áî ðêè );

y = −1, 000

)

+ 0,571x

(äëÿ

2 − é

âû áî ðêè ).

y = −0, 048

41

По всем n = n1 + n2 =12 парам наблюдений рассчитаем уравнение регрессии для объединенной выборки:

y = −1, 437 + 0,815x .

Так как вычисленное по (7.4) значение

F = 0, 21 < F0,05;2;11 = 4, 46 ,

то влияние фактора «пол» несущественно, и в качестве оценки регрессионной модели Y по X можно рассматривать уравнение регрессии, полученное по объединенной выборке.

Задача 2. В таблице 9.2 приведены данные о зависимости потребления шоколада в неделю ( y ) от дохода ( x ). Нужно определить, можно ли объединить выборки для мужчин и женщин.

Табл.9.2 Исходные данные

Пол

ж

ж

ж

ж

ж

ж

м

м

м

м

м

м

 

 

 

 

 

 

 

 

 

 

 

 

 

y

6

4

7

4

7

2

4

5

4

3

3

3

 

 

 

 

 

 

 

 

 

 

 

 

 

x

10

8

7

7

9

5

6

8

6

6

6

7

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. С помощью метода наименьших квадратов находим оценки параметров и функции регрессии для трех выборок 1) женщин:

)

yæ åí = −1 + 0,783x

2) мужчин:

)

yæ åí = 0,571 − 0,048x

3) объединенной:

)

= 0,815 − 1, 436x .

 

yæ åí

 

 

)

)

Найдем значения квадратов случайных остатков ε

= y yæ åí .

1) функции регрессии выборки женщин (табл.9.3)

Табл.9.3 Расчет значений квадратов случайных остатков

42

x

 

 

 

10

 

 

8

 

 

7

7

 

 

9

 

 

5

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

6

 

 

4

 

 

7

4

 

 

7

 

 

2

 

 

 

 

 

 

 

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yæ åí

 

6,826

 

5,261

 

4,478

4,478

 

6,043

 

2,913

 

 

 

 

 

 

 

 

 

 

ε

 

 

 

-

 

 

-

 

 

2,522

-

 

 

0,956

 

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,826

 

1,261

 

 

 

0,478

 

 

 

 

 

0,913

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)

2

 

 

0,682

 

1,590

 

6,360

0,229

 

0,915

 

0,834

 

=

 

 

 

 

 

 

ε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10,609

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2)

функции регрессии выборки мужчин (табл.9.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Табл.9.4 Расчет значений квадратов случайных остатков

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

6

 

 

8

 

 

6

 

6

 

 

6

 

 

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

 

4

 

 

5

 

 

4

 

3

 

 

3

 

 

3

 

 

 

 

 

 

 

 

 

 

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yì óæ

 

3,381

 

4,524

 

3,381

 

3,381

 

3,381

 

3,952

 

 

 

 

 

 

 

 

 

 

ε

 

 

 

0,619

 

0,476

 

0,619

 

-

 

 

-

 

 

-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,381

 

0,381

 

0,952

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

)

2

 

 

 

0,383

 

 

0,227

 

0,383

 

0,145

 

 

0,145

 

 

0,907

 

 

=

 

 

 

 

 

 

ε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2,190

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3)

функции регрессии общей выборки (табл. 9.5)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Табл.9.5 Расчет значений квадратов случайных остатков

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

10

8

 

 

 

7

 

 

7

9

 

5

6

 

 

 

8

 

 

6

 

6

6

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y

 

 

6

4

 

 

 

7

 

 

4

7

 

2

4

 

 

 

5

 

 

4

 

3

3

3

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yî áù

 

6,7

5,0

4,2

 

4,2

5,8

 

2,6

3,4

5,0

 

3,4

 

3,4

3,4

4,2

 

 

 

 

 

 

 

 

 

 

 

 

09

 

80

65

 

65

95

 

36

 

51

80

 

51

 

51

51

65

 

ε

 

 

-

 

-

 

 

 

-

 

 

 

-

 

 

 

 

-

 

 

 

-

-

-

 

 

 

 

0,7

1,0

2,7

 

0,2

1,1

 

0,6

0,5

0,0

 

0,5

 

0,4

0,4

1,2

 

 

 

 

09

 

80

35

 

65

05

 

36

 

49

80

 

49

 

51

51

65

 

)

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

13,4

 

 

 

0,5

1,1

7,4

 

0,0

1,2

 

0,4

0,3

0,0

 

0,3

 

0,2

0,2

1,6

62

 

 

 

03

 

66

78

 

70

22

 

05

 

02

06

 

02

 

03

03

01

 

 

 

 

 

 

 

 

 

 

43

Вычислим F - статистику:

 

 

 

n

n1

n

 

 

 

 

 

 

 

εi2 εi2

εi2 (n − 2 p − 2)

 

 

 

 

 

i=1

i=n1

 

 

 

 

 

F =

i=1

 

 

=

 

 

 

 

n1

n

 

 

 

 

 

 

 

 

 

 

 

 

 

εi2 + εi2 (p + 1)

 

 

.

 

 

 

 

 

i=n1

 

 

 

 

 

 

 

i=1

 

 

 

 

 

(13, 462 − 10, 609 − 2,190)(12 − 2 1 − 2)

= 0, 207

 

 

 

(10, 609 + 2,190)(1 + 1)

 

 

 

 

 

 

Т.к.

 

условие

F > Fα ; p+1;n−2; p−2 (= 4, 46),

не выполняется, то две

регрессионные модели можно объединить в одну, следовательно, выборки мужчин и женщин можно рассматривать как одну выборку.

[Заголовок 1] 10. Мультиколлинеарность [.]

Задача 1. В таблице 10.1 представлены данные о квартирах на рынке недвижимости. Найти оценки неизвестных параметров. Определить индекс детерминации. Выполнить тест на мультиколлинеарность.

Табл.10.1 Исходные данные

Адрес

Цена,

Кол-во

Общая

Отделка

Год

 

тыс.руб.

комнат

площадь

(0-

постройки

 

 

 

 

черновая,

 

 

 

 

 

1- есть)

 

 

 

 

 

 

 

Интернационалистов

 

 

 

 

 

ул, 29

3950

4

80

1

1976

 

 

 

 

 

 

Урожайный пер, 30

2050

1

35

1

2009

 

 

 

 

 

 

Ленина пр-кт, 126

2250

1

38

1

2004

 

 

 

 

 

 

Мира пр-кт, 33

5500

5

100

1

1988

 

 

 

 

 

 

Профсоюзная ул, 7

1270

1

26

0

2014

 

 

 

 

 

 

Интернационалистов

 

 

 

 

 

ул, 6

1680

1

30

1

1982

 

 

 

 

 

 

 

 

 

 

 

44

Ленская ул, 47

2690

2

57

1

2008

 

 

 

 

 

 

Розы Люксембург

 

 

 

 

 

ул, 101

2200

1

38

1

2008

 

 

 

 

 

 

Профсоюзная ул, 7

1290

1

31

0

2014

 

 

 

 

 

 

Дербышевский пер,

 

 

 

 

 

26а

2800

2

50

1

1993

 

 

 

 

 

 

Профсоюзная ул, 7

1520

1

35

0

2014

 

 

 

 

 

 

Карла Ильмера ул,

 

 

 

 

 

21

2500

2

54

1

1983

 

 

 

 

 

 

79-й Гвардейской

 

 

 

 

 

Дивизии, 20

2650

2

54

1

1978

 

 

 

 

 

 

Смирнова, 23

1900

2

44

1

1962

 

 

 

 

 

 

Решение. Запишем исходные данные в матричном виде:

Y := ( 3950 2050 2250 5500 1270 1680 2690 2200 1290 2800 1520 2500 2650 1900)T

1

4

80

1

1976

 

1

1

35

1

2009

 

 

 

 

 

 

1

1

38

1

2004

1

5

100

1

1988

 

 

 

 

 

 

 

1

1

26

0

2014

1

1

30

1

1982

 

1

2

57

1

2008

X :=

 

 

 

 

 

1

1

38

1

2008

 

1

1

31

0

 

 

2014

 

1

2

50

1

1993

 

 

 

 

 

 

1

1

35

0

2014

1

2

54

1

1983

1 2 54 1 1978

1 2 44 1 1962

45

С помощью метода наименьших квадратов находим оценки:

Q :=

(

T

)− 1

T

Y

 

X

X

X

 

 

 

 

 

4

 

 

 

−3.45 × 10

 

 

 

597.58

 

 

Q =

 

17.658

 

 

 

 

 

 

 

 

753.483

 

 

 

 

 

 

 

 

 

17.241

 

 

Вычислим оценки y:

j := 0, 1.. 13

ymj := Q0 + Q1 Xj , 1 + Q2 Xj , 2 + Q3 Xj , 3 + Q4 Xj , 4

 

 

0

 

 

 

 

0

4.122·103

 

1

2.104·103

 

2

2.071·103

 

3

5.28·103

 

4

1.278·103

 

5

1.55·103

ym =

6

3.073·103

 

7

2.14·103

 

8

1.366·103

 

9

2.69·103

 

10

1.437·103

 

11

2.589·103

 

12

2.502·103

 

13

2.05·103

По формуле вычислим индекс детерминации

 

 

 

Sî ñò

 

Sî ò êë

 

)

 

R

2

= 1 −

=

=

( y y)

2

 

Sî áù

Sî áù

( y y)

2

 

 

 

 

 

46

 

 

13

 

 

 

Yi

 

 

 

 

ys :=

i = 0

 

 

14

 

 

 

 

ys = 2.446× 103

13

Sot := (ymi − ys )2 i = 0

13

Sob := (Yi − ys )2 i = 0

R := Sot

Sob

R = 0.978

Для выявления мультиколлинеарности вычислим vif. Построим уравнение регрессии

xi(1) =α0 +α2 xi(2) +α3xi(3) +α4 xi(4)

Вычислим оценки неизвестных параметров:

Y1 := ( 4 1 1 5 1 1 2 1 1 2 1 2 2 2 )T

1

80

1

1976

1

35

1

2009

 

 

 

 

1

38

1

2004

1 100 1 1988

1 26 0 2014

1

30

1

1982

 

1

57

1

2008

X1 :=

 

 

 

 

1

38

1

2008

 

1

31

0

 

 

2014

 

1

50

1

1993

 

 

 

 

 

1

35

0

2014

1

54

1

1983

1 54 1 1978

1 44 1 1962

Q1 :=

(

T

)− 1

T

Y1

 

X1

X1

X1

 

 

23.44

 

 

 

 

 

 

 

 

Q1 =

 

0.058

 

47

−0.486

 

 

 

 

 

 

 

 

 

 

−0.012

 

 

Вычислим вектор оценок результирующей переменной:

j := 0, 1.. 13

ym1j := Q10 + Q11 X1j , 1 + Q12 X1j , 2 + Q13 X1j ,3

 

 

0

 

 

 

 

0

3.854

 

 

 

 

1

0.827

 

 

 

 

2

1.063

 

 

 

 

3

4.879

 

 

 

 

4

0.727

 

 

 

 

5

0.86

ym1 =

 

 

6

2.125

 

 

 

 

7

1.015

 

 

 

 

8

1.019

 

 

 

 

9

1.897

 

 

 

 

10

1.253

 

 

 

 

11

2.251

 

 

 

 

12

2.311

 

 

 

 

13

1.919

 

 

 

Наконец, определим vif:

 

 

13

 

 

 

Y1i

 

 

 

 

ys1 :=

i = 0

 

 

14

 

 

ys1 = 1.857

13

Sot1 := (ym1i − ys1 )2 i = 0

13

Sob1 := (Y1i − ys1 )2 i = 0

R1 := Sot1

Sob1

R1 = 0.979

1

vif1 :=

(1 − R1)

vif1 = 46.861

48

Т.к. полученное значение больше 10, то в модели наблюдается мультиколлинеарность.

[Заголовок 1] 11. Процедура отбора существенных факторов [.]

Задача 1. По данным таблицы 11.1 выполнить отбор наиболее существенных факторов с помощью процедуры пошагового отбора.

Табл.11.1 Исходные данные

№ заемщика

Просрочки

Стаж,

лет

Срок кредита,

Сумма

 

кредита (шт.),

(X1)

 

мес. (X2)

кредита, руб.

 

(Y)

 

 

 

(X3)

 

 

 

 

 

 

1

0

7,5

 

12

170 000

 

 

2

0

4,5

 

12

120 000

 

 

3

0

6,5

 

12

85 000

 

 

4

1

2,5

 

12

160 000

 

 

5

1

3,5

 

24

105 000

 

 

6

0

6,5

 

12

90 000

 

 

7

3

2

 

24

80 000

 

 

8

2

3,5

 

24

395 000

 

 

9

2

6

 

36

150 000

 

 

10

4

2

 

60

70 000

 

 

Решение.

Шаг 1. Вычислим квадрат коэффициента корреляции зависимой переменной с каждой объясняющей переменной:

49

 

 

 

 

 

 

n

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

 

 

n

 

x y

 

 

x

 

y

 

 

 

 

 

 

σ x

 

 

 

 

i

i

 

i

i

 

 

 

 

 

r = Θ

=

 

 

 

i=1

 

i=1

i=1

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1 σ y

n

 

 

n

 

2 n

 

 

n

 

2

 

 

 

 

nxi2

 

 

 

 

 

nyi2

 

 

 

 

 

 

 

 

xi

 

 

 

yi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

i=1

 

 

 

 

 

i=1

 

i=1

 

 

ryx2 1 = 0,5204 ,

ryx2 2 = 0,7582 ,

ryx2 3 = 0,0003.

Из объясняющих переменных

x(1) x(3) выделяется переменная

x(2) ,

имеющая с зависимой переменной Y наибольший коэффициент

детерминации

R2

(равный для парной модели квадрату коэффициента

корреляции r ). Очевидно, это переменная x(2) ,

так

как

коэффициент

детерминации

R2

= r

2 = 0,7582 -максимальный. С

учетом

поправки на

 

 

yx

yx

 

 

 

 

 

 

 

 

2

 

2

 

 

 

 

 

 

 

 

несмещенность

скорректированный

коэффициент

 

детерминации

)

n − 1

 

 

 

10 − 1

 

 

 

 

 

 

 

Ryx2 = 1 −

(1 − R2 ) = 1 −

(1 − 0, 7582) = 0, 728 .

 

 

 

 

n m

 

 

 

 

 

2

 

 

10 − 2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Шаг 2.

Среди

возможных

пар

объясняющих

переменных

x(2) ,

x( j) , j = 1,3 , выбирается пара, имеющая с зависимой переменной Y наиболее высокий коэффициент детерминации.

Рассмотрим пару ( x(2) , x(1) )

 

 

 

 

)

 

− 0, 2792x(1) + 0,0627 x(2) . Вычисление

 

Уравнение регрессии: y = 1,1124

 

данных для расчета индекса детерминации приведено в табл. 11.2.

 

 

 

 

 

Табл.11.2 Вычисление данных для расчета индекса детерминации

 

Просрочки

 

Стаж, лет

 

Срок

 

Y

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(Y Y )2

 

 

(Y Y )2

 

кредита

 

(X1)

 

кредита,

 

 

 

 

 

 

 

 

 

 

(шт.), (Y)

 

 

 

мес. (X2)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

7,5

 

12

 

-0,2290

 

0,0524

 

 

1,6900

 

0

 

4,5

 

12

 

0,6086

 

0,3704

 

 

1,6900

50

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]