Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

task_74895

.pdf
Скачиваний:
455
Добавлен:
22.03.2016
Размер:
5.67 Mб
Скачать

120 ГЛАВА 5. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ КОРРЕЛЯЦИЯ

Множественный коэффициент корреляции можно получить на осно- ве вычисления определителей, составленных из парных коэффициентов корреляции:

 

1

r12

r13

...

r1n

 

 

1

r23

r24

...

r2n

 

 

 

 

 

 

r21

1

r23

...

r2n

 

 

r32

1

r34

...

r3n

 

 

 

 

 

* =

 

=

, R =

*

 

 

r

r

1

...

r

,

r

r

1

...

r

. (101)

 

 

31

32

 

 

3n

 

 

42

43

 

 

4n

 

 

 

 

 

 

.

.

.

.

.

 

 

.

.

.

.

.

 

 

 

 

 

 

rn1

rn2

rn3

...

1

 

 

rn2

rn3

rn4

...

1

 

 

 

 

 

Множественный коэффициент корреляции R обладает следующими свойствами:

1.R [0, 1].

2.Если R = 0 , то линейная корреляционная связь между признака-

ми Xi и Y отсутствует, но другая зависимость (функциональная или нели- нейная корреляционная) между ними может существовать.

3.Если R =1, то между факторами Xi и Y существует функцио-

нальная линейная зависимость.

Величину множественного коэффициента корреляции корректируют, так как при малом числе наблюдений значение R получается завышенным. Корректировку осуществляют по формуле:

ˆ

 

2

 

n1

 

 

 

R1.2.L.k =

1 (1 R

 

)

 

,

(102)

 

nk

где ˆ скорректированное значение R , n число наблюдений, k

R

число факторных признаков. Корректировка R не производится при усло- вии, если (n k) / k 20. Для коэффициента множественной корреляции

определяют среднеквадратическую ошибку по формуле:

S

R

=

 

1

.

(103)

 

 

n1

 

 

 

 

 

Если выполняется неравенство R / SR > 3, то

с вероятностью

p = 0,99 можно считать R значимым.

Наряду с определением показателя, отражающего тесноту связи ре- зультативного признака Y с факторными, вместе взятыми, определяют степень влияния каждого фактора в отдельности на изменение результа- тивного фактора с помощью коэффициентов частной корреляции. Если уравнение множественной линейной регрессии между факторами X1 , X2

и Y имеет вид (90), то коэффициенты частной корреляции рассчитывают по формулам:

§ 23. Измерение тесноты множественной линейной корреляционной121

r

 

 

 

 

= rYX1 -rX1X 2 ×rYX 2 ,

YX ( X

2

)

 

 

(1-r2

)(1-r2

)

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

X1X 2

YX2

 

 

r

 

 

 

 

= rYX 2 -rX1X 2 ×rYX1 .

YX2

( X1)

 

 

(1-r2

)(1-r2

)

 

 

 

 

 

 

 

 

X1X 2

YX1

 

 

Если линейная регрессия имеет вид

Yˆ1.2.3 = a0 + a1 X1 + a2 X 2 + a3 X 3 ,

то частные коэффициенты корреляции находят по формуле:

rij.kh

=

 

rij.k -rih.k ×rjh.k

 

 

,

 

 

 

 

 

(1-r2

)×(1-r2

)

 

 

 

ih.k

jh.k

 

 

 

(104)

(105)

(106)

(107)

где i ¹ j ¹ k ¹ h =1,2,3,4 . Для общего случая

r

=

r12.34...( p−1) -r1p.34...( p−1) ×r2 p.34...( p−

1)

.

(108)

 

 

 

1.2...p

 

 

(1-r2

)(1-r2

)

 

 

 

 

 

 

1p.34...( p−1)

2 p.34...( p−1)

 

 

 

 

Если в корреляционную модель включено k факторных признаков, воздействующих на результативный признак Y , то коэффициент частной корреляции, например, для первого фактора, можно определить по форму- ле:

 

 

 

r

 

 

=

 

ˆ2

.1.2...k

 

 

 

 

 

 

 

1SY2

,

(190)

 

 

 

Y1.2...k

 

 

SY .2.3...k

 

 

 

 

 

ˆ

 

 

 

где

 

 

 

 

 

 

 

 

 

 

 

ˆ 2

1

å(yi − y1.2...k )

2

 

 

 

 

 

 

 

SY .1.2...k

=

 

 

средний

квадрат отклонений

фактиче-

n−1

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

ских значений признака Y от значений, вычисленных по формуле с учетом всех факторных признаков;

ˆ 2

1

å(yi − yˆ2.3...k )

2

 

SY .2.3...k

=

 

 

средний квадрат отклонений фактиче-

n−1

 

ских значений признака Y от значений, вычисленных по формуле, вклю- чающей все факторы кроме первого.

Коэффициенты частной корреляции изменяются от 0 до 1 и облада- ют всеми свойствами парного коэффициента корреляции. Коэффициенту частной корреляции приписывается тот же знак, который имеет в уравне- нии множественной линейной регрессии коэффициент регрессии аi при

соответствующем факторном признаке Xi .

§ 24. Проверка адекватности модели множественной линейной корреляции

Адекватность модели означает не только количественное, но, прежде всего, качественное соответствие описания объекта. Для проверки соответ- ствия полученного уравнения множественной линейной регрессии опыт- ным данным используют коэффициент множественной регрессии R . Если R = 0 , то модель полностью не адекватна. Если R = 1, то модель в общем и в целом воспроизводит свойства моделируемого объекта. Количественным

показателем адекватности модели служит коэффициент детерминации R2 , который показывает долю дисперсии, объясняемой данной моделью в об- щей дисперсии. Адекватность построенной модели может быть проверена по критерию Фишера Снедекора. Для этого вычисляют [4] статистику FH по формуле:

F =

R2 (np1)

,

(110)

(1R2 ) p

н

 

 

где n объем выборки; p число факторных признаков, включенных в

модель. Затем находят при заданном уровне значимости α и числах степе- ней свободы k1 = p , k2 = n p 1 по таблице критических точек распреде-

ления Фишера Fт . Если Fн > Fт , то уравнение регрессии согласуется с опытными данными, если же Fн < Fт , то уравнение регрессии не согласу-

ется с данными эксперимента.

Адекватность модели множественной корреляции можно определять по средней ошибке аппроксимации

ε = p ê

Y

ú ×100%.

(111)

1

é

 

Y Yˆ1.2.L. p

ù

 

 

 

ë

 

 

 

û

 

§ 25. Экономическая интерпретация уравнения регрессии

Заключительным этапом, завершающим построение корреляционной модели, является интерпретация полученного уравнения регрессии, т.е. пе- ревод его с языка статистики и математики на язык экономики. Интерпре- тация начинается с выяснения, как каждый факторный признак, входящий в модель, влияет на величину результативного признака. Чем больше ве- личина коэффициента ai регрессии, тем сильнее фактор Xi влияет на ре-

зультативный признак Y. Знаки коэффициентов регрессии ai говорят о ха- рактере влияния на результативный признак. Если коэффициент ai имеет знак (+), то с увеличением данного фактора Xi результативный фактор Y возрастает. Если коэффициент ai имеет знак (–), то с увеличением данного фактора Xi результативный признак уменьшается. Интерпретация знаков

зависит от экономической сущности результативного признака. Если вели-

чина результативного признака должна изменяться в сторону увеличения (объем реализованной продукции, фондоотдача, производительность труда и т.д.), то плюсовые знаки коэффициентов ai свидетельствуют о положи-

тельном влиянии соответствующих факторов. Если величина результатив-

124 ГЛАВА 5. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ КОРРЕЛЯЦИЯ

ного признака изменяется в сторону снижения (себестоимость продукции, материалоемкость, простои оборудования и т.д.), то в этом случае положи- тельное влияние на результативный признак будут оказывать факторы, коэффициенты которых отрицательны.

Математическая формулировка задачи. Выбор результативного

и факторных признаков

Выбор вероятностной регрессионной модели

Оценка параметров уравнения регрессии

Предварительное планирование экспе- римента. Постановка эксперимента или

сбор информации

Оценка согласованности принятой регрессионной модели

с эмпирическими данными

Нет Цель достигнута?

Да

Регрессионный анализ: построение доверительных интервалов для ai , M ( Y / X), проверка гипотез относительно параметров регрессионной модели

Практическое применение полученного уравнения регрессии для управления производством или для предсказания

Рис. 12. Алгоритм построения многофакторной модели: объяснение управ- ление предсказание.

Если экономический анализ подсказывает, что факторный признак должен влиять положительно, а коэффициент при нем имеет знак (–), то необходимо проверить расчеты. Так получается за счет допущенных оши- бок при решении и в силу наличия взаимосвязей между факторными при- знаками, включенными в модель, влияющих в совокупности на результа- тивный признак.

При построении регрессионной модели можно рекомендовать алгоритм выполнения операций, представленный на рис.12.

§ 25. Экономическая интерпретация уравнения регрессии

125

К о н т р о л ь н ы е в о п р о с ы :

 

1.Рассказать о механизме включения факторных признаков в модель множественной линейной корреляции.

2.Как найти коэффициенты a0 , a1, a2 уравнения регрессии

Yˆ1.2 = a0 + a1 X1 + a2 X 2 ?

3.Записать модельное уравнение множественной линейной регрессии для случая, когда в модель включено четыре фактора.

4.Записать систему нормальных уравнений для уравнения

Yˆ1.2.3 = a0 + a1 X1 + a2 X 2 + a3 X 3 .

5.Как определяется надежность коэффициентов уравнения множест- венной линейной регрессии?

6.Как решается вопрос об измерении тесноты связи между факторны- ми и результативными признаками в случае множественной линейной кор- реляции?

7.Как осуществляется корректировка множественного коэффициента корреляции?

8.Как определить степень влияния каждого факторного признака в от- дельности, включенного в модельное уравнение множественной линейной регрессии, на изменение результативного признака?

9.Рассказать, как осуществляется проверка адекватности модели мно- жественной линейной корреляции.

10.Рассказать об экономической интерпретации уравнения множест- венной линейной регрессии.

§ 26. Лабораторная работа № 6. Построение модели множественной линейной корреляции

Ц е л ь р а б о т ы: овладение способами построения модели множест- венной линейной корреляции, выработка умений и навыков нахождения параметров уравнения, оценки надежности уравнения регрессии и его па- раметров, проведения экономической интерпретации полученных резуль- татов.

Со д е р ж а н и е р а б о т ы: на основании опытных данных требуется:

1.Определить форму связи между факторными и результативными признаками, построив корреляционные поля на плоскости для каждой па- ры факторов. Записать уравнение множественной регрессии.

2.Произвести отбор факторов, включаемых в модель.

3.Определить тесноту связи между факторами, включенными в мо- дель множественной линейной корреляции.

4.Найти оценки уравнения регрессии по методу наименьших квад-

ратов.

5.Проверить адекватность полученного модельного уравнения рег- рессии тремя способами:

с помощью коэффициента детерминации R2 ;

§ 26. Лабораторная работа № 6

127

по критерию Фишера;

с помощью средней ошибки аппроксимации.

6.Определить воздействие неучтенных в модели факторов.

7.Дать экономическую интерпретацию найденных оценок уравне- ния регрессии.

З а д а ч а. Исходные данные для признаков X1 , X2 , X3 , Y для различных нефтегазодобывающих управлений приведены в табл. 40:

Т а б л и ц а 4 0

Признаки

 

 

Значение признаков на различных НГДУ

 

 

X1

0,92

0,93

0,89

0,90

0,90

0,89

0,92

0,91

0,93

0,89

X 2

45

47

42

46

43

45

48

46

48

44

X3

69

71

64

66

65

63

68

66

69

65

Y

35

36

31

33

34

32

38

34

37

33

В таблице обозначено: X1 коэффициент эксплуатации скважин; X2 дебит скважин (тн/сут.); X3 уровень автоматизации труда (%);

Y производительность труда (тн/чел.).

Определим форму связи. Для чего строим корреляционные поля (рис. 13 – 18), по которым можно предположить, что зависимость между факторными признаками X1, X 2 , X3 и результативным признаком Y мо-

жет носить линейный характер. Решим вопрос о включении факторных признаков X1, X 2 , X3 в уравнение линейной регрессии. Найдем коэффи-

циенты парной корреляции по формуле (53). Предварительно составим расчетную табл. 41. Пользуясь табл. 41 и формулами (49) — (50), находим:

ˆ 2

1

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S X1

=

n−1

[(X1

− X1 )

 

] = 0,00236 / 9 = 0,000262 ,

S X1 = 0,0162 .

 

ˆ 2

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

ˆ

 

 

 

=

 

[(X 2

 

− X 2 )

] =

 

 

= 2,0494.

 

S X

2

 

-

 

 

37,8 / 9 = 4,2 , SX

 

 

 

 

 

n 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

ˆ 2

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S X 3

=

n−1

[(X 3

X 3 )

 

] = 58,4 / 9 = 6,4 (8) ,

S X 3 = 2,5473.

 

 

 

 

ˆ 2

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SY

 

=

n−1

 

[(Y − Y )

 

] = 44,1/ 9 = 4,9 , SY = 2,2136.

 

 

 

 

 

 

 

 

 

 

 

 

=

 

 

-

 

1

 

2

=

 

 

= 0,69 .

 

 

 

 

 

 

 

 

 

 

 

 

 

X1X 2

41,246-0,908×45,4

 

 

 

 

 

 

rX

 

 

 

 

X

X

 

 

 

 

 

 

X

2

 

 

 

ˆ

 

ˆ

 

 

 

 

0,0162×2,0494

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

SX1

×SX 2

 

 

 

 

 

 

 

Т а б л и ц а 41

Факторы

 

 

 

 

 

 

 

Значения факторов

 

 

 

 

 

 

Сумма

Среднее

X1

0,92

 

0,93

 

0,89

 

0,9

 

0,9

 

0,89

 

0,92

 

0,91

 

0,93

 

9,08

0,908

 

 

 

 

 

 

 

 

0,89

X2

45

 

47

 

42

 

46

 

43

 

45

 

48

 

46

 

48

44

454

45,4

X3

69

 

71

 

64

 

66

 

65

 

63

 

68

 

66

 

69

65

666

66,6

Y

35

 

36

 

31

 

33

 

34

 

32

 

38

 

34

 

37

33

343

34,3

X1Y

32,2

 

33,48

 

27,59

 

29,7

 

30,6

 

28,48

 

34,96

 

30,94

 

34,41

29,37

311,73

31,173

X2Y

1575

 

1692

 

1302

 

1518

 

1462

 

1440

 

1824

 

1564

 

1776

1452

15605

1560,5

X3Y

2415

 

2556

 

1984

 

2178

 

2210

 

2016

 

2584

 

2244

 

2553

2145

22885

2288,5

X1X2

41,4

 

43,71

 

37,38

 

41,4

 

38,7

 

40,05

 

44,16

 

41,86

 

44,64

39,16

412,46

41,246

X2X3

3105

 

3337

 

3688

 

3036

 

2795

 

2835

 

3264

 

3036

 

3312

2860

302683

3026,8

X3X1

63,48

 

66,03

 

56,96

 

59,4

 

58,5

 

56,07

 

62,56

 

60,06

 

64,17

57,85

605,08

60,508

X12

0,8464

 

0,6849

 

0,7921

 

0,81

 

0,81

 

0,7921

 

0,8464

 

0,8281

 

0,6849

0,7921

8,247

 

X22

2025

 

2209

 

1764

 

2116

 

1849

 

2025

 

2304

 

2116

 

2304

1936

20648

 

X32

4761

 

5041

 

4096

 

4356

 

4225

 

3969

 

4624

 

4356

 

4761

4225

44414

 

106 (X1 X

1)2

144

 

484

 

324

 

64

 

64

 

324

 

144

 

4

 

484

324

2360

 

(X2 X

2)2

0,16

 

2,56

 

11,56

 

0,36

 

5,76

 

0,16

 

6,76

 

0,36

 

6,76

1,96

36,4

 

(X3 X3)2

5,76

 

19,36

 

6,76

 

0,36

 

2,56

 

12,96

 

1,96

 

0,36

 

5,76

2,56

58,4

 

(Y Y

)2

 

0,49

 

2,89

 

10,89

 

1,69

 

0,09

 

5,29

 

13,69

 

0,09

 

7,29

1,69

44,1

 

КОРРЕЛЯЦИЯ ЛИНЕЙНАЯ МНОЖЕСТВЕННАЯ .5 ГЛАВА 128

§ 26. Лабораторная работа № 6

129

r

 

X

=

 

 

X1X 3

-

X1×X3

 

 

=

 

60,508-0,908×66,6

= 0,85

,

 

 

 

 

 

 

 

 

 

 

 

 

×

 

X

1

3

 

 

 

ˆ

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

SX

1 SX 3

 

 

 

0,0162 2,5473

 

 

 

 

 

 

 

 

=

 

 

 

 

×

 

 

 

=

 

= 0,60 .

 

 

 

 

rX

 

 

X

 

 

 

X 2

X3

 

3026,8-45,4×66,6

 

 

 

 

2

 

ˆ

 

 

ˆ

 

2,0494×2,5473

 

 

 

 

 

 

3

 

S X 2

×SX 3

 

 

 

 

 

 

 

 

По найденным коэффициентам парной корреляции видно, что силь- но коррелируют между собой факторы X1 или X3 . Для решения вопроса о

X2

X3

X1

X2

Рис.13. Рис.16.

X3

Y

X1

X2

Рис.14. Рис.17.

Y Y

X1

X3

Рис.15. Рис.18.

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]