task_74895
.pdf120 ГЛАВА 5. МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ КОРРЕЛЯЦИЯ
Множественный коэффициент корреляции можно получить на осно- ве вычисления определителей, составленных из парных коэффициентов корреляции:
|
1 |
r12 |
r13 |
... |
r1n |
|
|
1 |
r23 |
r24 |
... |
r2n |
|
|
|
|
|
|
|
r21 |
1 |
r23 |
... |
r2n |
|
|
r32 |
1 |
r34 |
... |
r3n |
|
|
|
|
|
|
* = |
|
= |
, R = |
* |
|
|
||||||||||||
r |
r |
1 |
... |
r |
, |
r |
r |
1 |
... |
r |
. (101) |
|||||||
|
||||||||||||||||||
|
31 |
32 |
|
|
3n |
|
|
42 |
43 |
|
|
4n |
|
|
|
|
|
|
|
. |
. |
. |
. |
. |
|
|
. |
. |
. |
. |
. |
|
|
|
|
|
|
|
rn1 |
rn2 |
rn3 |
... |
1 |
|
|
rn2 |
rn3 |
rn4 |
... |
1 |
|
|
|
|
|
Множественный коэффициент корреляции R обладает следующими свойствами:
1.R [0, 1].
2.Если R = 0 , то линейная корреляционная связь между признака-
ми Xi и Y отсутствует, но другая зависимость (функциональная или нели- нейная корреляционная) между ними может существовать.
3.Если R =1, то между факторами Xi и Y существует функцио-
нальная линейная зависимость.
Величину множественного коэффициента корреляции корректируют, так как при малом числе наблюдений значение R получается завышенным. Корректировку осуществляют по формуле:
ˆ |
|
2 |
|
n−1 |
|
|
|
R1.2.L.k = |
1 − (1 − R |
|
) |
|
, |
(102) |
|
|
n−k |
где ˆ — скорректированное значение R , n — число наблюдений, k —
R
число факторных признаков. Корректировка R не производится при усло- вии, если (n − k) / k ≥ 20. Для коэффициента множественной корреляции
определяют среднеквадратическую ошибку по формуле:
S |
R |
= |
|
1 |
. |
(103) |
|
|
|
||||||
n−1 |
|||||||
|
|
|
|
|
|||
Если выполняется неравенство R / SR > 3, то |
с вероятностью |
p = 0,99 можно считать R значимым.
Наряду с определением показателя, отражающего тесноту связи ре- зультативного признака Y с факторными, вместе взятыми, определяют степень влияния каждого фактора в отдельности на изменение результа- тивного фактора с помощью коэффициентов частной корреляции. Если уравнение множественной линейной регрессии между факторами X1 , X2
и Y имеет вид (90), то коэффициенты частной корреляции рассчитывают по формулам:
§ 23. Измерение тесноты множественной линейной корреляционной… 121
r |
|
|
|
|
= rYX1 -rX1X 2 ×rYX 2 , |
|||||
YX ( X |
2 |
) |
|
|
(1-r2 |
)(1-r2 |
) |
|
||
|
1 |
|
|
|
|
|
||||
|
|
|
|
|
|
|
X1X 2 |
YX2 |
|
|
r |
|
|
|
|
= rYX 2 -rX1X 2 ×rYX1 . |
|||||
YX2 |
( X1) |
|
|
(1-r2 |
)(1-r2 |
) |
|
|||
|
|
|
|
|
|
|
X1X 2 |
YX1 |
|
|
Если линейная регрессия имеет вид
Yˆ1.2.3 = a0 + a1 X1 + a2 X 2 + a3 X 3 ,
то частные коэффициенты корреляции находят по формуле:
rij.kh |
= |
|
rij.k -rih.k ×rjh.k |
|
|
, |
|
|
|
|
|
|
|||
(1-r2 |
)×(1-r2 |
) |
|||||
|
|
|
ih.k |
jh.k |
|
|
|
(104)
(105)
(106)
(107)
где i ¹ j ¹ k ¹ h =1,2,3,4 . Для общего случая
r |
= |
r12.34...( p−1) -r1p.34...( p−1) ×r2 p.34...( p− |
1) |
. |
(108) |
|||
|
|
|
||||||
1.2...p |
|
|
(1-r2 |
)(1-r2 |
) |
|
|
|
|
|
|
1p.34...( p−1) |
2 p.34...( p−1) |
|
|
|
|
Если в корреляционную модель включено k факторных признаков, воздействующих на результативный признак Y , то коэффициент частной корреляции, например, для первого фактора, можно определить по форму- ле:
|
|
|
r |
|
|
= |
|
ˆ2 |
.1.2...k |
|
|
|
|
|
|
|
1− SY2 |
, |
(190) |
||||
|
|
|
Y1.2...k |
|
|
SY .2.3...k |
|||||
|
|
|
|
|
ˆ |
|
|
|
|||
где |
|
|
|
|
|
|
|
|
|
|
|
ˆ 2 |
1 |
å(yi − y1.2...k ) |
2 |
|
|
|
|
|
|
|
|
SY .1.2...k |
= |
|
|
— средний |
квадрат отклонений |
фактиче- |
|||||
n−1 |
|
||||||||||
|
|
|
ˆ |
|
|
|
|
|
|
|
|
ских значений признака Y от значений, вычисленных по формуле с учетом всех факторных признаков;
ˆ 2 |
1 |
å(yi − yˆ2.3...k ) |
2 |
|
|
SY .2.3...k |
= |
|
|
— средний квадрат отклонений фактиче- |
|
n−1 |
|
ских значений признака Y от значений, вычисленных по формуле, вклю- чающей все факторы кроме первого.
Коэффициенты частной корреляции изменяются от 0 до 1 и облада- ют всеми свойствами парного коэффициента корреляции. Коэффициенту частной корреляции приписывается тот же знак, который имеет в уравне- нии множественной линейной регрессии коэффициент регрессии аi при
соответствующем факторном признаке Xi .
§ 24. Проверка адекватности модели множественной линейной корреляции
Адекватность модели означает не только количественное, но, прежде всего, качественное соответствие описания объекта. Для проверки соответ- ствия полученного уравнения множественной линейной регрессии опыт- ным данным используют коэффициент множественной регрессии R . Если R = 0 , то модель полностью не адекватна. Если R = 1, то модель в общем и в целом воспроизводит свойства моделируемого объекта. Количественным
показателем адекватности модели служит коэффициент детерминации R2 , который показывает долю дисперсии, объясняемой данной моделью в об- щей дисперсии. Адекватность построенной модели может быть проверена по критерию Фишера — Снедекора. Для этого вычисляют [4] статистику FH по формуле:
F = |
R2 (n− p−1) |
, |
(110) |
|
(1−R2 ) p |
||||
н |
|
|
где n — объем выборки; p — число факторных признаков, включенных в
модель. Затем находят при заданном уровне значимости α и числах степе- ней свободы k1 = p , k2 = n − p −1 по таблице критических точек распреде-
ления Фишера Fт . Если Fн > Fт , то уравнение регрессии согласуется с опытными данными, если же Fн < Fт , то уравнение регрессии не согласу-
ется с данными эксперимента.
Адекватность модели множественной корреляции можно определять по средней ошибке аппроксимации
ε = p ê |
Y |
ú ×100%. |
(111) |
||||
1 |
é |
|
Y −Yˆ1.2.L. p |
ù |
|
||
|
|
ë |
|
|
|
û |
|
§ 25. Экономическая интерпретация уравнения регрессии
Заключительным этапом, завершающим построение корреляционной модели, является интерпретация полученного уравнения регрессии, т.е. пе- ревод его с языка статистики и математики на язык экономики. Интерпре- тация начинается с выяснения, как каждый факторный признак, входящий в модель, влияет на величину результативного признака. Чем больше ве- личина коэффициента ai регрессии, тем сильнее фактор Xi влияет на ре-
зультативный признак Y. Знаки коэффициентов регрессии ai говорят о ха- рактере влияния на результативный признак. Если коэффициент ai имеет знак (+), то с увеличением данного фактора Xi результативный фактор Y возрастает. Если коэффициент ai имеет знак (–), то с увеличением данного фактора Xi результативный признак уменьшается. Интерпретация знаков
зависит от экономической сущности результативного признака. Если вели-
чина результативного признака должна изменяться в сторону увеличения (объем реализованной продукции, фондоотдача, производительность труда и т.д.), то плюсовые знаки коэффициентов ai свидетельствуют о положи-
тельном влиянии соответствующих факторов. Если величина результатив-
§ 25. Экономическая интерпретация уравнения регрессии |
125 |
К о н т р о л ь н ы е в о п р о с ы : |
|
1.Рассказать о механизме включения факторных признаков в модель множественной линейной корреляции.
2.Как найти коэффициенты a0 , a1, a2 уравнения регрессии
Yˆ1.2 = a0 + a1 X1 + a2 X 2 ?
3.Записать модельное уравнение множественной линейной регрессии для случая, когда в модель включено четыре фактора.
4.Записать систему нормальных уравнений для уравнения
Yˆ1.2.3 = a0 + a1 X1 + a2 X 2 + a3 X 3 .
5.Как определяется надежность коэффициентов уравнения множест- венной линейной регрессии?
6.Как решается вопрос об измерении тесноты связи между факторны- ми и результативными признаками в случае множественной линейной кор- реляции?
7.Как осуществляется корректировка множественного коэффициента корреляции?
8.Как определить степень влияния каждого факторного признака в от- дельности, включенного в модельное уравнение множественной линейной регрессии, на изменение результативного признака?
9.Рассказать, как осуществляется проверка адекватности модели мно- жественной линейной корреляции.
10.Рассказать об экономической интерпретации уравнения множест- венной линейной регрессии.
§ 26. Лабораторная работа № 6. Построение модели множественной линейной корреляции
Ц е л ь р а б о т ы: овладение способами построения модели множест- венной линейной корреляции, выработка умений и навыков нахождения параметров уравнения, оценки надежности уравнения регрессии и его па- раметров, проведения экономической интерпретации полученных резуль- татов.
Со д е р ж а н и е р а б о т ы: на основании опытных данных требуется:
1.Определить форму связи между факторными и результативными признаками, построив корреляционные поля на плоскости для каждой па- ры факторов. Записать уравнение множественной регрессии.
2.Произвести отбор факторов, включаемых в модель.
3.Определить тесноту связи между факторами, включенными в мо- дель множественной линейной корреляции.
4.Найти оценки уравнения регрессии по методу наименьших квад-
ратов.
5.Проверить адекватность полученного модельного уравнения рег- рессии тремя способами:
– с помощью коэффициента детерминации R2 ;
§ 26. Лабораторная работа № 6 |
127 |
–по критерию Фишера;
–с помощью средней ошибки аппроксимации.
6.Определить воздействие неучтенных в модели факторов.
7.Дать экономическую интерпретацию найденных оценок уравне- ния регрессии.
З а д а ч а. Исходные данные для признаков X1 , X2 , X3 , Y — для различных нефтегазодобывающих управлений — приведены в табл. 40:
Т а б л и ц а 4 0
Признаки |
|
|
Значение признаков на различных НГДУ |
|
|
|||||
X1 |
0,92 |
0,93 |
0,89 |
0,90 |
0,90 |
0,89 |
0,92 |
0,91 |
0,93 |
0,89 |
X 2 |
45 |
47 |
42 |
46 |
43 |
45 |
48 |
46 |
48 |
44 |
X3 |
69 |
71 |
64 |
66 |
65 |
63 |
68 |
66 |
69 |
65 |
Y |
35 |
36 |
31 |
33 |
34 |
32 |
38 |
34 |
37 |
33 |
В таблице обозначено: X1 — коэффициент эксплуатации скважин; X2 — дебит скважин (тн/сут.); X3 — уровень автоматизации труда (%);
Y — производительность труда (тн/чел.).
Определим форму связи. Для чего строим корреляционные поля (рис. 13 – 18), по которым можно предположить, что зависимость между факторными признаками X1, X 2 , X3 и результативным признаком Y мо-
жет носить линейный характер. Решим вопрос о включении факторных признаков X1, X 2 , X3 в уравнение линейной регрессии. Найдем коэффи-
циенты парной корреляции по формуле (53). Предварительно составим расчетную табл. 41. Пользуясь табл. 41 и формулами (49) — (50), находим:
ˆ 2 |
1 |
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ˆ |
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
S X1 |
= |
n−1 |
[(X1 |
− X1 ) |
|
] = 0,00236 / 9 = 0,000262 , |
S X1 = 0,0162 . |
||||||||||||||||||||||||
|
ˆ 2 |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
ˆ |
|
||
|
|
= |
|
[(X 2 |
|
− X 2 ) |
] = |
|
|
= 2,0494. |
|||||||||||||||||||||
|
S X |
2 |
|
- |
|
|
37,8 / 9 = 4,2 , SX |
||||||||||||||||||||||||
|
|
|
|
|
n 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
||
|
|
|
ˆ 2 |
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
ˆ |
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
S X 3 |
= |
n−1 |
[(X 3 |
− |
X 3 ) |
|
] = 58,4 / 9 = 6,4 (8) , |
S X 3 = 2,5473. |
|||||||||||||||||||||
|
|
|
|
ˆ 2 |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
ˆ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
|
SY |
|
= |
n−1 |
|
[(Y − Y ) |
|
] = 44,1/ 9 = 4,9 , SY = 2,2136. |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
= |
|
|
- |
|
1 |
|
2 |
= |
|
|
= 0,69 . |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
X1X 2 |
41,246-0,908×45,4 |
|||||||||||||||||
|
|
|
|
|
|
rX |
|
|
|
|
X |
X |
|||||||||||||||||||
|
|
|
|
|
|
X |
2 |
|
|
|
ˆ |
|
ˆ |
|
|
|
|
0,0162×2,0494 |
|||||||||||||
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
SX1 |
×SX 2 |
|
|
|
|
|
|
|