ПП _09 _Многомерные СВ
.pdf
|
|
r |
= |
|
|
KX Y |
|
|
|
≈ 0,816 , |
||||||||
|
|
|
|
|
|
1 1 |
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
||||||||||
|
|
X Y |
|
|
DX1 DY1 |
|
|
|
|
|
|
|
||||||
|
|
1 1 |
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
rX Y |
≈ 0,817 , rX Y |
≈ 0,815, rX Y ≈ 0,815 . |
||||||||||||||||
2 |
2 |
|
3 |
3 |
|
|
|
4 |
4 |
|
|
|||||||
Выборочная линейная регрессия Y на X по выборке |
||||||||||||||||||
(xi ,yi ), i =1,2,...n , определяется уравнением |
||||||||||||||||||
|
|
|
|
+ rXY |
|
DY (x − X |
), |
|||||||||||
y = β0 + β1x =Y |
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
DX |
|
|
|
|
|
где выборочные коэффициенты регрессии |
||||||||||||||||||
|
|
β = |
KXY |
|
, |
β |
|
|
|
|
|
|
||||||
|
|
|
0 |
=Y − β X |
. |
|||||||||||||
|
|
|
||||||||||||||||
|
|
1 |
|
DX |
|
|
|
|
1 |
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Аналогично определяется выборочная линейная регрессия X на Y :
|
|
|
+ rXY |
|
DX |
(y −Y |
), |
|||||||||
|
x = β0′ + β1′y = X |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
DY |
|
|
|
|
|
|
где выборочные коэффициенты регрессии |
||||||||||||||||
|
|
′ |
= |
KXY |
|
|
′ |
|
|
|
|
′ |
|
|
||
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
||||||||
|
|
β1 |
DY |
, β0 |
= X − β1Y . |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
β1 |
0,500 |
0,500 |
|
0,499 |
|
0,500 |
|||||||||
|
β0 |
3,000 |
2,996 |
|
3,007 |
|
3,004 |
|||||||||
|
β1′ |
1,332 |
1,334 |
|
1,331 |
1,328 |
β0′ -0,991 -1,004 -0,982 -0,960
Можно заметить, что для всех наборов средние совпадают полностью, а остальные характеристики различаются на доли процента, поэтому линии регрессии будут практически одинаковы для всех наборов данных.
Ниже для всех наборов приведены поля рассеяния и прямые среднеквадратической линейной регрессии.
21
22
Сплошная прямая – регрессия Y на X , штриховая – регрессия X на Y .
Как видно из диаграмм, даже высокое значение коэффициента корреляции не позволяет утверждать, что величины связаны линейной зависимостью и что уравнение регрессии дает (приближенно) вид этой зависимости.
Анализ поля рассеяния позволяет более адекватно оценить ситуацию: если эти утверждения в какой-то мере справедливы для первых трех распределений, то применительно к четвертому распределению они абсолютно неверны. Скорее всего, данные четвертого (и третьего) примера искажены за счет грубой ошибки одного измерения.
Во втором примере более уместно искать связь между Y и X в виде
Y g (X ) =αX 2 + β X +γ
23