Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

ПП _09 _Многомерные СВ

.pdf
Скачиваний:
10
Добавлен:
23.02.2015
Размер:
515.48 Кб
Скачать

 

 

r

=

 

 

KX Y

 

 

 

0,816 ,

 

 

 

 

 

 

1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X Y

 

 

DX1 DY1

 

 

 

 

 

 

 

 

 

1 1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

rX Y

0,817 , rX Y

0,815, rX Y 0,815 .

2

2

 

3

3

 

 

 

4

4

 

 

Выборочная линейная регрессия Y на X по выборке

(xi ,yi ), i =1,2,...n , определяется уравнением

 

 

 

 

+ rXY

 

DY (x X

),

y = β0 + β1x =Y

 

 

 

 

 

 

 

 

 

 

 

 

 

DX

 

 

 

 

где выборочные коэффициенты регрессии

 

 

β =

KXY

 

,

β

 

 

 

 

 

 

 

 

 

0

=Y β X

.

 

 

 

 

 

1

 

DX

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналогично определяется выборочная линейная регрессия X на Y :

 

 

 

+ rXY

 

DX

(y Y

),

 

x = β0′ + β1y = X

 

 

 

 

 

 

 

 

 

 

DY

 

 

 

 

 

где выборочные коэффициенты регрессии

 

 

=

KXY

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β1

DY

, β0

= X β1Y .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

β1

0,500

0,500

 

0,499

 

0,500

 

β0

3,000

2,996

 

3,007

 

3,004

 

β1

1,332

1,334

 

1,331

1,328

β0-0,991 -1,004 -0,982 -0,960

Можно заметить, что для всех наборов средние совпадают полностью, а остальные характеристики различаются на доли процента, поэтому линии регрессии будут практически одинаковы для всех наборов данных.

Ниже для всех наборов приведены поля рассеяния и прямые среднеквадратической линейной регрессии.

21

22

Сплошная прямая – регрессия Y на X , штриховая – регрессия X на Y .

Как видно из диаграмм, даже высокое значение коэффициента корреляции не позволяет утверждать, что величины связаны линейной зависимостью и что уравнение регрессии дает (приближенно) вид этой зависимости.

Анализ поля рассеяния позволяет более адекватно оценить ситуацию: если эти утверждения в какой-то мере справедливы для первых трех распределений, то применительно к четвертому распределению они абсолютно неверны. Скорее всего, данные четвертого (и третьего) примера искажены за счет грубой ошибки одного измерения.

Во втором примере более уместно искать связь между Y и X в виде

Y g (X ) =αX 2 + β X +γ

23