Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Tip_rasch_ver.pdf
Скачиваний:
691
Добавлен:
31.03.2015
Размер:
3.46 Mб
Скачать

2.14.2. Линейная корреляция

Корреляция называется линейной, если линия регрессии одной величины на другую является прямой. В противном случае говорят о нелинейной корреляции.

Пусть линия регрессии имеет видM (Y / X ) = rx + b. Согласно свойству линии регрессии, должен быть минимален средний квадрат отклонений Y от этой линии, т.е. минимальной должна быть величина

М (Y b rх)2 =F (b,r),

причем ее минимальное значение равно s2 (Y / x) .

 

 

 

Параметры b и r

можно

найти

 

из

условия минимума

функции

F (b,r). Необходимые условия экстремума дают систему уравнений

 

ìrМ ( Х 2 ) + ( X ) = М ( ХY ),

 

 

í

 

 

 

 

 

 

 

 

 

 

 

 

îrМ ( X ) + b = М (Y ),

 

 

 

 

 

 

 

решения которой имеют вид

 

 

 

 

 

 

 

 

 

r = r

sY

, b = M (Y ) – r

 

sY

M ( X ),

(2.14.3)

 

 

ху s

Х

 

ху

 

s

Х

 

 

 

 

где rху –– коэффициент

 

 

 

 

 

 

 

 

 

корреляции (2.14.1).

Если

выражения (2.14.3)

подставить в F (b,r) , то после ряда преобразований получается, что

 

 

s2=(Y / X )

s2 (Y )(1 – r2 ).

 

(2.14.4)

 

 

 

 

 

 

 

 

ХY

 

 

 

Из соотношений (2.14.3) и (2.14.4)

можно

извлечь информацию о

свойствах коэффициента корреляции.

 

 

 

 

 

 

 

 

1. Так как s2 (Y / X ) ³ 0 и s2 (Y ) ³ 0 , то 1 – r2

³ 0 , откуда -1 £ r

£1.

 

 

 

 

 

 

 

 

 

ХY

 

ху

 

2. Если rху = 0 , то

в силу(2.14.3)

и

 

угловой

коэффициент

линии

регрессии равен нулю. Линия регрессии параллельна осиОX. В этом случае говорят, что величины некоррелированы, так как среднее значение Y не изменяется при измененииX. Отсутствие корреляционной зависимости не всегда означает независимость величин. Например, при постоянном

среднем

значении Y

может

изменяться

разброс

значений

относительно

среднего (см. рис. 2.14.2, на

котором

точками

изображены

возможные

положения случайной точки).

 

 

 

 

 

3. Из (2.14.3) следует, что угловой коэффициент линии регрессии r и

коэффициент

корреляции

имеют одинаковые

знаки. Если

rху > 0 , то

говорят,

что

величины коррелированы

положительно.

В этом случае

большему значению величины X соответствует большее среднее значение

Y (см.

рис.

2.14.3).

Еще раз подчеркнем, что

речь

идет

именно об

увеличении среднего значения Y. В отдельных опытах большемуX может соответствовать меньшее Y. Например, положительно коррелированы рост

143

и вес человека, возраст и высота дерева, качество сырья и качество продукции и т.д.

Рис. 2.14.2

Рис. 2.14.3

Если rху < 0 , то говорят, что величины коррелированы отрицательно.

Это означает, что большему значению одной величины соответствует в среднем меньшее значение другой. Например, число пропусков занятий и успеваемость коррелированы отрицательно.

4. Если r = ±1, то из (2.14.4) следует, что s2

(Y / X ) = 0 . В этом

ху

 

случае разброса относительно линии регрессии нет. Между величинами существует линейная функциональная зависимость.

5.

Из (2.14.4) следует, что s2 (Y / X ) ® 0 при | r

|®1. Значит, чем

 

ХY

 

больше

по модулю коэффициент корреляции, тем

теснее прилегают

значения Y к линии регрессии, тем меньше средний квадрат ошибки прогноза Y по наблюдаемому значениюX. На рис. 2.14.4 для сравнения показан разброс положений случайной точки(X,Y) относительно линии регрессии при двух разных значениях коэффициента корреляции rХ(1)Y < rХ(Y2) .

Рис. 2.14.4

144

Коэффициент корреляции служит мерой линейной

 

зависимости

между

величинами. Он

 

показывает

насколько

статистическая

зависимость близка к функциональной.

 

 

 

 

 

Отметим, что в силу(2.14.3) уравнение линии регрессии можно

записать в виде

sY=X + M (Y ) – r

sY

 

 

 

 

Y = rX + b r

M ( X )

 

 

 

 

 

 

 

 

хy s

Х

 

 

хy

s

Х

 

 

 

или

 

 

 

 

 

 

 

 

 

 

 

 

Y - M (Y )

 

 

 

 

X - M ( X )

 

 

 

 

 

 

 

 

= r

 

.

 

 

 

 

(2.14.5)

 

 

 

 

 

 

 

 

 

 

sY

 

XY

 

sX

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 2.83. Случайные

величиныX и

 

Y

независимы

и имеют

одинаковое распределение с математическим ожиданием m и дисперсией s2.

1)Найти коэффициент корреляции случайных величин U = aX + bY

иV = aX bY .

2)Найти коэффициент корреляции между случайными величинами

Z = X + Y и X.

Решение. 1) По определению ruv = M [(U - MU )(V - MV )] . Найдем s(U )s(V )

необходимые для вычисления ruv величины. По свойствам математического ожидания и дисперсии имеем:

M (U ) = M (aX + bY )= a M (X ) + bM =(Y ) am + bm, M (V ) = M (aX bY ) aM=( X ) – bM (Y ) аm= bm,

o

U =U -M (U=) aX + bY - M (aX + bY ) = aX + bY - (am + bm) =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

o

 

o

 

 

 

 

 

 

 

 

 

= a( X - m) + b(Y - m) =a X + bY .

 

 

 

 

 

 

 

o

 

 

 

 

o

 

o

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Аналогично, V =V =M (V )

a X - bY ,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M [(U - MU )(V - MV )]=

 

o o

 

 

 

 

 

 

o

 

 

o

 

o

 

o

 

M (U=V )

M [(a X + bY )(a X - bY )] =

 

 

 

 

o

 

o

 

 

 

o

 

 

 

 

 

 

o

 

 

 

 

 

 

 

= M (a2 X 2 - b2 Y 2 ) =a2 M X 2 - b2 M Y 2 =

 

 

 

 

 

2

M ( X - m)

2

2

M (Y - m)

2

= a

2

s

2

 

2

s

2

 

 

2

 

2

- b

2

).

= a

 

- b

 

 

 

b

 

 

s=(a

 

 

Так как X и Y независимы, то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D(U ) = D(aX + bY ) = a2 D( X ) + b2 D(=Y ) s2 (a2 + b2 ),

 

D(V ) = D(aX - bY ) = a2 D( X ) + b2 D(=Y ) s2 (a2 + b2 ),

 

 

В результате имеем

s2 (a2 -b2 )

 

 

 

 

 

a2

-b2

 

 

 

 

 

 

 

 

 

r =

 

 

 

 

 

=

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a2

+b2

 

 

 

 

 

 

 

 

uv

 

 

s a2 + b2 s a2 + b2

 

 

 

 

 

 

 

 

 

 

 

145

2) Вычислим величины, которые необходимы для использования формулы

 

 

 

 

 

 

 

 

 

 

 

r =

M ( XZ ) - M ( X )M (Z )

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

XZ

 

 

 

 

 

 

 

 

 

 

 

 

sX sZ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Так как X и Y независимы, то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M (Z ) = M ( X + Y )= M ( X ) + M =(Y ) m + m = 2m,

 

 

 

 

 

 

 

 

 

D(Z ) = D( X + Y=) D( X ) + D=(Y ) s2 + s2 =2s2 ,

 

 

 

 

 

 

M ( XZ ) = M[ X ( X + Y )] M =( X 2 ) + M ( XY ) = M ( X 2 ) + M ( X )M=(Y )

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

= M ( X 2 ) – m2 + 2=m2

 

 

s2 + 2m2.

 

 

 

 

 

 

 

 

 

Поэтому r

 

 

 

 

s2 + 2m2

 

- m × 2m 1

 

» 0,71.

 

 

 

 

 

 

 

 

 

 

 

 

 

=

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

XZ

 

 

 

 

 

s × s

2

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ответ.

r

=

 

a2

-b2

 

;

r

 

 

 

=

 

 

1

 

 

» 0,71.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a2

+b2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

uv

 

 

 

 

XZ

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача

2.83.

 

 

Случайные

 

 

величиныX и Y независимы

и

имеют

одинаковое распределение с математическим ожиданиемm и дисперсией

s2. Найдите коэффициент корреляции случайных

величинU = aX + bY и

V = cX dY.

 

Найдите

 

 

коэффициент

 

 

 

корреляции

 

случайных

величин

U = aX + bY и X. (См. пример 2.83 и исходные данные.)

 

 

 

 

 

 

 

 

 

Исходные данные к задаче 2.83.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a

 

b

 

 

c

 

 

 

 

d

 

 

a

 

 

 

 

 

b

 

 

 

c

 

d

 

a

b

 

c

 

 

d

 

1

4

 

3

 

 

2

 

 

 

 

1

 

 

11

 

 

 

1

 

 

3

 

 

 

1

 

1

 

21

 

1

–1

 

2

 

 

1

 

2

1

 

2

 

 

1

 

 

 

 

2

 

 

12

 

 

 

1

 

 

1

 

 

 

3

 

1

 

22

 

1

1

 

–2

 

1

 

3

2

 

1

 

 

2

 

 

 

 

1

 

 

13

 

 

 

1

 

 

1

 

 

 

1

 

3

 

23

 

1

–2

 

2

 

 

1

 

4

2

 

2

 

 

2

 

 

 

 

2

 

 

14

 

 

 

3

 

 

1

 

 

 

1

 

1

 

24

 

1

–2

 

–2

 

1

 

5

1

 

2

 

 

2

 

 

 

 

1

 

 

15

 

 

 

4

 

 

1

 

 

 

1

 

1

 

25

 

-1

2

 

2

 

 

–1

 

6

2

 

1

 

 

1

 

 

 

 

2

 

 

16

 

 

 

1

 

 

4

 

 

 

1

 

1

 

26

 

1

–3

 

3

 

 

1

 

7

1

 

2

 

 

1

 

 

 

 

1

 

 

17

 

 

 

1

 

 

1

 

 

 

4

 

1

 

27

 

1

–3

 

–3

 

1

 

8

1

 

1

 

 

2

 

 

 

 

1

 

 

18

 

 

 

1

 

 

1

 

 

 

1

 

4

 

28

 

3

–1

 

–3

 

1

 

9

1

 

3

 

 

3

 

 

 

 

1

 

 

19

 

 

 

4

 

 

1

 

 

 

1

 

4

 

29

 

3

–1

 

2

 

 

1

 

10

3

 

1

 

 

1

 

 

 

 

3

 

 

20

 

 

 

1

 

 

4

 

 

 

4

 

1

 

30

 

3

1

 

–2

 

1

 

 

Пример

2.84.

Равновозможны

 

 

все положения

случайной

точки

( X ,Y ) в треугольникеD

с

 

 

 

вершинамиА(0,0), В(0,1)

и

С(2,1).

Найти

коэффициент

 

 

корреляции

 

 

 

 

случайных

 

 

величинX и Y.

Найти

 

линию

регрессии

Y

 

 

на X

и оценить точность прогноза величиныY по

наблюдаемому значению X.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. Равновозможность всех положений случайной точки ( X ,Y )

в треугольнике АВС (см. рис. 2.14.5) означает, что плотность вероятности

f (x, у) = 0

вне

этого треугольника, а

 

в

 

 

точках

треугольника

постоянна.

146

Площадь

треугольника АВС равна 1.

В точках треугольника положим

f (x, у) =1.

Тем самым соблюдено

условие равенства единице объема,

заключенного между функцией плотности вероятности и координатной плоскостью (напомним, что это является одним из отличительных свойств функции плотности вероятности системы двух случайных величин).

Рис. 2.14.5

Маргинальные функции плотности вероятности величинX и Y равны соответственно:

 

 

1

х

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f1 (x) = ò=11 -

 

 

при х Î[0, 2], f1 (x) = 0 при х Ï[0,2];

 

2

 

 

x/2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2 у

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

f2 ( y) = ò1dx = 2 y при у Î[0,1],

 

f2 ( y) = 0

при у Ï[0,1].

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Вычислим

величины,

 

необходимые

 

 

для

использования формул

(2.14.3) и (2.14.5):

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

M ( X ) = òx (1 - x / 2) dx = 2 / 3,

 

 

M ( X 2 ) = ò х2 (1 – х / 2)dx = 2 / 3,

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

M (Y ) = ò у × 2уdу = 2 / 3,

 

 

 

 

 

 

 

 

M (Y 2 ) = ò у2 × 2уdу =1/ 2,

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

o

o 2

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M ( Х Y ) = òdx ò (х – 2 / 3)( у - 2 / 3) ×1=1 / 18.

 

 

0

x/2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

4

 

 

2

 

 

 

 

 

 

 

 

,

 

Тогда s2Х

=M (=X 2 ) – [M ( X )]2

 

 

 

-

=

, sх

=

 

 

2

 

3

 

 

 

 

 

3

 

 

 

 

 

 

 

9

 

9

 

 

 

 

 

 

 

 

 

 

 

s2

=M (=Y 2 ) – [M (Y )]2

 

1

-

4

=

 

1

, s

 

=

1

 

 

.

 

 

 

 

 

 

 

 

 

 

y

 

 

 

 

 

 

Y

 

 

2

 

 

9

 

 

18

 

 

3

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

147

 

 

 

По

 

формулам (2.14.3),

(2.14.5) находим

коэффициент корреляции

r

 

=

1

 

и

уравнение

линии

регрессииy =

1

x +

1

. Если

использовать эту

 

 

 

 

 

XY

2

 

 

 

 

 

 

 

 

 

4

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

линию регрессии для прогнозаY по известному значениюX, то средний

квадрат

 

 

 

ошибки

 

прогноза

по

(2.14формуле.4)

равен

2

(Y =/ X )

1 æ

1

ö

1

 

 

 

 

 

 

 

 

s

 

 

ç1 -

 

÷ =

 

» 0, 042.

 

 

 

 

 

 

 

4

24

 

 

 

 

 

 

 

 

 

 

 

 

18 è

ø

 

 

 

 

 

 

 

 

Ответ.

y =

1

x +

1

; s2 (Y =/ X )

 

1

» 0, 042.

 

 

 

24

 

 

4

 

2

 

 

 

 

Задача

2.84.1.

Равновозможны

все

положения случайной точки

( X ,Y ) в треугольнике с вершинамиA(0,0) ,

B(a,0)

и C(a,b) в нечетных

вариантах, и

с вершинами A(0,0) ,

B(a,0) и C(0,b)

в вариантах четных.

Найти коэффициент корреляции случайных величинX и Y. Найти линию регрессии Y на X и оценить точность прогноза величиныY по наблюдаемому значению X. (См. пример 2.84 и исходные данные.)

Исходные данные к задаче 2.84.1.

a

b

a

b

a

b

a

b

a

b

a

b

1

2

3

6

3

–1

11

–3

1

16

–4

–1

21

4

2

26

4

–3

2

2

–3

7

–3

2

12

–3

–1

17

3

3

22

4

–2

27

5

1

3

–2

1

8

–3

–2

13

3

2

18

3

–3

23

–4

2

28

5

2

4

–2

–1

9

2

2

14

3

–2

19

4

1

24

–4

–2

29

–5

1

5

3

1

10

2

–2

15

–4

1

20

4

–1

25

4

3

30

–5

2

Задача 2.84.2. Случайная

точка ( X ,Y ) имеет функцию плотности

вероятности

f (x, y) =

2(ax + by)

при (x, y)

в

единичном

квадрате

a + b

 

 

 

 

 

 

[0,1]´[0,1] и

f (x, y) = 0 вне

этого квадрата. Найдите для каждой из

случайных величин функцию плотности вероятности, математическое ожидание, дисперсию. Вычислите коэффициент корреляции этих величин. Найдите линию регрессии Y на X. (См. пример 2.84.2 и исходные данные.)

Исходные данные к задаче 2.84.2.

a

b

a

b

a

b

a

b

a

b

a

b

1

1

1

6

3

2

11

4

2

16

5

1

21

3

5

26

1

6

2

1

2

7

2

3

12

2

4

17

1

5

22

5

4

27

6

2

3

2

1

8

2

2

13

4

3

18

5

2

23

4

5

28

2

6

4

1

3

9

4

1

14

3

4

19

2

5

24

4

4

29

6

3

5

3

1

10

1

4

15

3

3

20

5

3

25

6

1

30

3

6

Пример 2.85. Подбрасывают два игральных кубика. Пусть X –– число выпавших «пятерок», а Y –– число нечетных очков. Найдите закон

148

распределения случайного вектора {X ,Y}, его математическое ожидание и

 

дисперсионную матрицу. Найдите коэффициент корреляции rXY .

 

 

 

 

Решение. Если кубики однородны и симметричны, то вероятность

 

выпадения каждой грани равна 1/6. Запишем сначала закон распределения

 

случайного

 

вектора {X ,Y}.

 

Каждая

из

компонент

 

вектора может

принимать только значения 0, 1 и 2. Поэтому закон распределения можно

 

представить в виде таблицы:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

X

 

 

 

 

0

 

 

 

 

 

 

 

 

1

 

 

 

2

 

 

 

 

 

 

 

 

P(Y = y)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

1/4

 

 

 

 

 

 

 

 

0

 

 

 

0

 

 

 

 

 

 

 

 

1/4

 

 

1

 

 

 

 

 

1/3

 

 

 

 

 

 

 

 

1/6

 

 

 

0

 

 

 

 

 

 

 

 

1/2

 

 

2

 

 

 

 

 

1/9

 

 

 

 

 

 

 

 

1/9

 

 

 

1/36

 

 

 

 

 

 

1/4

 

 

P( X = x)

 

 

 

 

25/36

 

 

 

 

 

 

10/36

 

 

1/36

 

 

 

 

 

 

 

1

 

 

В клетках таблицы записаны вероятности P( X = x и Y = y).

Например,

 

P( X =1 и=Y =1)

1

×

1

+

1

×

1

=

1

,

так

как

с

вероятностью1/6

на

первом

 

6

 

2

 

6

 

 

 

 

 

2

 

6

 

 

 

 

 

 

 

 

 

вероятностью3 / 6 =1 / 2

 

кубике

появится «5»,

а

 

на

 

втором кубике с

 

выпадет четное число, либо наоборот, на первом кубике –– четное число, а

 

на втором ––

 

«5». Или, например,

P( X = 0 и= Y = 2)

 

2

×

2

=

1

, так как на

 

 

6

6

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

каждом

кубике

должна

 

выпасть

нечетная

цифра, но не «5». Вычислим

 

числовые характеристики случайного вектора:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

M ( X ) = 0 × 25 / 36 +1×10 / 36 + 2 ×1 /=36 1 / 3 .

 

 

 

 

 

 

Заметим, что X имеет биномиальное распределение. Поэтому математическое

 

ожидание можно

 

было

подсчитать

проще: 2 ×1 / 6 =1 / 3

––

произведение

 

числа опытов на вероятность появления события

в

одном.

опыте

Аналогично,

M (Y ) = 0 ×1 / 4 +1×1 / 2 + 2 ×1 /=4

1. Для вычисления дисперсий

 

вычислим предварительно математические ожидания квадратов величин:

 

 

 

M ( X 2 ) = 02 × 25 / 36 +12 ×10 / 36 + 22 ×1 / 36=

7 / 18;

 

 

 

 

 

 

 

 

 

 

M (Y 2 ) = 02 ×1 / 4 +12 ×1 / 2 + 22 ×1 / 4 =1,5.

 

 

 

 

 

 

 

 

 

Тогда D( X ) = M ( X 2 ) – [M=( X ) ]2

7 / 18= – 1 / 9

5 / 18,

 

 

 

 

 

 

 

 

 

 

 

 

D(Y ) = M (Y

2

 

 

 

 

 

2

 

1,5 – 1

1 / 2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

) =– [M (Y )]=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

oo

cov( X ,Y ) = M ( X =Y ) (0 -1 / 3)(0 -1)1 / 4 + (0 -1 / 3)(1 -1)1 / 3 + +(1 -1 / 3)(1 -1)1 / 6 + +(0 -1 / 3)(2 -1)1 / 9 + (1 -1 / 3)(2 -1)1 / 9 +

+(2 -1 / 3)(2 -1)1 / 36 =1 / 6.

149

Дисперсионная матрица случайного вектора имеет вид

Коэффициент корреляции равен

 

 

 

 

 

rXY =

 

cov( X ,Y )

1 / 6

 

1

 

» 0,45.

 

=

 

=

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

D( X ) D(Y )

5 / 18 1 / 2

5

 

 

 

 

Ответ. 1 / 5 » 0, 45.

æ5 / 18

1 / 6

ö

ç

1 / 2

÷.

è1 / 6

ø

Задача 2.85. Вероятность того, что на лотерейный билет выпадет крупный выигрыш, равна p1, а вероятность мелкого выигрыша равнаp2. Приобретено три лотерейных билета. Пусть X –– число выигрышных билетов среди этих трех, Y –– число крупных выигрышей, Z –– число мелких выигрышей.

Ввариантах, номер которых делится на три с остатком один, найти: а) закон распределения вектора ( X ,Y ) ; б) коэффициент корреляции rxy.

Ввариантах, номер которых делится на три с остатком два, найти: а) закон распределения вектора ( X , Z ) ; б) коэффициент корреляции rxz.

Ввариантах, номер которых делится на три без остатка, найти: а) закон распределения вектора (Y , Z ) ; б) коэффициент корреляции ryz.

(См. пример 2.85 и исходные данные.)

У к а з а н и е . Для вычисления вероятностей пар возможных значений случайных величин использовать формулу (2.6.2).

Исходные данные к задаче 2.85.

p1

p2

p1

p2

p1

 

p2

p1

p2

 

1

0,01

0,05

9

 

0,01

0,09

17

0,005

 

0,08

25

0,02

0,07

 

2

0,01

0,04

10

 

0,005

0,05

18

0,005

 

0,09

26

0,02

0,08

 

3

0,01

0,06

11

 

0,005

0,04

19

0,02

 

0,05

27

0,02

0,09

 

4

0,01

0,03

12

 

0,005

0,06

20

0,02

 

0,04

28

0,03

0,10

 

5

0,01

0,02

13

 

0,005

0,03

21

0,02

 

0,06

29

0,03

0,12

 

6

0,01

0,10

14

 

0,005

0,02

22

0,02

 

0,10

30

0,03

0,08

 

7

0,01

0,07

15

 

0,005

0,10

23

0,02

 

0,12

31

0,03

0,12

 

8

0,01

0,08

16

 

0,005

0,07

24

0,02

 

0,10

32

0,03

0,08

 

 

Замечание. Рассмотрим индикатор события A:

 

 

 

 

 

 

 

ì1, если событие A появилось;

 

 

 

 

 

 

 

I A = í

 

 

 

 

 

 

 

 

 

 

 

 

 

î0, если событие A не появилось.

 

 

 

 

 

Известно,

что

M (I A ) = P( A=)

pD= (I A )

p(1 - p) = pq.

Силу

зависимости между событиямиA и B можно оценить по величине коэффициента корреляции индикаторов этих событий. По формуле (2.14.1) имеем

150

r

=

M (I A I

B ) - M (I A )M (IB )

=

 

P( AB) -

P(

A)P(B)

 

.

(2.14.6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

AB

 

 

 

D(I A )D(IB )

 

 

P( A)P( A ) P(B)P(B)

 

 

 

 

 

 

 

 

Коэффициент

 

rAB

принимает

значения в[-1;1], но есть некоторые

особенности в трактовке значений коэффициента.

 

Если

rAB = 0 ,

то

события независимы и наоборот(вспомните, для

случайных величин факт равенства коэффициента корреляции нулю не означал независимость случайных величин). Положительные значения коэффициента корреляции говорят о том, что появление одного события увеличивает вероятность появления другого. Например, из рис. 2.14.6 видно, что отношение площади областиB к площади прямоугольника меньше, чем отношение площади областиAB к площади областиA. Поэтому факт появления событияA увеличивает вероятность появления события B.

Рис. 2.14.6

Чем ближе

к плюс

единице

значениеr , тем

в

большей

степени

 

 

 

 

AB

 

 

 

проявляется

это

увеличение. При

rAB = +1 появление

одного

события

всегда влечет

появление

другого. Если же rAB < 0 , то

появление

одного

события уменьшает вероятность появления другого. Например, из рис. 2.14.7 видно, что отношение площади областиB к площади прямоугольника больше, чем отношение площади областиAB к площади области A. Поэтому факт появления событияA уменьшает вероятность появления события B. Значение rAB = -1 свидетельствует о том, что появление одного события исключает появление другого.

Рис. 2.14.7

Пример 2.86. В одной урне четыре белых и два черных шара, во второй два белых и три черных. Обозначим через A и B выбор белого шара соответственно из первой и второй .урныЯсно, что P( A) = 2 / 3 , а

151

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]