- •ПРЕДИСЛОВИЕ
- •ОСНОВНЫЕ ОБОЗНАЧЕНИЯ
- •1. КОМБИНАТОРИКА
- •2. ТЕОРИЯ ВЕРОЯТНОСТЕЙ
- •2.1. Классическое определение вероятности
- •2.2. Геометрические вероятности
- •2.3. Теоремы сложения и умножения вероятностей
- •2.4. Формула полной вероятности
- •2.5. Формулы Байеса
- •2.6. Повторные независимые испытания
- •2.6.1. Формула Бернулли
- •2.6.2. Обобщенная формула Бернулли
- •2.7. Простейший (пуассоновский) поток событий
- •2.8. Случайные величины. Функция распределения. Функция плотности вероятности. Числовые характеристики
- •2.8.1. Случайные величины
- •2.8.2. Функция распределения
- •2.8.3. Функция плотности вероятности
- •2.8.4. Числовые характеристики случайных величин
- •2.9. Нормальный закон распределения
- •2.10. Асимптотика схемы независимых испытаний
- •2.10.2. Формула Пуассона
- •2.11. Функции случайных величин
- •2.12. Функции нескольких случайных аргументов
- •2.12.1. Свертка
- •2.12.2. Распределение системы двух дискретных случайных величин
- •2.12.3. Распределение функции двух случайных величин
- •2.13. Центральная предельная теорема
- •2.14. Ковариация
- •2.14.1. Корреляционная зависимость
- •2.14.2. Линейная корреляция
- •2.15. Функциональные преобразования двухмерных случайных величин
- •2.16. Правило «трех сигм»
- •2.17. Производящие функции. Преобразование Лапласа. Характеристические функции
- •2.17.1. Производящие функции
- •2.17.2. Преобразование Лапласа
- •2.17.3. Характеристические функции
- •3. МАТЕМАТИЧЕСКАЯ СТАТИСТИКА
- •3.1. Точечные оценки
- •3.1.1. Свойства оценок
- •3.1.2. Оценки для математического ожидания и дисперсии
- •3.1.3. Метод наибольшего правдоподобия для оценки параметров распределений
- •3.1.4. Метод моментов
- •3.2. Доверительный интервал для вероятности события
- •3.3. Проверка гипотезы о равенстве вероятностей
- •3.4. Доверительный интервал для математического ожидания
- •3.4.1. Случай большой выборки
- •3.4.2. Случай малой выборки
- •3.5. Доверительный интервал для дисперсии
- •3.6. Проверка статистических гипотез
- •3.6.1. Основные понятия
- •3.6.2. Критерий согласия «хи-квадрат»
- •3.6.3. Проверка гипотезы о независимости двух случайных величин
- •3.6.4. Проверка параметрических гипотез
- •3.6.5. Проверка гипотезы о значении медианы
- •3.6.6. Проверка гипотезы о равенстве математических ожиданий
- •3.7. Регрессионный анализ. Оценки по методу наименьших квадратов
- •3.8. Статистические решающие функции
- •4. СЛУЧАЙНЫЕ ПРОЦЕССЫ
- •4.1 Стационарные случайные процессы
- •4.2. Преобразование случайных процессов динамическими системами
- •4.3. Процессы «гибели и рождения»
- •4.4. Метод фаз Эрланга
- •4.5. Марковские процессы с дискретным множеством состояний. Цепи Маркова
- •4.6. Марковские процессы с непрерывным временем и дискретным множеством состояний
- •4.7. Модели управления запасами
- •4.8. Полумарковские процессы
- •5. НЕКОТОРЫЕ ИНТЕРЕСНЫЕ ЗАДАЧИ
- •БИБЛИОГРАФИЧЕСКИЙ СПИСОК
- •ПРИЛОЖЕНИЯ
- •ОГЛАВЛЕНИЕ
2.14.2. Линейная корреляция
Корреляция называется линейной, если линия регрессии одной величины на другую является прямой. В противном случае говорят о нелинейной корреляции.
Пусть линия регрессии имеет видM (Y / X ) = rx + b. Согласно свойству линии регрессии, должен быть минимален средний квадрат отклонений Y от этой линии, т.е. минимальной должна быть величина
М (Y – b – rх)2 =F (b,r),
причем ее минимальное значение равно s2 (Y / x) . |
|
|
|
|||||||||
Параметры b и r |
можно |
найти |
|
из |
условия минимума |
функции |
||||||
F (b,r). Необходимые условия экстремума дают систему уравнений |
|
|||||||||||
ìrМ ( Х 2 ) + bМ ( X ) = М ( ХY ), |
|
|
||||||||||
í |
|
|
|
|
|
|
|
|
|
|
|
|
îrМ ( X ) + b = М (Y ), |
|
|
|
|
|
|
|
|||||
решения которой имеют вид |
|
|
|
|
|
|
|
|
|
|||
r = r |
sY |
, b = M (Y ) – r |
|
sY |
M ( X ), |
(2.14.3) |
||||||
|
|
|||||||||||
ху s |
Х |
|
ху |
|
s |
Х |
|
|
|
|
||
где rху –– коэффициент |
|
|
|
|
|
|
|
|
|
|||
корреляции (2.14.1). |
Если |
выражения (2.14.3) |
||||||||||
подставить в F (b,r) , то после ряда преобразований получается, что |
|
|||||||||||
|
s2=(Y / X ) |
s2 (Y )(1 – r2 ). |
|
(2.14.4) |
||||||||
|
|
|
|
|
|
|
|
ХY |
|
|
|
|
Из соотношений (2.14.3) и (2.14.4) |
можно |
извлечь информацию о |
||||||||||
свойствах коэффициента корреляции. |
|
|
|
|
|
|
|
|
||||
1. Так как s2 (Y / X ) ³ 0 и s2 (Y ) ³ 0 , то 1 – r2 |
³ 0 , откуда -1 £ r |
£1. |
||||||||||
|
|
|
|
|
|
|
|
|
ХY |
|
ху |
|
2. Если rху = 0 , то |
в силу(2.14.3) |
и |
|
угловой |
коэффициент |
линии |
регрессии равен нулю. Линия регрессии параллельна осиОX. В этом случае говорят, что величины некоррелированы, так как среднее значение Y не изменяется при измененииX. Отсутствие корреляционной зависимости не всегда означает независимость величин. Например, при постоянном
среднем |
значении Y |
может |
изменяться |
разброс |
значений |
относительно |
||
среднего (см. рис. 2.14.2, на |
котором |
точками |
изображены |
возможные |
||||
положения случайной точки). |
|
|
|
|
|
|||
3. Из (2.14.3) следует, что угловой коэффициент линии регрессии r и |
||||||||
коэффициент |
корреляции |
имеют одинаковые |
знаки. Если |
rху > 0 , то |
||||
говорят, |
что |
величины коррелированы |
положительно. |
В этом случае |
||||
большему значению величины X соответствует большее среднее значение |
||||||||
Y (см. |
рис. |
2.14.3). |
Еще раз подчеркнем, что |
речь |
идет |
именно об |
увеличении среднего значения Y. В отдельных опытах большемуX может соответствовать меньшее Y. Например, положительно коррелированы рост
143
и вес человека, возраст и высота дерева, качество сырья и качество продукции и т.д.
Рис. 2.14.2 |
Рис. 2.14.3 |
Если rху < 0 , то говорят, что величины коррелированы отрицательно.
Это означает, что большему значению одной величины соответствует в среднем меньшее значение другой. Например, число пропусков занятий и успеваемость коррелированы отрицательно.
4. Если r = ±1, то из (2.14.4) следует, что s2 |
(Y / X ) = 0 . В этом |
ху |
|
случае разброса относительно линии регрессии нет. Между величинами существует линейная функциональная зависимость.
5. |
Из (2.14.4) следует, что s2 (Y / X ) ® 0 при | r |
|®1. Значит, чем |
|
ХY |
|
больше |
по модулю коэффициент корреляции, тем |
теснее прилегают |
значения Y к линии регрессии, тем меньше средний квадрат ошибки прогноза Y по наблюдаемому значениюX. На рис. 2.14.4 для сравнения показан разброс положений случайной точки(X,Y) относительно линии регрессии при двух разных значениях коэффициента корреляции rХ(1)Y < rХ(Y2) .
Рис. 2.14.4
144
Коэффициент корреляции служит мерой линейной |
|
зависимости |
|||||||||||
между |
величинами. Он |
|
показывает |
насколько |
статистическая |
||||||||
зависимость близка к функциональной. |
|
|
|
|
|
||||||||
Отметим, что в силу(2.14.3) уравнение линии регрессии можно |
|||||||||||||
записать в виде |
sY=X + M (Y ) – r |
sY |
|
|
|
||||||||
|
Y = rX + b r |
M ( X ) |
|
|
|||||||||
|
|
|
|
||||||||||
|
|
хy s |
Х |
|
|
хy |
s |
Х |
|
|
|
||
или |
|
|
|
|
|
|
|
|
|
|
|
||
|
Y - M (Y ) |
|
|
|
|
X - M ( X ) |
|
|
|
|
|
|
|
|
|
= r |
|
. |
|
|
|
|
(2.14.5) |
||||
|
|
|
|
|
|
|
|
||||||
|
|
sY |
|
XY |
|
sX |
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
||||
Пример 2.83. Случайные |
величиныX и |
|
Y |
независимы |
и имеют |
одинаковое распределение с математическим ожиданием m и дисперсией s2.
1)Найти коэффициент корреляции случайных величин U = aX + bY
иV = aX – bY .
2)Найти коэффициент корреляции между случайными величинами
Z = X + Y и X.
Решение. 1) По определению ruv = M [(U - MU )(V - MV )] . Найдем s(U )s(V )
необходимые для вычисления ruv величины. По свойствам математического ожидания и дисперсии имеем:
M (U ) = M (aX + bY )= a M (X ) + bM =(Y ) am + bm, M (V ) = M (aX – bY ) aM=( X ) – bM (Y ) аm= – bm,
o
U =U -M (U=) aX + bY - M (aX + bY ) = aX + bY - (am + bm) =
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
o |
|
o |
|
|
|
|
|
|
|
|
|
|
= a( X - m) + b(Y - m) =a X + bY . |
|
|
|
|
|
|
|||||||||||||||||||
|
o |
|
|
|
|
o |
|
o |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Аналогично, V =V – =M (V ) |
a X - bY , |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
M [(U - MU )(V - MV )]= |
|
o o |
|
|
|
|
|
|
o |
|
|
o |
|
o |
|
o |
|
|||||||||
M (U=V ) |
M [(a X + bY )(a X - bY )] = |
|||||||||||||||||||||||||
|
|
|
|
o |
|
o |
|
|
|
o |
|
|
|
|
|
|
o |
|
|
|
|
|
|
|||
|
= M (a2 X 2 - b2 Y 2 ) =a2 M X 2 - b2 M Y 2 = |
|
|
|
|
|
||||||||||||||||||||
2 |
M ( X - m) |
2 |
2 |
M (Y - m) |
2 |
= a |
2 |
s |
2 |
|
2 |
s |
2 |
|
|
2 |
|
2 |
- b |
2 |
). |
|||||
= a |
|
- b |
|
|
|
– b |
|
|
s=(a |
|
|
|||||||||||||||
Так как X и Y независимы, то |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
D(U ) = D(aX + bY ) = a2 D( X ) + b2 D(=Y ) s2 (a2 + b2 ), |
|
|||||||||||||||||||||||||
D(V ) = D(aX - bY ) = a2 D( X ) + b2 D(=Y ) s2 (a2 + b2 ), |
|
|
||||||||||||||||||||||||
В результате имеем |
s2 (a2 -b2 ) |
|
|
|
|
|
a2 |
-b2 |
|
|
|
|
|
|
|
|
||||||||||
|
r = |
|
|
|
|
|
= |
|
|
. |
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
a2 |
+b2 |
|
|
|
|
|
|
|
||||||
|
uv |
|
|
s a2 + b2 s a2 + b2 |
|
|
|
|
|
|
|
|
|
|
|
145
2) Вычислим величины, которые необходимы для использования формулы
|
|
|
|
|
|
|
|
|
|
|
r = |
M ( XZ ) - M ( X )M (Z ) |
. |
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
XZ |
|
|
|
|
|
|
|
|
|
|
|
|
sX sZ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
Так как X и Y независимы, то |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
M (Z ) = M ( X + Y )= M ( X ) + M =(Y ) m + m = 2m, |
|
|
|
|
|
||||||||||||||||||||||||||||||||||||
|
|
|
|
D(Z ) = D( X + Y=) D( X ) + D=(Y ) s2 + s2 =2s2 , |
|
|
|
|
|
||||||||||||||||||||||||||||||||||||
|
M ( XZ ) = M[ X ( X + Y )] M =( X 2 ) + M ( XY ) = M ( X 2 ) + M ( X )M=(Y ) |
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
= M ( X 2 ) – m2 + 2=m2 |
|
|
s2 + 2m2. |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
|
Поэтому r |
|
|
|
|
s2 + 2m2 |
|
- m × 2m 1 |
|
» 0,71. |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
= |
|
= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
XZ |
|
|
|
|
|
s × s |
2 |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
Ответ. |
r |
= |
|
a2 |
-b2 |
|
; |
r |
|
|
|
= |
|
|
1 |
|
|
» 0,71. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
a2 |
+b2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
uv |
|
|
|
|
XZ |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
Задача |
2.83. |
|
|
Случайные |
|
|
величиныX и Y независимы |
и |
имеют |
|||||||||||||||||||||||||||||||||||
одинаковое распределение с математическим ожиданиемm и дисперсией |
|||||||||||||||||||||||||||||||||||||||||||||
s2. Найдите коэффициент корреляции случайных |
величинU = aX + bY и |
||||||||||||||||||||||||||||||||||||||||||||
V = cX – dY. |
|
Найдите |
|
|
коэффициент |
|
|
|
корреляции |
|
случайных |
величин |
|||||||||||||||||||||||||||||||||
U = aX + bY и X. (См. пример 2.83 и исходные данные.) |
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||
|
Исходные данные к задаче 2.83. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
№ |
a |
|
b |
|
|
c |
|
|
|
|
d |
|
|
№ |
a |
|
|
|
|
|
b |
|
|
|
c |
|
d |
|
№ |
a |
b |
|
c |
|
|
d |
|
||||||||
1 |
4 |
|
3 |
|
|
2 |
|
|
|
|
1 |
|
|
11 |
|
|
|
1 |
|
|
3 |
|
|
|
1 |
|
1 |
|
21 |
|
1 |
–1 |
|
2 |
|
|
1 |
|
|||||||
2 |
1 |
|
2 |
|
|
1 |
|
|
|
|
2 |
|
|
12 |
|
|
|
1 |
|
|
1 |
|
|
|
3 |
|
1 |
|
22 |
|
1 |
1 |
|
–2 |
|
1 |
|
||||||||
3 |
2 |
|
1 |
|
|
2 |
|
|
|
|
1 |
|
|
13 |
|
|
|
1 |
|
|
1 |
|
|
|
1 |
|
3 |
|
23 |
|
1 |
–2 |
|
2 |
|
|
1 |
|
|||||||
4 |
2 |
|
2 |
|
|
2 |
|
|
|
|
2 |
|
|
14 |
|
|
|
3 |
|
|
1 |
|
|
|
1 |
|
1 |
|
24 |
|
1 |
–2 |
|
–2 |
|
1 |
|
||||||||
5 |
1 |
|
2 |
|
|
2 |
|
|
|
|
1 |
|
|
15 |
|
|
|
4 |
|
|
1 |
|
|
|
1 |
|
1 |
|
25 |
|
-1 |
2 |
|
2 |
|
|
–1 |
|
|||||||
6 |
2 |
|
1 |
|
|
1 |
|
|
|
|
2 |
|
|
16 |
|
|
|
1 |
|
|
4 |
|
|
|
1 |
|
1 |
|
26 |
|
1 |
–3 |
|
3 |
|
|
1 |
|
|||||||
7 |
1 |
|
2 |
|
|
1 |
|
|
|
|
1 |
|
|
17 |
|
|
|
1 |
|
|
1 |
|
|
|
4 |
|
1 |
|
27 |
|
1 |
–3 |
|
–3 |
|
1 |
|
||||||||
8 |
1 |
|
1 |
|
|
2 |
|
|
|
|
1 |
|
|
18 |
|
|
|
1 |
|
|
1 |
|
|
|
1 |
|
4 |
|
28 |
|
3 |
–1 |
|
–3 |
|
1 |
|
||||||||
9 |
1 |
|
3 |
|
|
3 |
|
|
|
|
1 |
|
|
19 |
|
|
|
4 |
|
|
1 |
|
|
|
1 |
|
4 |
|
29 |
|
3 |
–1 |
|
2 |
|
|
1 |
|
|||||||
10 |
3 |
|
1 |
|
|
1 |
|
|
|
|
3 |
|
|
20 |
|
|
|
1 |
|
|
4 |
|
|
|
4 |
|
1 |
|
30 |
|
3 |
1 |
|
–2 |
|
1 |
|
||||||||
|
Пример |
2.84. |
Равновозможны |
|
|
все положения |
случайной |
точки |
|||||||||||||||||||||||||||||||||||||
( X ,Y ) в треугольникеD |
с |
|
|
|
вершинамиА(0,0), В(0,1) |
и |
С(2,1). |
Найти |
|||||||||||||||||||||||||||||||||||||
коэффициент |
|
|
корреляции |
|
|
|
|
случайных |
|
|
величинX и Y. |
Найти |
|
линию |
|||||||||||||||||||||||||||||||
регрессии |
Y |
|
|
на X |
и оценить точность прогноза величиныY по |
||||||||||||||||||||||||||||||||||||||||
наблюдаемому значению X. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
Решение. Равновозможность всех положений случайной точки ( X ,Y ) |
||||||||||||||||||||||||||||||||||||||||||||
в треугольнике АВС (см. рис. 2.14.5) означает, что плотность вероятности |
|||||||||||||||||||||||||||||||||||||||||||||
f (x, у) = 0 |
вне |
этого треугольника, а |
|
в |
|
|
точках |
треугольника |
постоянна. |
146
Площадь |
треугольника АВС равна 1. |
В точках треугольника положим |
f (x, у) =1. |
Тем самым соблюдено |
условие равенства единице объема, |
заключенного между функцией плотности вероятности и координатной плоскостью (напомним, что это является одним из отличительных свойств функции плотности вероятности системы двух случайных величин).
Рис. 2.14.5
Маргинальные функции плотности вероятности величинX и Y равны соответственно:
|
|
1 |
х |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f1 (x) = ò=1dу 1 - |
|
|
при х Î[0, 2], f1 (x) = 0 при х Ï[0,2]; |
|||||||||||||||||||||||||
|
2 |
||||||||||||||||||||||||||||
|
|
x/2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
2 у |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
f2 ( y) = ò1dx = 2 y при у Î[0,1], |
|
f2 ( y) = 0 |
при у Ï[0,1]. |
|||||||||||||||||||||||||
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Вычислим |
величины, |
|
необходимые |
|
|
для |
использования формул |
||||||||||||||||||||||
(2.14.3) и (2.14.5): |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
M ( X ) = òx (1 - x / 2) dx = 2 / 3, |
|
|
M ( X 2 ) = ò х2 (1 – х / 2)dx = 2 / 3, |
||||||||||||||||||||||||||
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
M (Y ) = ò у × 2уdу = 2 / 3, |
|
|
|
|
|
|
|
|
M (Y 2 ) = ò у2 × 2уdу =1/ 2, |
||||||||||||||||||||
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
o |
o 2 |
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
M ( Х Y ) = òdx ò (х – 2 / 3)( у - 2 / 3) ×1dу =1 / 18. |
|
||||||||||||||||||||||||||||
|
0 |
x/2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
4 |
|
|
2 |
|
|
|
|
|
|
|
|
, |
|
|||||||||
Тогда s2Х |
=M (=X 2 ) – [M ( X )]2 |
|
|
|
- |
= |
, sх |
= |
|
|
2 |
|
|||||||||||||||||
3 |
|
|
|
|
|
3 |
|
|
|
||||||||||||||||||||
|
|
|
|
9 |
|
9 |
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
s2 |
=M (=Y 2 ) – [M (Y )]2 |
|
1 |
- |
4 |
= |
|
1 |
, s |
|
= |
1 |
|
|
. |
|
|||||||||||||
|
|
|
|
|
|
|
|
|
y |
|
|
|
|
|
|
||||||||||||||
Y |
|
|
2 |
|
|
9 |
|
|
18 |
|
|
3 |
2 |
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
147
|
|
|
По |
|
формулам (2.14.3), |
(2.14.5) находим |
коэффициент корреляции |
||||||||||||
r |
|
= |
1 |
|
и |
уравнение |
линии |
регрессииy = |
1 |
x + |
1 |
. Если |
использовать эту |
||||||
|
|
|
|
|
|||||||||||||||
XY |
2 |
|
|
|
|
|
|
|
|
|
4 |
|
2 |
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
линию регрессии для прогнозаY по известному значениюX, то средний |
|||||||||||||||||||
квадрат |
|
|
|
ошибки |
|
прогноза |
по |
(2.14формуле.4) |
равен |
||||||||||
2 |
(Y =/ X ) |
1 æ |
1 |
ö |
1 |
|
|
|
|
|
|
|
|
||||||
s |
|
|
ç1 - |
|
÷ = |
|
» 0, 042. |
|
|
|
|
|
|
||||||
|
4 |
24 |
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
18 è |
ø |
|
|
|
|
|
|
|
|
Ответ. |
y = |
1 |
x + |
1 |
; s2 (Y =/ X ) |
|
1 |
» 0, 042. |
|
||
|
|
24 |
|
||||||||
|
4 |
|
2 |
|
|
|
|
||||
Задача |
2.84.1. |
Равновозможны |
все |
положения случайной точки |
|||||||
( X ,Y ) в треугольнике с вершинамиA(0,0) , |
B(a,0) |
и C(a,b) в нечетных |
|||||||||
вариантах, и |
с вершинами A(0,0) , |
B(a,0) и C(0,b) |
в вариантах четных. |
Найти коэффициент корреляции случайных величинX и Y. Найти линию регрессии Y на X и оценить точность прогноза величиныY по наблюдаемому значению X. (См. пример 2.84 и исходные данные.)
Исходные данные к задаче 2.84.1.
№ |
a |
b |
№ |
a |
b |
№ |
a |
b |
№ |
a |
b |
№ |
a |
b |
№ |
a |
b |
1 |
2 |
3 |
6 |
3 |
–1 |
11 |
–3 |
1 |
16 |
–4 |
–1 |
21 |
4 |
2 |
26 |
4 |
–3 |
2 |
2 |
–3 |
7 |
–3 |
2 |
12 |
–3 |
–1 |
17 |
3 |
3 |
22 |
4 |
–2 |
27 |
5 |
1 |
3 |
–2 |
1 |
8 |
–3 |
–2 |
13 |
3 |
2 |
18 |
3 |
–3 |
23 |
–4 |
2 |
28 |
5 |
2 |
4 |
–2 |
–1 |
9 |
2 |
2 |
14 |
3 |
–2 |
19 |
4 |
1 |
24 |
–4 |
–2 |
29 |
–5 |
1 |
5 |
3 |
1 |
10 |
2 |
–2 |
15 |
–4 |
1 |
20 |
4 |
–1 |
25 |
4 |
3 |
30 |
–5 |
2 |
Задача 2.84.2. Случайная |
точка ( X ,Y ) имеет функцию плотности |
||||||
вероятности |
f (x, y) = |
2(ax + by) |
при (x, y) |
в |
единичном |
квадрате |
|
a + b |
|||||||
|
|
|
|
|
|
||
[0,1]´[0,1] и |
f (x, y) = 0 вне |
этого квадрата. Найдите для каждой из |
случайных величин функцию плотности вероятности, математическое ожидание, дисперсию. Вычислите коэффициент корреляции этих величин. Найдите линию регрессии Y на X. (См. пример 2.84.2 и исходные данные.)
Исходные данные к задаче 2.84.2.
№ |
a |
b |
№ |
a |
b |
№ |
a |
b |
№ |
a |
b |
№ |
a |
b |
№ |
a |
b |
1 |
1 |
1 |
6 |
3 |
2 |
11 |
4 |
2 |
16 |
5 |
1 |
21 |
3 |
5 |
26 |
1 |
6 |
2 |
1 |
2 |
7 |
2 |
3 |
12 |
2 |
4 |
17 |
1 |
5 |
22 |
5 |
4 |
27 |
6 |
2 |
3 |
2 |
1 |
8 |
2 |
2 |
13 |
4 |
3 |
18 |
5 |
2 |
23 |
4 |
5 |
28 |
2 |
6 |
4 |
1 |
3 |
9 |
4 |
1 |
14 |
3 |
4 |
19 |
2 |
5 |
24 |
4 |
4 |
29 |
6 |
3 |
5 |
3 |
1 |
10 |
1 |
4 |
15 |
3 |
3 |
20 |
5 |
3 |
25 |
6 |
1 |
30 |
3 |
6 |
Пример 2.85. Подбрасывают два игральных кубика. Пусть X –– число выпавших «пятерок», а Y –– число нечетных очков. Найдите закон
148
распределения случайного вектора {X ,Y}, его математическое ожидание и |
|
||||||||||||||||||||||||||||||||
дисперсионную матрицу. Найдите коэффициент корреляции rXY . |
|
|
|
|
|||||||||||||||||||||||||||||
Решение. Если кубики однородны и симметричны, то вероятность |
|
||||||||||||||||||||||||||||||||
выпадения каждой грани равна 1/6. Запишем сначала закон распределения |
|
||||||||||||||||||||||||||||||||
случайного |
|
вектора {X ,Y}. |
|
Каждая |
из |
компонент |
|
вектора может |
|||||||||||||||||||||||||
принимать только значения 0, 1 и 2. Поэтому закон распределения можно |
|
||||||||||||||||||||||||||||||||
представить в виде таблицы: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y |
X |
|
|
|
|
0 |
|
|
|
|
|
|
|
|
1 |
|
|
|
2 |
|
|
|
|
|
|
|
|
P(Y = y) |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
1/4 |
|
|
|
|
|
|
|
|
0 |
|
|
|
0 |
|
|
|
|
|
|
|
|
1/4 |
|
|
|||
1 |
|
|
|
|
|
1/3 |
|
|
|
|
|
|
|
|
1/6 |
|
|
|
0 |
|
|
|
|
|
|
|
|
1/2 |
|
|
|||
2 |
|
|
|
|
|
1/9 |
|
|
|
|
|
|
|
|
1/9 |
|
|
|
1/36 |
|
|
|
|
|
|
1/4 |
|
|
|||||
P( X = x) |
|
|
|
|
25/36 |
|
|
|
|
|
|
10/36 |
|
|
1/36 |
|
|
|
|
|
|
|
1 |
|
|
||||||||
В клетках таблицы записаны вероятности P( X = x и Y = y). |
Например, |
|
|||||||||||||||||||||||||||||||
P( X =1 и=Y =1) |
1 |
× |
1 |
+ |
1 |
× |
1 |
= |
1 |
, |
так |
как |
с |
вероятностью1/6 |
на |
первом |
|
||||||||||||||||
6 |
|
2 |
|
6 |
|
||||||||||||||||||||||||||||
|
|
|
|
2 |
|
6 |
|
|
|
|
|
|
|
|
|
вероятностью3 / 6 =1 / 2 |
|
||||||||||||||||
кубике |
появится «5», |
а |
|
на |
|
втором кубике с |
|
||||||||||||||||||||||||||
выпадет четное число, либо наоборот, на первом кубике –– четное число, а |
|
||||||||||||||||||||||||||||||||
на втором –– |
|
«5». Или, например, |
P( X = 0 и= Y = 2) |
|
2 |
× |
2 |
= |
1 |
, так как на |
|
||||||||||||||||||||||
|
6 |
6 |
|
|
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
9 |
|
|
|
|
|
|||
каждом |
кубике |
должна |
|
выпасть |
нечетная |
цифра, но не «5». Вычислим |
|
||||||||||||||||||||||||||
числовые характеристики случайного вектора: |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
|
|
M ( X ) = 0 × 25 / 36 +1×10 / 36 + 2 ×1 /=36 1 / 3 . |
|
|
|
|
|
|
||||||||||||||||||||||||
Заметим, что X имеет биномиальное распределение. Поэтому математическое |
|
||||||||||||||||||||||||||||||||
ожидание можно |
|
было |
подсчитать |
проще: 2 ×1 / 6 =1 / 3 |
–– |
произведение |
|
||||||||||||||||||||||||||
числа опытов на вероятность появления события |
в |
одном. |
опыте |
||||||||||||||||||||||||||||||
Аналогично, |
M (Y ) = 0 ×1 / 4 +1×1 / 2 + 2 ×1 /=4 |
1. Для вычисления дисперсий |
|
||||||||||||||||||||||||||||||
вычислим предварительно математические ожидания квадратов величин: |
|
||||||||||||||||||||||||||||||||
|
|
M ( X 2 ) = 02 × 25 / 36 +12 ×10 / 36 + 22 ×1 / 36= |
7 / 18; |
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
M (Y 2 ) = 02 ×1 / 4 +12 ×1 / 2 + 22 ×1 / 4 =1,5. |
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
Тогда D( X ) = M ( X 2 ) – [M=( X ) ]2 |
7 / 18= – 1 / 9 |
5 / 18, |
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
D(Y ) = M (Y |
2 |
|
|
|
|
|
2 |
|
1,5 – 1 |
1 / 2 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
) =– [M (Y )]= |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
oo
cov( X ,Y ) = M ( X =Y ) (0 -1 / 3)(0 -1)1 / 4 + (0 -1 / 3)(1 -1)1 / 3 + +(1 -1 / 3)(1 -1)1 / 6 + +(0 -1 / 3)(2 -1)1 / 9 + (1 -1 / 3)(2 -1)1 / 9 +
+(2 -1 / 3)(2 -1)1 / 36 =1 / 6.
149
Дисперсионная матрица случайного вектора имеет вид
Коэффициент корреляции равен |
|
|
|
|
|
||||||||||
rXY = |
|
cov( X ,Y ) |
1 / 6 |
|
1 |
|
» 0,45. |
||||||||
|
= |
|
= |
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|||||
D( X ) D(Y ) |
5 / 18 1 / 2 |
5 |
|||||||||||||
|
|
|
|
Ответ. 1 / 5 » 0, 45.
æ5 / 18 |
1 / 6 |
ö |
ç |
1 / 2 |
÷. |
è1 / 6 |
ø |
Задача 2.85. Вероятность того, что на лотерейный билет выпадет крупный выигрыш, равна p1, а вероятность мелкого выигрыша равнаp2. Приобретено три лотерейных билета. Пусть X –– число выигрышных билетов среди этих трех, Y –– число крупных выигрышей, Z –– число мелких выигрышей.
Ввариантах, номер которых делится на три с остатком один, найти: а) закон распределения вектора ( X ,Y ) ; б) коэффициент корреляции rxy.
Ввариантах, номер которых делится на три с остатком два, найти: а) закон распределения вектора ( X , Z ) ; б) коэффициент корреляции rxz.
Ввариантах, номер которых делится на три без остатка, найти: а) закон распределения вектора (Y , Z ) ; б) коэффициент корреляции ryz.
(См. пример 2.85 и исходные данные.)
У к а з а н и е . Для вычисления вероятностей пар возможных значений случайных величин использовать формулу (2.6.2).
Исходные данные к задаче 2.85.
№ |
p1 |
p2 |
№ |
p1 |
p2 |
№ |
p1 |
|
p2 |
№ |
p1 |
p2 |
|
|
1 |
0,01 |
0,05 |
9 |
|
0,01 |
0,09 |
17 |
0,005 |
|
0,08 |
25 |
0,02 |
0,07 |
|
2 |
0,01 |
0,04 |
10 |
|
0,005 |
0,05 |
18 |
0,005 |
|
0,09 |
26 |
0,02 |
0,08 |
|
3 |
0,01 |
0,06 |
11 |
|
0,005 |
0,04 |
19 |
0,02 |
|
0,05 |
27 |
0,02 |
0,09 |
|
4 |
0,01 |
0,03 |
12 |
|
0,005 |
0,06 |
20 |
0,02 |
|
0,04 |
28 |
0,03 |
0,10 |
|
5 |
0,01 |
0,02 |
13 |
|
0,005 |
0,03 |
21 |
0,02 |
|
0,06 |
29 |
0,03 |
0,12 |
|
6 |
0,01 |
0,10 |
14 |
|
0,005 |
0,02 |
22 |
0,02 |
|
0,10 |
30 |
0,03 |
0,08 |
|
7 |
0,01 |
0,07 |
15 |
|
0,005 |
0,10 |
23 |
0,02 |
|
0,12 |
31 |
0,03 |
0,12 |
|
8 |
0,01 |
0,08 |
16 |
|
0,005 |
0,07 |
24 |
0,02 |
|
0,10 |
32 |
0,03 |
0,08 |
|
|
Замечание. Рассмотрим индикатор события A: |
|
|
|
|
|||||||||
|
|
|
ì1, если событие A появилось; |
|
|
|
|
|||||||
|
|
|
I A = í |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
î0, если событие A не появилось. |
|
|
|
|
|||||||
|
Известно, |
что |
M (I A ) = P( A=) |
pD= (I A ) |
p(1 - p) = pq. |
Силу |
зависимости между событиямиA и B можно оценить по величине коэффициента корреляции индикаторов этих событий. По формуле (2.14.1) имеем
150
r |
= |
M (I A I |
B ) - M (I A )M (IB ) |
= |
|
P( AB) - |
P( |
A)P(B) |
|
. |
(2.14.6) |
|||||||
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
AB |
|
|
|
D(I A )D(IB ) |
|
|
P( A)P( A ) P(B)P(B) |
|
||||||||||
|
|
|
|
|
|
|
||||||||||||
Коэффициент |
|
rAB |
принимает |
значения в[-1;1], но есть некоторые |
||||||||||||||
особенности в трактовке значений коэффициента. |
|
|||||||||||||||||
Если |
rAB = 0 , |
то |
события независимы и наоборот(вспомните, для |
случайных величин факт равенства коэффициента корреляции нулю не означал независимость случайных величин). Положительные значения коэффициента корреляции говорят о том, что появление одного события увеличивает вероятность появления другого. Например, из рис. 2.14.6 видно, что отношение площади областиB к площади прямоугольника меньше, чем отношение площади областиAB к площади областиA. Поэтому факт появления событияA увеличивает вероятность появления события B.
Рис. 2.14.6
Чем ближе |
к плюс |
единице |
значениеr , тем |
в |
большей |
степени |
|
|
|
|
|
AB |
|
|
|
проявляется |
это |
увеличение. При |
rAB = +1 появление |
одного |
события |
||
всегда влечет |
появление |
другого. Если же rAB < 0 , то |
появление |
одного |
события уменьшает вероятность появления другого. Например, из рис. 2.14.7 видно, что отношение площади областиB к площади прямоугольника больше, чем отношение площади областиAB к площади области A. Поэтому факт появления событияA уменьшает вероятность появления события B. Значение rAB = -1 свидетельствует о том, что появление одного события исключает появление другого.
Рис. 2.14.7
Пример 2.86. В одной урне четыре белых и два черных шара, во второй два белых и три черных. Обозначим через A и B выбор белого шара соответственно из первой и второй .урныЯсно, что P( A) = 2 / 3 , а
151