шапкин задачи с решениями
.pdfНормально распределенной называется случайная величина , имеющая в интервале от –∞ äî +∞ плотность, определяемую формулой
|
|
- |
1 |
æ x-a ö2 |
||
|
1 |
|
ç |
|
÷ |
|
f (x) = |
2 |
σ |
||||
σ 2π |
×e |
|
è |
|
ø . |
|
|
|
|
|
|
|
Ее интегральная функция:
x |
|
|
x |
- |
1 |
æ z-a ö2 |
|||
F (X ) = ò f (x) × dx = σ |
1 |
π × ò |
|
ç |
|
÷ |
|
||
2 |
σ |
|
|||||||
e |
è |
ø |
dz. |
||||||
-¥ |
2 |
-¥ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ïðè σ = 1 и a = 0 будем иметь нормированное нормальное распределение
|
|
|
|
Fí (x) = 0,5 + Φ (x), |
ãäå F (x) = 1π òx |
e- |
z2 |
dz — интеграл Лапласа. |
|
2 |
||||
2 |
0 |
|
|
|
|
|
|
|
Указанный интеграл можно вычислить, пользуясь таблицами , и тогда вероятность попадания СВ X в интервал определяется по формуле
P(x1 < X < x2) = F (x2) – F (x1)
(Φ (–x) = – Φ (x) — нечетная функция).
Доказано, что переход от нормированной к обычной функции осуществляется подстановкой:
æ x - a ö |
|||
F(x) = Fí ç |
|
÷. |
|
σ |
|||
è |
ø |
Пример 6.30. Случайная величина Х распределена нормально. Математическое ожидание и среднее квадратическое откло нение этой величины соответственно равны 2 и 5. Найти вероятность того, что в результате испытания СВ Х примет значение, принадлежащее интервалу (1; 4).
Решение. Воспользуемся формулой:
æ |
β – à ö |
æ α |
||
P (α < X < β ) = F ç |
|
÷ |
- F ç |
|
σ |
||||
è |
ø |
è |
–à ö
÷.
σø
321
По условию: α = 1, β = 4, à = 2, σ = 5, следовательно,
æ 4 – 2 |
ö |
æ1– 2 |
ö |
= F (0,4) - F (–0,2). |
|||
P (1< X < 4) = F ç |
|
÷ |
- F ç |
|
÷ |
||
5 |
5 |
||||||
è |
ø |
è |
ø |
|
Так как функция Лапласа нечетная, то
F(–0,2) = –F(0,2).
Таким образом,
P (1 < X < 4) = F(0,4) +F(0,2).
По таблице находим:
F(0,4) = 0,1554; F(0,2) = 0,0793.
Искомая вероятность равна:
P (1 < X < 4)= 0,1554 + 0,0793 = 0,2347.
Пример 6.31. Три непрерывные случайные величины имеют различные распределения: а) равномерное; б) экспоненциаль ное; в) нормальное. Для всех трех распределений М (Хi) = σ (Õi) = 4.
Найти для всех законов распределения вероятность того, чт о в результате испытания СВ Хi примет значение, заключенное в интервале (5; 12).
Решение.
а) Равномерное распределение.
Дифференциальная функция равномерного распределения СВ Х1 имеет вид:
ì |
0 |
ïðè |
x < a, |
ï |
1 |
|
|
ï |
|
|
|
f (x) = í |
|
ïðè a £ x £ b, |
|
|
|||
ïb - a |
|
|
|
ï |
0 |
ïðè |
x > b. |
î |
Параметры а и b найдем из условия, что для равномерного распределения
ìM(X ) = |
b + a |
, |
|
ìb + a |
= 4, |
||||||
|
|
ï |
2 |
|
|||||||
ï |
1 |
2 |
|
|
|
|
|
|
|||
í |
|
|
|
|
èëè í |
|
|
|
|
|
|
|
(b - a) |
2 |
(b - a) |
2 |
|
||||||
ïD (X ) = |
|
ï |
|
= 42. |
|||||||
|
|
|
|
|
|
|
|
||||
ï |
1 |
12 |
|
|
ï |
12 |
|
|
|
||
î |
|
|
|
î |
|
|
|
322
Отсюда
ì |
b + a = 8, |
|
ì |
+ |
|
= 8, |
||
í |
èëè |
b |
|
a |
|
|||
|
2 |
=192 |
í |
|
|
= 8 3. |
||
î(b - a) |
|
|
îb - a |
Решая эту систему, находим, что
a = 4 (1- 3 ) @ 2,93; b = 4 (1+ 3 ) @ 10,93.
При извлечении квадратного корня во втором уравнении сис - темы взят знак «+» с учетом того, что a < b.
Имеем
ì |
|
0 |
ïðè |
x < 4 (1- |
3 ), |
ï |
|
1 |
|
|
|
ï |
|
ïðè |
4 (1- 3 ) £ x £ 4 (1+ 3 ), |
||
f (x) = í |
8 |
3 |
|||
ï |
|
|
|
||
ï |
|
0 |
ïðè |
x > 4 (1+ |
3 ). |
î |
|
Вероятность попадания СВ Х1 в интервале (α ; β ) определяем по формуле
β
P (α < X1 < β ) = ò f (x) dx.
α
Для нашего случая искомая вероятность равна:
P (5 < X |
|
<12) |
= |
12 |
f (x)× dx = |
4 (1+ 3 ) |
1 |
dx + |
12 |
0× dx = |
||
1 |
|
|
|
ò |
|
|
ò |
8 |
3 |
ò |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
5 |
|
|
5 |
|
|
4 (1+ |
3 ) |
|
|
1 |
|
4 (1+ |
3 ) |
1 |
|
|
|
|
|
|
= |
|
x |
|
|
= |
(4 + 4 |
3 – 5) = 0,428. |
|||||
|
8 |
3 |
5 |
|
8 |
3 |
|
|
|
|
|
Èòàê,
P (5 < X1 < 12) = 0,428.
б) Экспоненциальное распределение.
Интегральная функция экспоненциального распределения С В Х2 имеет вид:
F (x) = 1 – e–λx.
323
Известно, что |
M(X2 ) = |
1 |
|
èëè |
1 |
= 4 |
по условию. Отсюда |
λ |
|
|
|||||
|
|
|
|
λ |
|
||
λ = 0,25. Тогда |
|
|
|
|
|
|
|
|
F (x) = 1 – e–0,25x. |
|
|||||
Искомая вероятность: |
|
|
|
|
|
||
P (5 < X < 12) = e–0,25· 5 |
– e–0,25· 12 = e–1,25 – e–3 = 0,2367. |
||||||
2 |
|
|
|
|
|
|
|
в) Нормальное распределение.
Вероятность того, что СВ Х3, подчиненная нормальному закону распределения, попадет в интервал (α; β ), равна:
|
æ |
β – à ö |
æ α |
||
P (α < X3 |
< β ) = F ç |
|
÷ |
- F ç |
|
σ |
|||||
|
è |
ø |
è |
–à ö
÷.
σø
Здесь Φ(х) — функция Лапласа, а — математическое ожидание, σ — среднее квадратическое отклонение. Так как по условию задачи а = σ = 4, то искомая вероятность равна:
æ12 – 4 |
ö |
|
æ 5 – 4 |
ö |
æ 1 |
ö |
||||||
P (5 < X3 <12) = F ç |
|
|
|
÷ - F ç |
|
÷ |
= F (2) – F ç |
|
÷. |
|||
|
4 |
|
|
4 |
||||||||
è |
|
|
ø |
|
è 4 |
ø |
è |
ø |
||||
Находим по таблицам, что |
|
|
|
|
|
|
|
|
|
|
||
F (2) = 0,4772; |
F |
æ |
1 |
ö |
= F (0,25) = 0,0987. |
|
|
|||||
ç |
|
|
÷ |
|
|
|||||||
4 |
|
|
||||||||||
|
|
|
è |
ø |
|
|
|
|
|
|
Тогда
P (5 < X3 < 12) = 0,4772 – 0,0987 = 0,3785.
6.4.Основные понятия математической статистики
6.4.1.Генеральная совокупность. Выборка. Основные типы задач математической статистики
Пусть Х — некоторая случайная величина (количественный признак). В дальнейшем все значения этой СВ будем называть генеральной совокупностью. Если, например, Х — дискретная СВ, то генеральная совокупность — х1, õ2, …, õn.
Допустим, что в процессе наблюдений или опытов мы полу- чили n значений (х1, õ2, …, õn) случайной величины Х. В дальней-
324
шем будем говорить, что сделали выборку х1, õ2, …, õn из генеральной совокупности Х.
Число n называется объемом выборки.
Выборку х1, õ2, …, õn из генеральной совокупности Х также можно представить, как значения n экземпляров х1, õ2, …, õn слу- чайной величины Х.
Заметим, что среди элементов выборки могут быть повторяющиеся. Поэтому для каждого элемента хi выборки говорят о частоте ее появления, т.е. сколько раз число хi наблюдалось в выборке.
В дальнейшем мы часто будем задавать выборку в виде табли цы
õi |
õ1 |
õ2 |
… |
õm |
ni |
n1 |
n2 |
… |
nm |
|
|
|
|
|
ãäå õ1, õ2, …, õm — различные элементы выборки, а n1, n2, …, nm — частоты элементов выборки.
Ясно, что в этом случае объем выборки n = n1 + n2 + … + nm. Значения х1, …, õm выборки будем называть вариантами. Если варианты выборки расположены в возрастающем поряд-
ке, то выборка называется вариационным рядом. Например,
õi |
|
–1 |
|
2 |
5 |
|
10 |
|
11 |
ni |
|
2 |
|
7 |
1 |
|
1 |
|
5 |
Варианты |
выборки |
называются |
равноотстоящими, |
åñëè |
Õi +1 – Õi = h, где h — постоянное число.
На практике при описании реальных процессов различные характеристики процесса являются случайными величинами . Поэтому возникают задачи определения законов распределен ия, математических ожиданий и других характеристик этих СВ, осн о- вываясь на изучении выборок.
Пусть значения СВ Х определяют генеральную совокупность и F (x) = P (X < x) — интегральная функция распределения Х. В дальнейшем мы будем ее называть теоретической функцией распределения генеральной совокупности Х. Зная функцию F(x), можно определить все характеристики СВ Х. Поэтому поставим перед собой следующую задачу: можно ли с помощью выборок из генеральной совокупности Х приближенно найти функцию F (x)?
325
Пусть задана выборка
õi |
õ1 |
|
|
|
õ2 |
|
|
|
… |
õm |
|
ni |
n1 |
|
|
|
n2 |
|
… |
nm |
|||
|
|
|
|
|
|
|
|
|
|||
объема n = n1 + n2 + … + nm. |
|
nx |
|
|
|
|
|||||
Построим функцию F *(x) = |
, |
ãäå nx — число вариантов |
|||||||||
|
|||||||||||
|
|
|
nx |
|
|
n |
|
|
|
||
выборки, меньших х, т.е. |
|
|
представляет относительную часто- |
||||||||
|
n |
||||||||||
|
|
|
|
|
|
|
|
|
ту вариант выборки, меньших х. Функция F* (x) называется функцией распределения выборки или эмпирической функцией р аспределения.
Пример 6.32. Найти эмпирическую функцию по выборке
õi |
1 |
4 |
6 |
ni |
10 |
15 |
25 |
Решение. Найдем объем выборки: n = 10 + 15 + 25 = 50. Наименьшая варианта равна единице, следовательно, F* (x) = 0 при x ≤ 1. Значение Х = 4, а именно х1 = 1, наблюдалось 10 раз, следовательно,
F * (x) = 1050 = 0,2 ïðè 1 < X £ 4.
Значения Х < 6, а именно х1 = 1 è õ2 = 4, наблюдались n1 + n2 = = 10 + 15 = 25 раз, следовательно,
F * (x) = |
25 = |
1 ïðè 4 < X £ 6. |
|
|
50 |
2 |
|
Òàê êàê õ3 = 6 — наибольшая варианта, то |
|||
F * (x) = 50 |
= 1 ïðè õ > 6. |
||
|
50 |
|
|
Значит, |
ì 0 |
|
x £1, |
|
ïðè |
||
|
ï |
ïðè |
1 < x £ 4, |
F * (x) = í0,2 |
|||
|
0,5 |
ïðè |
4 < x £ 6, |
|
ï |
ïðè |
x > 6. |
|
î 1 |
326
Графически эта функция изображена на рис. 80.
F*(x) 1,0
0,5
0,2
|
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
3 |
|
|
|
|
|
|
x |
1 |
2 |
4 |
5 |
6 |
Ðèñ. 80
Эмпирическая функция F* (x) является приближением теоретической функции F (x), и чем больше объем выборки n, тем точ- нее F* (x) описывает F (x) (по вероятности, т.е. случайные отклонения маловероятны).
В заключение заметим: эмпирическая функция обладает анал о- гичными свойствами, что и теоретическая функция распреде ления.
6.4.2. Статистическая оценка параметров распределения
Пусть значения случайной величины Х образуют генеральную совокупность. Закон распределения СВ (например, нормальн ый закон) Х нам известен. Однако неизвестны некоторые параметры этого распределения (например, МО или дисперсия).
Требуется, изучая выборки из генеральной совокупности, оц е- нить, т.е. приближенно найти, неизвестный параметр.
Статистической оценкой неизвестного параметра называет ся всякая функция ϕ вариант xi выборки, дающая приближенное зна- чение этого параметра.
Если обозначим неизвестный параметр через θ , а его оценку через θ *, òî θ * = θ (õ1, …, õn), ãäå õ1, …, õn — выборка из генеральной совокупности Х.
Рассматривая варианты х1, …, õn выборки как значения n экземпляров Х1, …, Õn СВ Х, получим:
θ * = ϕ (Õ1, …, Õn),
т.е. статистическая оценка θ * является функцией от случайных
327
величин Х1, …, Õn, а значит и сама является СВ. Таким образом, статистическая оценка θ * принимает значения (различные) в зависимости от выборки.
Ясно, что для одного и того же неизвестного параметра можно построить различные статистические оценки. Наша задач а понять, какие оценки являются «хорошими».
Во-первых, естественно желание, чтобы статистическая оцен - ка, являясь случайной величиной, имела своим математическ им ожиданием неизвестный параметр.
Статистическая оценка θ * неизвестного параметра θ называется несмещенной, если М (θ *) = θ .
Во-вторых, естественно требовать, чтобы значения статисти - ческой оценки θ * по возможности более тесно концентрировались около θ . Вспоминая, что дисперсия является мерой рассеяния зна- чений СВ около среднего значения, дадим следующее определ е- ние.
Статистическая оценка θ * неизвестного параметра θ называется эффективной, если она обладает наименьшей дисперсие й среди всех статистических оценок параметра θ .
В третьих, естественно считать, что, чем больше объем выбор - ки, тем точнее значение статистической оценки определяет неизвестный параметр.
Статистическая оценка θ * неизвестного параметра θ называется состоятельной, если она стремится по вероятности к θ , ò.å.
limP{|θ * −θ | < ε} = 1 при любом ε > 0.
n→∞
6.4.3. Генеральная средняя. Выборочная средняя
Пусть значения случайной величины Х образуют генеральную совокупность. Математическое ожидание Х будем называть генеральной средней и обозначать xà ò.å. xà = M (X ).
Рассмотрим некоторую выборку x1, x2, …, xn (варианты могут повторяться) из генеральной совокупности Х. Будем ее рассматривать как значения n экземпляров Х1, Õ2, …, Õn СВ Х. Рассмотрим статистическую оценку
X Â = X1 + X2 + ...+ Xn , n
328
которая называется выборочной средней. Конкретное значе ние
статистической оценки X Â при выборке x1, x2, …, xn будет:
x  = x1 + x2 + ...+ xn n
(статистическая оценка X  является СВ, а x — конкретное зна-
чение X Â , зависящее от выборки).
В дальнейшем и x  будем называть выборочной средней. Если выборка задана в виде таблицы
õi |
õ1 |
õ2 |
… |
õm |
ni |
n1 |
n2 |
… |
nm |
|
|
|
|
|
òî ÿñíî, ÷òî n = n1 + n2 + … + nm
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
x |
× n |
+ x |
× n |
+...+ x |
|
×n |
|
|
å xi ×ni |
|
|
|
m |
m |
|
= |
. |
||||||
x |
= |
1 1 |
2 |
|
2 |
|
= |
i 1 |
||||
|
|
|
|
|
|
|
|
|||||
|
 |
|
|
|
|
n |
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
Выборочная средняя X Â является эффективной, несмещенной и состоятельной статистической оценкой для математичес кого
ожидания М(Х), т.е. для генеральной средней X Ã .
6.4.4. Выборочная дисперсия
Пусть значения СВ Х образуют генеральную совокупность. Дисперсию D (Х) CВ Х будем называть генеральной дисперсией и
обозначать DÃ, а среднее квадратическое отклонение σ Ã = DÃ
Требуется найти статистическую оценку для DÃ.
Пусть x1, x2, …, xn — выборка из генеральной совокупности Х, а Х1, Õ2, …, Õn – n экземпляров Х. Рассмотрим статистическую оценку
D = 1 ån (xi - x )2, n i=1
которая называется выборочной дисперсией. DÂ — случайная величина. Ее конкретное значение при данной выборке x1, …, xn
329
|
n |
å |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
равно d = |
1 |
|
n |
(xi - |
|
 )2 (d также называется выборочной дис- |
||||||||||||||||||||
|
i=1 |
x |
||||||||||||||||||||||||
|
||||||||||||||||||||||||||
персией). |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Если выборка из генеральной совокупности задана в виде та б- |
||||||||||||||||||||||||||
ëèöû |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
õi |
|
õ1 |
|
|
|
|
|
|
õ2 |
|
|
|
|
… |
|
|
|
|
õm |
|
||||||
ni |
|
|
n1 |
|
|
|
|
|
n2 |
|
|
|
|
… |
|
|
|
|
nm |
|
||||||
n = n1 + n2 + … + nm , òî |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
å (xi - x )2 ni |
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
d = |
|
|
i=1 |
|
|
|
. |
|
|
|
|
|
|
|
||||||
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
Пример 6.33. Пусть выборка задана таблицей |
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
õi |
|
0 |
|
|
|
|
|
|
|
–1 |
|
|
1 |
|
|
|
|
|
2 |
|
||||||
ni |
|
5 |
|
|
|
|
|
|
3 |
|
|
1 |
|
|
|
|
|
1 |
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
n = 5 + 3 + 1 + 1 = 10. Тогда |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
m |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
|
å xi × ni |
|
0×5 + (–1)×3 |
+1×1+ 2 ×1 |
|
|
|
|
|
|
||||||||||||
|
|
|
x |
= |
i=1 |
|
|
|
|
= |
= 0; |
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
n |
|
|
|
|
|
|
10 |
|
|
|
|
|
|
|
|
|
||||
d = |
02 ×5 + (–1)2 ×3 +12 ×1+ 22 ×1 |
= |
3 +1+ 4 |
= 0,8. |
|
|
|
|||||||||||||||||||
|
|
|
|
10 |
|
|
|
|
|
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
10 |
|
|
|
|
|
|
|
||||||||
DÂ является смещенной статистической оценкой для D (Х). |
||||||||||||||||||||||||||
Поэтому рассматривают статистическую оценку |
s2 = |
n |
×D , êî- |
|||||||||||||||||||||||
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n -1 |
 |
|
||
торая называется исправленной выборочной дисперсией. s2 ÿâëÿ- |
||||||||||||||||||||||||||
ется несмещенной статистической оценкой для DÃ Нетрудно ви- |
||||||||||||||||||||||||||
деть, что при больших n: s2 ≈ D . |
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
 |
|
|
|
|
|
|
|
|
|
|
|
|
||
Величина |
d = σ  |
называется выборочным среднеквадрати- |
||||||||||||||||||||||||
ческим отклонением, а |
s2 |
= s = |
n -1 |
σ Â — исправленным вы- |
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
борочным среднеквадратическим отклонением.
330