romanovskiy_romanovskaya_elementy_teorii_veroyatnostey
.pdfИз свойств математического ожидания и дисперсии для независимых случайных величин следует:
M [ |
|
|
|
1 |
M[ξ+ ξ+ K+ ξ] = |
1 |
[a + a +K+ a] = a; |
|||||||||||
ξ] = |
||||||||||||||||||
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
n |
1 |
2 |
|
n |
n |
|||||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
D[ |
|
|
|
1 |
D[ξ+ ξ+K+ ξ] = |
1 |
|
[D + D +K+ D] = |
D |
. |
||||||||
ξ] = |
||||||||||||||||||
|
|
|
|
|||||||||||||||
|
|
|
|
|
n2 |
1 |
2 |
n |
|
n2 |
|
|
|
n |
||||
|
|
|
|
|
|
|
|
|
|
|
|
Таким образом, случайная величина ξ имеет числовые
характеристики a,
; применяя к ней лемму 2, получим
n
требуемое неравенство (32).
Доказательство теоремы Чебышева.
В силу неравенства Чебышева (32) имеем при любом n двойное неравенство
|
|
ξ+ ξ+ K + ξ |
|
|
|
D |
|||
|
|
||||||||
|
|
1 2 |
n |
|
|
|
|
|
|
1 ≥ P |
|
- a |
|
< ε ≥ 1 – |
|
|
. |
||
|
|
n |
|
nε |
2 |
||||
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
Переходя к пределу при n ® ¥ и учитывая теорему сравнения из теории пределов, получим требуемое соотношение (30).
Замечание. Введем удобный термин. Пусть имеется
последовательность случайных величин |
|
h1, h2, …, hn, … . |
(33) |
Говорят, что последовательность (33) сходится по вероятности к неслучайной величине а и пишут
ηn |
¾¾® a при n ® ¥, |
|
âåð |
если для любого e > 0 выполняется соотношение
Р (| hn – a| <ε ) ® 1 при n ® ¥.
Очевидно, теорема Чебышева может быть сформулирована так: среднее арифметическое независимых однотипных случайных величин при неограниченном увеличении числа слагаемых сходится по вероятности к их общему математическому ожиданию.
71
Пример. Сколько надо провести независимых равноточных измерений данной величины, чтобы с вероятностью не менее 0,95 гарантировать отклонение среднего арифметического этих измерений от истинного значения величины не более, чем на 1 (по абсолютной величине), если СКО каждого измерения не превосходит 5?
Решение. |
Пусть xi – результат i-го измерения |
||
(i = 1,2,…, |
n), a – |
истинное значение измеряемой величины, |
|
то есть |
M [xi] |
= |
a при любом i; с учетом равноточности |
измерений xi |
имеют одинаковую дисперсию D ≤ 25. В силу |
||||||||||||
независимости |
измерений xi |
|
– |
независимые случайные |
|||||||||
величины. |
|
|
|
|
|
|
|
|
|
|
|
|
|
Необходимо найти n, при котором |
|
||||||||||||
|
|
|
ξ |
1 |
+ ξ |
2 |
+ K + ξ |
n |
|
|
|
|
|
|
|
|
|
|
|||||||||
P |
|
|
|
|
|
|
− a |
|
≤ |
1 ≥ 0,95. |
|||
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
В соответствии с неравенством Чебышева (32) данное неравенство будет выполняться, если
1 – |
D |
≥ 1– |
52 |
|
≥ 0,95, откуда легко найти |
nε 2 |
n ×1 |
n ≥500 измерений.
§2. Теорема Бернулли
Вначале курса теории вероятностей было сформулировано: вероятность случайного события есть доля наступления этого события в длинной серии независимых одинаковых испытаний. Укажем строгую математическую формулировку этого утверждения.
Пусть выполняется серия n независимых одинаковых испытаний и при каждом испытании событие А наступает с вероятностью р (схема Бернулли). Обозначим
Wn = |
число наступлений события А |
|
|
|
. |
||
n |
|||
|
|
Число Wn называется частотой события А в серии из n испытаний.
72
Теорема. В указанной ситуации при неограниченном возрастании числа независимых испытаний частота случайного события А сходится по вероятности к вероятности этого события:
Wn |
¾¾® p при n ® ¥. |
|
вер |
Доказательство. Очевидно, Wn – случайная величина, при этом справедливо равенство
Wn = ξ1 + ξ2 +K+ ξn , где n
xi – число наступлений события А в i -ом испытании. Проверим, что случайные величины xi удовлетворяют условиям теоремы Чебышева.
1.x1, x2, … , xn независимы в силу независимости испытаний.
2. Закон распределения случайной величины xi |
для всех |
||
i = 1, …, n имеет вид |
|
|
|
0 |
1 |
, q = 1 – p. |
(34) |
xi = |
|
||
|
|
|
|
q |
p |
|
|
Отсюда |
|
M [xi] = p · 1 + 0 · q = p, |
|
D [xi] = p (1 – p)2 + q (0 – p)2 = pq. |
(35) |
Следовательно, случайные величины xi однотипны с числовыми характеристиками: а = р, D = pq.
В силу теоремы Чебышева среднее арифметическое этих случайных величин сходится по вероятности к их общему математическому ожиданию:
|
ξ1 + ξ2 +K+ ξn |
|
вер |
при n ® ¥, |
|
|
|
¾¾® p |
|
|
n |
|
||
|
|
|
|
|
что и требовалось. |
|
|
|
|
Замечание 1. Из |
сказанного выше следует: число |
успехов (наступлений события А в схеме Бернулли) дается формулой
x= x1+ x2+ … + xn, |
(36) |
где xI – число успехов в i-ом испытании.
73
Из (35), (36) следует:
M [ξ] = n p, D [ξ] = npq. (37)
Таким образом, числовые характеристики биномиальной случайной величины спараметрами (n, p) даются формулами (37).
Замечание 2. Индикатором связанного с испытанием события А называется случайная величина, равная 1, если событие А произойдет и 0, если событие А не произойдет. Очевидно, закон распределения индикатора имеет вид (34), где р – вероятность наступления, q – вероятность ненаступления события А.
§ 3. Центральная предельная теорема
При изучении нормального распределения было сформулировано следующее утверждение: если случайные величины ξ1, ξ2, … , ξn независимы и нормальны с одними и теми же (а, σ), то сумма ξ1 + ξ2 + … + ξn также нормальна. Оказывается справедливо гораздо более глубокое утверждение: если случайные величины независимы и имеют один и тот же закон распределения (неважно какой), то при достаточно большом числе слагаемых сумма ξ1 + ξ2 + … + ξn приближенно нормальна. Это утверждение называется центральной предельной теоремой теории вероятности.
Приведем строгую формулировку этой теоремы. Рассмотрим бесконечную последовательность
независимых случайных величин ξ1, ξ2, … , ξn , … с одним и тем же законом распределения, в частности, с одними и теми
же параметрами (а, σ). |
|
||
Сумма первых n случайных величин |
|
||
ξ1 + ξ2 + … + ξn |
(38) |
||
имеет числовые характеристики |
|
||
M = na, D = nσ2 СКО=σ |
|
. |
(39) |
n |
Обозначим Fn(х) функцию распределения случайной величины (38). Поставим вопрос: как меняется Fn(х) при
74
неограниченном возрастании числа слагаемых?
Функция распределения нормальной случайной величины с числовыми характеристиками (39) имеет вид (см.§5 главы 4)
|
1 |
x - a n |
||||||
Фn (x) = |
|
+ Ф |
|
|
|
|
|
, |
2 |
|
|
|
|
|
|||
|
|
|
|
|||||
|
|
|
|
σ n |
||||
где Ф (х) – функция Лапласса. Справедлива |
||||||||
Теорема. В указанной ситуации имеет место |
||||||||
соотношение |
|
|
|
|
|
|
|
|
max | F (x) -Ф |
n |
(x) | ® 0 при n ® ¥. |
||||||
n |
|
|
|
|
|
|
||
по x |
|
|
|
|
|
|
|
|
Практически это означает: при достаточно большом числе слагаемых сумма (38) независимых случайных величин с одним и тем же законом распределения с большой точностью подчинена нормальному закону с параметрами
(na, s n ) независимо от закона распределения слагаемых.
Пример. Определить вероятность того, что продолжительность 100 производственных операций окажется в пределах от 77 до 82 ч., если среднее время одной операции 47,4с., а среднеквадратическое отклонение – 4,9 с.
Решение. Обозначим через xi – случайную величину, равную продолжительности i-ой производственной операции, i = 1, 2, …, 100. Очевидно, по условию а = m ξi = 47, 4 с.,
σξi = 4,9 с. Обозначим через ξ – случайную величину равную продолжительности 100 производственных операций, тогда ξ = x1 + x2 + … + x100. По условию xi независимые и однотипные случайные величины, следовательно, из центральной предельной теоремы вытекает, что ξ приближенно нормальна, mξ = 47,4×100= 4740,
σξ = 4,9 × 100 = 49 и по формуле (19) имеем
Р (77 · 60≤ ξ≤ 82 · 60) = Р (4620 ≤ ξ≤ 4920) =
75
|
4920 − 4740 |
|
4620 − 4740 |
|
|
|
|
= Ф |
|
|
− Ф |
|
|
= Ф(3, 673) − Ф(−2, 449) |
= |
|
|
||||||
|
49 |
|
|
49 |
|
|
|
= Ф(3, 673) + Ф(2, 449) = 0, 4998 + 0, 4857 = 0, 9855.
Замечание 1. Эта теорема впервые была доказана в XIXв. немецким математиком Линдебергом. Позднее русским ученым А.М.Ляпуновым утверждение этой теоремы было значительно усилено: оказалось, что в ней требование
одинакового закона распределения слагаемых не обязательно.
Приведем нестрогую формулировку теоремы Ляпунова: если случайные величины ξ1, ξ2, … , ξn независимы и каждая из них не доминирует над остальными, то при достаточно большом числе слагаемых их сумма приближенно нормальна.
Наиболее общая формулировка центральной предельной теоремы была получена русским ученым С.Н.Бернштейном в 20-е годы ХХ века.
Замечание 2. Теорема Ляпунова объясняет причину широкого распространения нормального закона. Действительно, в ряде случаев случайные величины представляют собой результат наложения большого числа независимых небольших случайных факторов. Например, на показание измерительного прибора влияет большое число случайных факторов: колебание температуры, влажность и плотность воздуха, небольшие погрешности при изготовлении и эксплуатации прибора и т. д. Эти факторы независимы и каждый из них не доминирует над остальными, поэтому в силу теоремы Ляпунова показания прибора с большой точностью является нормальной случайной величиной.
Замечание 3. Покажем, что приведенная §6 гл.1 формула Муавра-Лапласа (13) является следствием центральной предельной теоремы.
В §2 главы 5 было показано: число успехов в схеме Бернулли может быть представлено в виде суммы (38) независимых случайных величин (индикаторов) с одним и тем же законом распределения и числовыми
76
характеристиками m=np, D=npq.
Из центральной предельной теоремы следует: при достаточно большом числе испытаний число успехов ξ в схеме Бернулли является с большой точностью нормальной случайной величиной с функцией распределения
|
1 |
x − np |
||||
F(x) = |
|
+ Ф |
|
|
|
. |
|
|
|
|
|||
|
2 |
|
|
|
|
|
|
|
npq |
Откуда получаем
|
|
|
|
|
|
m |
2 |
− np |
m |
− np |
||||||||
P(m < ξ < m |
|
) ≈ F (m |
|
) − F (m ) = Ф |
|
|
|
|
− Ф |
1 |
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
||||||||
1 |
2 |
ξ |
2 |
ξ |
1 |
|
|
npq |
|
|
|
|
npq |
|
|
|||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Глава 6. Элементы математической статистики
§ 1. Предмет математической статистики
Математическая статистика – наука о способах получения выводов из данных опыта, полностью опирается на методы теории вероятностей, в этом смысле теория вероятностей является частью математической статистики.
Укажем основные разделы математической статистики.
1. Теория оценок
Эта теория дает подходы к приближенному вычислению параметров случайных величин (математического ожидания, дисперсии, ковариации и т.д.) по данным опыта.
2. Статистическая проверка гипотез
Эта теория дает подходы к проверке справедливости интересующих нас гипотез по данным опыта.
3. Дисперсионный анализ
Эта теория дает подходы к изучению слабых (статистических) зависимостей между величинами.
77
§ 2. Выборка из генеральной совокупности. Вариационный ряд. Гистограмма относительных частот
Пусть с испытанием связана случайная величина ξ и пусть в результате серии n независимых испытаний получен набор значений ξ :
x1 , x2 ,..., xn . |
(40) |
В математической статистике применяются следующие термины. Множество всех возможных значений случайной величины ξ называется генеральной совокупностью. Набор чисел (40) называется выборкой из генеральной совокупности, число n называется объемом выборки, числа (40) называются элементами выборки. Элементы выборки (40), расположенные в порядке возрастания называются
вариационным рядом:
|
|
|
xmin , ... |
, xmax - вариационный ряд. |
|||||||
Число ω = xmax − xmin называется размахом выборки. |
|||||||||||
Выполним следующие построения: |
|
|
|
|
|
||||||
α 0 |
|
α1 |
α 2 |
. . |
. |
α m−1 |
α m |
||||
|
|
|
|
|
|
|
|
|
|
|
|
xmin |
n1 |
n2 |
. . |
. |
nm |
xmax |
|||||
|
|
|
|
|
|
рис.27 |
|
|
|
|
|
1) |
разделим |
отрезок |
[xmin , xmax ] |
на |
некоторое число m |
||||||
|
|
|
|
|
|
|
ω |
|
|
|
|
|
интервалов одинаковой длины |
. |
|
|
|
|
|||||
|
|
|
|
|
|
m |
|
|
|
|
2)подсчитаем число элементов выборки, попадающих в каждый интервал:
n1 , n2 , ... , nm |
(41) |
Очевидно, n1 + n2 + ... + nm = n .
Числа (41) называются частотами попадания в интервал.
78
3) составим таблицу
Таблица 1
α |
|
− α |
|
α |
|
− α |
|
. . . |
||
|
0 |
|
|
1 |
|
1 |
|
|
2 |
|
|
|
n1 |
|
|
|
n2 |
|
|
||
|
|
|
|
|
|
|
|
|
|
. . . |
|
n |
|
|
|
n |
|
||||
|
|
|
|
|
|
|
α |
m−1 |
− α |
|
||
|
|
|
m |
||
|
|
nm |
. |
||
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
Элементы второй строки называются относительными частотами попадания в интервал.
Очевидно, |
n1 |
+ |
n2 |
+ . . . + |
nm |
= 1. |
n |
n |
|
||||
|
|
|
n |
Эта таблица называется выборочным распределением случайной величины ξ .
4) изобразим выборочное распределение на графике f* (x)
|
|
|
|
|
|
|
|
n2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
n1 |
|
|
|
. . |
. |
|
|
nm |
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
||||||
|
|
|
|
|
n |
|
|
|
|
n |
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
х |
|
|
α0 α1 |
|
|
|
|
|
|
|
|
||||||
|
|
|
|
α 2 . . |
. |
α m−1 α m |
||||||||||
|
|
|
|
|
|
|
|
|
|
|
рис. 28 |
|
|
|
|
|
|
За единицу |
масштаба |
на оси |
абсцисс примем длину |
интервала ω . Очевидно, площадь построенной ступенчатой m
фигуры равна единице.
Построенный график называется гистограммой относительных частот и представляет собой выборочный аналог плотности вероятности случайной величины.
79
§ 3. Выборочная функция распределения
Построим выборочный аналог функции распределения F (x).
Для этого вначале на каждом интервале (рис.27) выберем середину β i (i = 1,..., m) и составим таблицу.
Таблица 2
|
β |
|
|
β |
|
. . . |
β |
|
|
|
|
1 |
|
|
2 |
|
|
m |
|
n1 |
|
n2 |
|
nm . |
|||||
|
|
|
|
|
|
. . . |
|
|
|
|
|
|
n |
n |
|||||
n |
|
|
|
F*(x)
1
n1 + n2
n n1
n |
|
× × × |
|
|
|
|
|
|
|
0 |
b1 b2 b3 |
× × × |
bm-1 bm |
x |
рис. 29
На оси ординат откладываем накопленные относительные частоты. Кружочки на графике означают, что соответствующие точки выброшены.
Можно доказать, что при достаточно большом объеме выборки и при достаточно мелком делении интервалов с практической достоверностью F (x) близка к истинной функции распределения F (x).
80