Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

romanovskiy_romanovskaya_elementy_teorii_veroyatnostey

.pdf
Скачиваний:
64
Добавлен:
13.03.2016
Размер:
1.1 Mб
Скачать

Из свойств математического ожидания и дисперсии для независимых случайных величин следует:

M [

 

 

 

1

M[ξ+ ξ+ K+ ξ] =

1

[a + a +K+ a] = a;

ξ] =

 

 

 

 

 

 

 

 

 

 

n

1

2

 

n

n

 

 

 

 

 

 

 

 

 

 

 

D[

 

 

 

1

D[ξ+ ξ+K+ ξ] =

1

 

[D + D +K+ D] =

D

.

ξ] =

 

 

 

 

 

 

 

 

 

n2

1

2

n

 

n2

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Таким образом, случайная величина ξ имеет числовые

характеристики a,

; применяя к ней лемму 2, получим

n

требуемое неравенство (32).

Доказательство теоремы Чебышева.

В силу неравенства Чебышева (32) имеем при любом n двойное неравенство

 

 

ξ+ ξ+ K + ξ

 

 

 

D

 

 

 

 

1 2

n

 

 

 

 

 

 

1 ≥ P

 

- a

 

< ε ≥ 1 –

 

 

.

 

 

n

 

nε

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Переходя к пределу при n ® ¥ и учитывая теорему сравнения из теории пределов, получим требуемое соотношение (30).

Замечание. Введем удобный термин. Пусть имеется

последовательность случайных величин

 

h1, h2, …, hn, … .

(33)

Говорят, что последовательность (33) сходится по вероятности к неслучайной величине а и пишут

ηn

¾¾® a при n ® ¥,

 

âåð

если для любого e > 0 выполняется соотношение

Р (| hn a| <ε ) ® 1 при n ® ¥.

Очевидно, теорема Чебышева может быть сформулирована так: среднее арифметическое независимых однотипных случайных величин при неограниченном увеличении числа слагаемых сходится по вероятности к их общему математическому ожиданию.

71

Пример. Сколько надо провести независимых равноточных измерений данной величины, чтобы с вероятностью не менее 0,95 гарантировать отклонение среднего арифметического этих измерений от истинного значения величины не более, чем на 1 (по абсолютной величине), если СКО каждого измерения не превосходит 5?

Решение.

Пусть xi – результат i-го измерения

(i = 1,2,…,

n), a

истинное значение измеряемой величины,

то есть

M [xi]

=

a при любом i; с учетом равноточности

измерений xi

имеют одинаковую дисперсию D ≤ 25. В силу

независимости

измерений xi

 

независимые случайные

величины.

 

 

 

 

 

 

 

 

 

 

 

 

 

Необходимо найти n, при котором

 

 

 

 

ξ

1

+ ξ

2

+ K + ξ

n

 

 

 

 

 

 

 

 

 

P

 

 

 

 

 

 

a

 

1 ≥ 0,95.

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

В соответствии с неравенством Чебышева (32) данное неравенство будет выполняться, если

1 –

D

≥ 1–

52

 

≥ 0,95, откуда легко найти

nε 2

n ×1

n ≥500 измерений.

§2. Теорема Бернулли

Вначале курса теории вероятностей было сформулировано: вероятность случайного события есть доля наступления этого события в длинной серии независимых одинаковых испытаний. Укажем строгую математическую формулировку этого утверждения.

Пусть выполняется серия n независимых одинаковых испытаний и при каждом испытании событие А наступает с вероятностью р (схема Бернулли). Обозначим

Wn =

число наступлений события А

 

 

.

n

 

 

Число Wn называется частотой события А в серии из n испытаний.

72

Теорема. В указанной ситуации при неограниченном возрастании числа независимых испытаний частота случайного события А сходится по вероятности к вероятности этого события:

Wn

¾¾® p при n ® ¥.

 

вер

Доказательство. Очевидно, Wn – случайная величина, при этом справедливо равенство

Wn = ξ1 + ξ2 +K+ ξn , где n

xi – число наступлений события А в i -ом испытании. Проверим, что случайные величины xi удовлетворяют условиям теоремы Чебышева.

1.x1, x2, … , xn независимы в силу независимости испытаний.

2. Закон распределения случайной величины xi

для всех

i = 1, …, n имеет вид

 

 

 

0

1

, q = 1 – p.

(34)

xi =

 

 

 

 

 

q

p

 

 

Отсюда

 

M [xi] = p · 1 + 0 · q = p,

 

D [xi] = p (1 – p)2 + q (0 – p)2 = pq.

(35)

Следовательно, случайные величины xi однотипны с числовыми характеристиками: а = р, D = pq.

В силу теоремы Чебышева среднее арифметическое этих случайных величин сходится по вероятности к их общему математическому ожиданию:

 

ξ1 + ξ2 +K+ ξn

 

вер

при n ® ¥,

 

 

 

¾¾® p

 

n

 

 

 

 

 

что и требовалось.

 

 

 

Замечание 1. Из

сказанного выше следует: число

успехов (наступлений события А в схеме Бернулли) дается формулой

x= x1+ x2+ … + xn,

(36)

где xI – число успехов в i-ом испытании.

73

Из (35), (36) следует:

M [ξ] = n p, D [ξ] = npq. (37)

Таким образом, числовые характеристики биномиальной случайной величины спараметрами (n, p) даются формулами (37).

Замечание 2. Индикатором связанного с испытанием события А называется случайная величина, равная 1, если событие А произойдет и 0, если событие А не произойдет. Очевидно, закон распределения индикатора имеет вид (34), где р – вероятность наступления, q – вероятность ненаступления события А.

§ 3. Центральная предельная теорема

При изучении нормального распределения было сформулировано следующее утверждение: если случайные величины ξ1, ξ2, … , ξn независимы и нормальны с одними и теми же (а, σ), то сумма ξ1 + ξ2 + … + ξn также нормальна. Оказывается справедливо гораздо более глубокое утверждение: если случайные величины независимы и имеют один и тот же закон распределения (неважно какой), то при достаточно большом числе слагаемых сумма ξ1 + ξ2 + … + ξn приближенно нормальна. Это утверждение называется центральной предельной теоремой теории вероятности.

Приведем строгую формулировку этой теоремы. Рассмотрим бесконечную последовательность

независимых случайных величин ξ1, ξ2, … , ξn , … с одним и тем же законом распределения, в частности, с одними и теми

же параметрами (а, σ).

 

Сумма первых n случайных величин

 

ξ1 + ξ2 + … + ξn

(38)

имеет числовые характеристики

 

M = na, D = nσ2 СКО=σ

 

.

(39)

n

Обозначим Fn(х) функцию распределения случайной величины (38). Поставим вопрос: как меняется Fn(х) при

74

неограниченном возрастании числа слагаемых?

Функция распределения нормальной случайной величины с числовыми характеристиками (39) имеет вид (см.§5 главы 4)

 

1

x - a n

Фn (x) =

 

+ Ф

 

 

 

 

 

,

2

 

 

 

 

 

 

 

 

 

 

 

 

 

σ n

где Ф (х) – функция Лапласса. Справедлива

Теорема. В указанной ситуации имеет место

соотношение

 

 

 

 

 

 

 

 

max | F (x) -Ф

n

(x) | ® 0 при n ® ¥.

n

 

 

 

 

 

 

по x

 

 

 

 

 

 

 

 

Практически это означает: при достаточно большом числе слагаемых сумма (38) независимых случайных величин с одним и тем же законом распределения с большой точностью подчинена нормальному закону с параметрами

(na, s n ) независимо от закона распределения слагаемых.

Пример. Определить вероятность того, что продолжительность 100 производственных операций окажется в пределах от 77 до 82 ч., если среднее время одной операции 47,4с., а среднеквадратическое отклонение – 4,9 с.

Решение. Обозначим через xi – случайную величину, равную продолжительности i-ой производственной операции, i = 1, 2, …, 100. Очевидно, по условию а = m ξi = 47, 4 с.,

σξi = 4,9 с. Обозначим через ξ – случайную величину равную продолжительности 100 производственных операций, тогда ξ = x1 + x2 + … + x100. По условию xi независимые и однотипные случайные величины, следовательно, из центральной предельной теоремы вытекает, что ξ приближенно нормальна, mξ = 47,4×100= 4740,

σξ = 4,9 × 100 = 49 и по формуле (19) имеем

Р (77 · 60≤ ξ≤ 82 · 60) = Р (4620 ≤ ξ≤ 4920) =

75

 

4920 − 4740

 

4620 − 4740

 

 

 

= Ф

 

 

− Ф

 

 

= Ф(3, 673) − Ф(−2, 449)

=

 

 

 

49

 

 

49

 

 

 

= Ф(3, 673) + Ф(2, 449) = 0, 4998 + 0, 4857 = 0, 9855.

Замечание 1. Эта теорема впервые была доказана в XIXв. немецким математиком Линдебергом. Позднее русским ученым А.М.Ляпуновым утверждение этой теоремы было значительно усилено: оказалось, что в ней требование

одинакового закона распределения слагаемых не обязательно.

Приведем нестрогую формулировку теоремы Ляпунова: если случайные величины ξ1, ξ2, … , ξn независимы и каждая из них не доминирует над остальными, то при достаточно большом числе слагаемых их сумма приближенно нормальна.

Наиболее общая формулировка центральной предельной теоремы была получена русским ученым С.Н.Бернштейном в 20-е годы ХХ века.

Замечание 2. Теорема Ляпунова объясняет причину широкого распространения нормального закона. Действительно, в ряде случаев случайные величины представляют собой результат наложения большого числа независимых небольших случайных факторов. Например, на показание измерительного прибора влияет большое число случайных факторов: колебание температуры, влажность и плотность воздуха, небольшие погрешности при изготовлении и эксплуатации прибора и т. д. Эти факторы независимы и каждый из них не доминирует над остальными, поэтому в силу теоремы Ляпунова показания прибора с большой точностью является нормальной случайной величиной.

Замечание 3. Покажем, что приведенная §6 гл.1 формула Муавра-Лапласа (13) является следствием центральной предельной теоремы.

В §2 главы 5 было показано: число успехов в схеме Бернулли может быть представлено в виде суммы (38) независимых случайных величин (индикаторов) с одним и тем же законом распределения и числовыми

76

характеристиками m=np, D=npq.

Из центральной предельной теоремы следует: при достаточно большом числе испытаний число успехов ξ в схеме Бернулли является с большой точностью нормальной случайной величиной с функцией распределения

 

1

x − np

F(x) =

 

+ Ф

 

 

 

.

 

 

 

 

 

2

 

 

 

 

 

 

npq

Откуда получаем

 

 

 

 

 

 

m

2

− np

m

− np

P(m < ξ < m

 

) ≈ F (m

 

) − F (m ) = Ф

 

 

 

 

− Ф

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

ξ

2

ξ

1

 

 

npq

 

 

 

 

npq

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Глава 6. Элементы математической статистики

§ 1. Предмет математической статистики

Математическая статистика – наука о способах получения выводов из данных опыта, полностью опирается на методы теории вероятностей, в этом смысле теория вероятностей является частью математической статистики.

Укажем основные разделы математической статистики.

1. Теория оценок

Эта теория дает подходы к приближенному вычислению параметров случайных величин (математического ожидания, дисперсии, ковариации и т.д.) по данным опыта.

2. Статистическая проверка гипотез

Эта теория дает подходы к проверке справедливости интересующих нас гипотез по данным опыта.

3. Дисперсионный анализ

Эта теория дает подходы к изучению слабых (статистических) зависимостей между величинами.

77

§ 2. Выборка из генеральной совокупности. Вариационный ряд. Гистограмма относительных частот

Пусть с испытанием связана случайная величина ξ и пусть в результате серии n независимых испытаний получен набор значений ξ :

x1 , x2 ,..., xn .

(40)

В математической статистике применяются следующие термины. Множество всех возможных значений случайной величины ξ называется генеральной совокупностью. Набор чисел (40) называется выборкой из генеральной совокупности, число n называется объемом выборки, числа (40) называются элементами выборки. Элементы выборки (40), расположенные в порядке возрастания называются

вариационным рядом:

 

 

 

xmin , ...

, xmax - вариационный ряд.

Число ω = xmax xmin называется размахом выборки.

Выполним следующие построения:

 

 

 

 

 

α 0

 

α1

α 2

. .

.

α m−1

α m

 

 

 

 

 

 

 

 

 

 

 

xmin

n1

n2

. .

.

nm

xmax

 

 

 

 

 

 

рис.27

 

 

 

 

 

1)

разделим

отрезок

[xmin , xmax ]

на

некоторое число m

 

 

 

 

 

 

 

ω

 

 

 

 

 

интервалов одинаковой длины

.

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

2)подсчитаем число элементов выборки, попадающих в каждый интервал:

n1 , n2 , ... , nm

(41)

Очевидно, n1 + n2 + ... + nm = n .

Числа (41) называются частотами попадания в интервал.

78

3) составим таблицу

Таблица 1

α

 

− α

 

α

 

− α

 

. . .

 

0

 

 

1

 

1

 

 

2

 

 

 

n1

 

 

 

n2

 

 

 

 

 

 

 

 

 

 

 

 

. . .

 

n

 

 

 

n

 

 

 

 

 

 

 

 

α

m−1

− α

 

 

 

 

m

 

 

nm

.

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

Элементы второй строки называются относительными частотами попадания в интервал.

Очевидно,

n1

+

n2

+ . . . +

nm

= 1.

n

n

 

 

 

 

n

Эта таблица называется выборочным распределением случайной величины ξ .

4) изобразим выборочное распределение на графике f* (x)

 

 

 

 

 

 

 

 

n2

 

 

 

 

 

 

 

 

 

 

 

 

 

n1

 

 

 

. .

.

 

 

nm

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

n

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

х

 

 

α0 α1

 

 

 

 

 

 

 

 

 

 

 

 

α 2 . .

.

α m−1 α m

 

 

 

 

 

 

 

 

 

 

 

рис. 28

 

 

 

 

 

 

За единицу

масштаба

на оси

абсцисс примем длину

интервала ω . Очевидно, площадь построенной ступенчатой m

фигуры равна единице.

Построенный график называется гистограммой относительных частот и представляет собой выборочный аналог плотности вероятности случайной величины.

79

§ 3. Выборочная функция распределения

Построим выборочный аналог функции распределения F (x).

Для этого вначале на каждом интервале (рис.27) выберем середину β i (i = 1,..., m) и составим таблицу.

Таблица 2

 

β

 

 

β

 

. . .

β

 

 

 

 

1

 

 

2

 

 

m

n1

 

n2

 

nm .

 

 

 

 

 

 

. . .

 

 

 

 

 

 

n

n

n

 

 

 

F*(x)

1

n1 + n2

n n1

n

 

× × ×

 

 

 

 

 

 

0

b1 b2 b3

× × ×

bm-1 bm

x

рис. 29

На оси ординат откладываем накопленные относительные частоты. Кружочки на графике означают, что соответствующие точки выброшены.

Можно доказать, что при достаточно большом объеме выборки и при достаточно мелком делении интервалов с практической достоверностью F (x) близка к истинной функции распределения F (x).

80

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]