Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

шапкин задачи с решениями

.pdf
Скачиваний:
512
Добавлен:
15.04.2015
Размер:
2.34 Mб
Скачать

Нормально распределенной называется случайная величина , имеющая в интервале от – äî +плотность, определяемую формулой

 

 

-

1

æ x-a ö2

 

1

 

ç

 

÷

f (x) =

2

σ

σ 2π

×e

 

è

 

ø .

 

 

 

 

 

 

Ее интегральная функция:

x

 

 

x

-

1

æ z-a ö2

F (X ) = ò f (x) × dx = σ

1

π × ò

 

ç

 

÷

 

2

σ

 

e

è

ø

dz.

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ïðè σ = 1 и a = 0 будем иметь нормированное нормальное распределение

 

 

 

 

Fí (x) = 0,5 + Φ (x),

ãäå F (x) = 1π òx

e-

z2

dz — интеграл Лапласа.

2

2

0

 

 

 

 

 

 

 

Указанный интеграл можно вычислить, пользуясь таблицами , и тогда вероятность попадания СВ X в интервал определяется по формуле

P(x1 < X < x2) = F (x2) – F (x1)

(Φ (–x) = – Φ (x) — нечетная функция).

Доказано, что переход от нормированной к обычной функции осуществляется подстановкой:

æ x - a ö

F(x) = Fí ç

 

÷.

σ

è

ø

Пример 6.30. Случайная величина Х распределена нормально. Математическое ожидание и среднее квадратическое откло нение этой величины соответственно равны 2 и 5. Найти вероятность того, что в результате испытания СВ Х примет значение, принадлежащее интервалу (1; 4).

Решение. Воспользуемся формулой:

æ

β – à ö

æ α

P (α < X < β ) = F ç

 

÷

- F ç

σ

è

ø

è

à ö

÷.

σø

321

По условию: α = 1, β = 4, à = 2, σ = 5, следовательно,

æ 4 – 2

ö

æ1– 2

ö

= F (0,4) - F (–0,2).

P (1< X < 4) = F ç

 

÷

- F ç

 

÷

5

5

è

ø

è

ø

 

Так как функция Лапласа нечетная, то

F(–0,2) = –F(0,2).

Таким образом,

P (1 < X < 4) = F(0,4) +F(0,2).

По таблице находим:

F(0,4) = 0,1554; F(0,2) = 0,0793.

Искомая вероятность равна:

P (1 < X < 4)= 0,1554 + 0,0793 = 0,2347.

Пример 6.31. Три непрерывные случайные величины имеют различные распределения: а) равномерное; б) экспоненциаль ное; в) нормальное. Для всех трех распределений М (Хi) = σ i) = 4.

Найти для всех законов распределения вероятность того, чт о в результате испытания СВ Хi примет значение, заключенное в интервале (5; 12).

Решение.

а) Равномерное распределение.

Дифференциальная функция равномерного распределения СВ Х1 имеет вид:

ì

0

ïðè

x < a,

ï

1

 

 

ï

 

 

f (x) = í

 

ïðè a £ x £ b,

 

ïb - a

 

 

ï

0

ïðè

x > b.

î

Параметры а и b найдем из условия, что для равномерного распределения

ìM(X ) =

b + a

,

 

ìb + a

= 4,

 

 

ï

2

 

ï

1

2

 

 

 

 

 

 

í

 

 

 

 

èëè í

 

 

 

 

 

 

(b - a)

2

(b - a)

2

 

ïD (X ) =

 

ï

 

= 42.

 

 

 

 

 

 

 

 

ï

1

12

 

 

ï

12

 

 

 

î

 

 

 

î

 

 

 

322

Отсюда

ì

b + a = 8,

 

ì

+

 

= 8,

í

èëè

b

 

a

 

 

2

=192

í

 

 

= 8 3.

î(b - a)

 

 

îb - a

Решая эту систему, находим, что

a = 4 (1- 3 ) @ 2,93; b = 4 (1+ 3 ) @ 10,93.

При извлечении квадратного корня во втором уравнении сис - темы взят знак «+» с учетом того, что a < b.

Имеем

ì

 

0

ïðè

x < 4 (1-

3 ),

ï

 

1

 

 

 

ï

 

ïðè

4 (1- 3 ) £ x £ 4 (1+ 3 ),

f (x) = í

8

3

ï

 

 

 

ï

 

0

ïðè

x > 4 (1+

3 ).

î

 

Вероятность попадания СВ Х1 в интервале (α ; β ) определяем по формуле

β

P (α < X1 < β ) = ò f (x) dx.

α

Для нашего случая искомая вероятность равна:

P (5 < X

 

<12)

=

12

f (x)× dx =

4 (1+ 3 )

1

dx +

12

0× dx =

1

 

 

 

ò

 

 

ò

8

3

ò

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

5

 

 

5

 

 

4 (1+

3 )

 

 

1

 

4 (1+

3 )

1

 

 

 

 

 

=

 

x

 

 

=

(4 + 4

3 – 5) = 0,428.

 

8

3

5

 

8

3

 

 

 

 

 

Èòàê,

P (5 < X1 < 12) = 0,428.

б) Экспоненциальное распределение.

Интегральная функция экспоненциального распределения С В Х2 имеет вид:

F (x) = 1 – eλx.

323

Известно, что

M(X2 ) =

1

 

èëè

1

= 4

по условию. Отсюда

λ

 

 

 

 

 

 

λ

 

λ = 0,25. Тогда

 

 

 

 

 

 

 

 

F (x) = 1 – e–0,25x.

 

Искомая вероятность:

 

 

 

 

 

P (5 < X < 12) = e–0,25· 5

e–0,25· 12 = e–1,25 e–3 = 0,2367.

2

 

 

 

 

 

 

 

в) Нормальное распределение.

Вероятность того, что СВ Х3, подчиненная нормальному закону распределения, попадет в интервал (α; β ), равна:

 

æ

β – à ö

æ α

P (α < X3

< β ) = F ç

 

÷

- F ç

σ

 

è

ø

è

à ö

÷.

σø

Здесь Φ(х) — функция Лапласа, а — математическое ожидание, σ — среднее квадратическое отклонение. Так как по условию задачи а = σ = 4, то искомая вероятность равна:

æ12 – 4

ö

 

æ 5 – 4

ö

æ 1

ö

P (5 < X3 <12) = F ç

 

 

 

÷ - F ç

 

÷

= F (2) – F ç

 

÷.

 

4

 

 

4

è

 

 

ø

 

è 4

ø

è

ø

Находим по таблицам, что

 

 

 

 

 

 

 

 

 

 

F (2) = 0,4772;

F

æ

1

ö

= F (0,25) = 0,0987.

 

 

ç

 

 

÷

 

 

4

 

 

 

 

 

è

ø

 

 

 

 

 

 

Тогда

P (5 < X3 < 12) = 0,4772 – 0,0987 = 0,3785.

6.4.Основные понятия математической статистики

6.4.1.Генеральная совокупность. Выборка. Основные типы задач математической статистики

Пусть Х — некоторая случайная величина (количественный признак). В дальнейшем все значения этой СВ будем называть генеральной совокупностью. Если, например, Х — дискретная СВ, то генеральная совокупность — х1, õ2, …, õn.

Допустим, что в процессе наблюдений или опытов мы полу- чили n значений (х1, õ2, …, õn) случайной величины Х. В дальней-

324

шем будем говорить, что сделали выборку х1, õ2, …, õn из генеральной совокупности Х.

Число n называется объемом выборки.

Выборку х1, õ2, …, õn из генеральной совокупности Х также можно представить, как значения n экземпляров х1, õ2, …, õn слу- чайной величины Х.

Заметим, что среди элементов выборки могут быть повторяющиеся. Поэтому для каждого элемента хi выборки говорят о частоте ее появления, т.е. сколько раз число хi наблюдалось в выборке.

В дальнейшем мы часто будем задавать выборку в виде табли цы

õi

õ1

õ2

õm

ni

n1

n2

nm

 

 

 

 

 

ãäå õ1, õ2, …, õm — различные элементы выборки, а n1, n2, …, nm — частоты элементов выборки.

Ясно, что в этом случае объем выборки n = n1 + n2 + … + nm. Значения х1, …, õm выборки будем называть вариантами. Если варианты выборки расположены в возрастающем поряд-

ке, то выборка называется вариационным рядом. Например,

õi

 

–1

 

2

5

 

10

 

11

ni

 

2

 

7

1

 

1

 

5

Варианты

выборки

называются

равноотстоящими,

åñëè

Õi +1 – Õi = h, где h — постоянное число.

На практике при описании реальных процессов различные характеристики процесса являются случайными величинами . Поэтому возникают задачи определения законов распределен ия, математических ожиданий и других характеристик этих СВ, осн о- вываясь на изучении выборок.

Пусть значения СВ Х определяют генеральную совокупность и F (x) = P (X < x) — интегральная функция распределения Х. В дальнейшем мы будем ее называть теоретической функцией распределения генеральной совокупности Х. Зная функцию F(x), можно определить все характеристики СВ Х. Поэтому поставим перед собой следующую задачу: можно ли с помощью выборок из генеральной совокупности Х приближенно найти функцию F (x)?

325

Пусть задана выборка

õi

õ1

 

 

 

õ2

 

 

 

õm

ni

n1

 

 

 

n2

 

nm

 

 

 

 

 

 

 

 

 

объема n = n1 + n2 + … + nm.

 

nx

 

 

 

 

Построим функцию F *(x) =

,

ãäå nx — число вариантов

 

 

 

 

nx

 

 

n

 

 

 

выборки, меньших х, т.е.

 

 

представляет относительную часто-

 

n

 

 

 

 

 

 

 

 

 

ту вариант выборки, меньших х. Функция F* (x) называется функцией распределения выборки или эмпирической функцией р аспределения.

Пример 6.32. Найти эмпирическую функцию по выборке

õi

1

4

6

ni

10

15

25

Решение. Найдем объем выборки: n = 10 + 15 + 25 = 50. Наименьшая варианта равна единице, следовательно, F* (x) = 0 при x 1. Значение Х = 4, а именно х1 = 1, наблюдалось 10 раз, следовательно,

F * (x) = 1050 = 0,2 ïðè 1 < X £ 4.

Значения Х < 6, а именно х1 = 1 è õ2 = 4, наблюдались n1 + n2 = = 10 + 15 = 25 раз, следовательно,

F * (x) =

25 =

1 ïðè 4 < X £ 6.

 

50

2

 

Òàê êàê õ3 = 6 — наибольшая варианта, то

F * (x) = 50

= 1 ïðè õ > 6.

 

50

 

 

Значит,

ì 0

 

x £1,

 

ïðè

 

ï

ïðè

1 < x £ 4,

F * (x) = í0,2

 

0,5

ïðè

4 < x £ 6,

 

ï

ïðè

x > 6.

 

î 1

326

Графически эта функция изображена на рис. 80.

F*(x) 1,0

0,5

0,2

 

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

3

 

 

 

 

 

 

x

1

2

4

5

6

Ðèñ. 80

Эмпирическая функция F* (x) является приближением теоретической функции F (x), и чем больше объем выборки n, тем точ- нее F* (x) описывает F (x) (по вероятности, т.е. случайные отклонения маловероятны).

В заключение заметим: эмпирическая функция обладает анал о- гичными свойствами, что и теоретическая функция распреде ления.

6.4.2. Статистическая оценка параметров распределения

Пусть значения случайной величины Х образуют генеральную совокупность. Закон распределения СВ (например, нормальн ый закон) Х нам известен. Однако неизвестны некоторые параметры этого распределения (например, МО или дисперсия).

Требуется, изучая выборки из генеральной совокупности, оц е- нить, т.е. приближенно найти, неизвестный параметр.

Статистической оценкой неизвестного параметра называет ся всякая функция ϕ вариант xi выборки, дающая приближенное зна- чение этого параметра.

Если обозначим неизвестный параметр через θ , а его оценку через θ *, òî θ * = θ 1, …, õn), ãäå õ1, …, õn — выборка из генеральной совокупности Х.

Рассматривая варианты х1, …, õn выборки как значения n экземпляров Х1, …, Õn СВ Х, получим:

θ * = ϕ 1, …, Õn),

т.е. статистическая оценка θ * является функцией от случайных

327

величин Х1, …, Õn, а значит и сама является СВ. Таким образом, статистическая оценка θ * принимает значения (различные) в зависимости от выборки.

Ясно, что для одного и того же неизвестного параметра можно построить различные статистические оценки. Наша задач а понять, какие оценки являются «хорошими».

Во-первых, естественно желание, чтобы статистическая оцен - ка, являясь случайной величиной, имела своим математическ им ожиданием неизвестный параметр.

Статистическая оценка θ * неизвестного параметра θ называется несмещенной, если М (θ *) = θ .

Во-вторых, естественно требовать, чтобы значения статисти - ческой оценки θ * по возможности более тесно концентрировались около θ . Вспоминая, что дисперсия является мерой рассеяния зна- чений СВ около среднего значения, дадим следующее определ е- ние.

Статистическая оценка θ * неизвестного параметра θ называется эффективной, если она обладает наименьшей дисперсие й среди всех статистических оценок параметра θ .

В третьих, естественно считать, что, чем больше объем выбор - ки, тем точнее значение статистической оценки определяет неизвестный параметр.

Статистическая оценка θ * неизвестного параметра θ называется состоятельной, если она стремится по вероятности к θ , ò.å.

limP{|θ * −θ | < ε} = 1 при любом ε > 0.

n→∞

6.4.3. Генеральная средняя. Выборочная средняя

Пусть значения случайной величины Х образуют генеральную совокупность. Математическое ожидание Х будем называть генеральной средней и обозначать xà ò.å. xà = M (X ).

Рассмотрим некоторую выборку x1, x2, …, xn (варианты могут повторяться) из генеральной совокупности Х. Будем ее рассматривать как значения n экземпляров Х1, Õ2, …, Õn СВ Х. Рассмотрим статистическую оценку

X Â = X1 + X2 + ...+ Xn , n

328

которая называется выборочной средней. Конкретное значе ние

статистической оценки X Â при выборке x1, x2, …, xn будет:

x  = x1 + x2 + ...+ xn n

(статистическая оценка X  является СВ, а x — конкретное зна-

чение X Â , зависящее от выборки).

В дальнейшем и x  будем называть выборочной средней. Если выборка задана в виде таблицы

õi

õ1

õ2

õm

ni

n1

n2

nm

 

 

 

 

 

òî ÿñíî, ÷òî n = n1 + n2 + … + nm

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

x

× n

+ x

× n

+...+ x

 

×n

 

 

å xi ×ni

 

 

 

m

m

 

=

.

x

=

1 1

2

 

2

 

=

i 1

 

 

 

 

 

 

 

 

 

Â

 

 

 

 

n

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

Выборочная средняя X Â является эффективной, несмещенной и состоятельной статистической оценкой для математичес кого

ожидания М(Х), т.е. для генеральной средней X Ã .

6.4.4. Выборочная дисперсия

Пусть значения СВ Х образуют генеральную совокупность. Дисперсию D (Х) CВ Х будем называть генеральной дисперсией и

обозначать DÃ, а среднее квадратическое отклонение σ Ã = DÃ

Требуется найти статистическую оценку для DÃ.

Пусть x1, x2, …, xn — выборка из генеральной совокупности Х, а Х1, Õ2, …, Õn – n экземпляров Х. Рассмотрим статистическую оценку

D = 1 ån (xi - x )2, n i=1

которая называется выборочной дисперсией. DÂ — случайная величина. Ее конкретное значение при данной выборке x1, …, xn

329

 

n

å

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

равно d =

1

 

n

(xi -

 

 )2 (d также называется выборочной дис-

 

i=1

x

 

персией).

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Если выборка из генеральной совокупности задана в виде та б-

ëèöû

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

õi

 

õ1

 

 

 

 

 

 

õ2

 

 

 

 

 

 

 

 

õm

 

ni

 

 

n1

 

 

 

 

 

n2

 

 

 

 

 

 

 

 

nm

 

n = n1 + n2 + … + nm , òî

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å (xi - x )2 ni

 

 

 

 

 

 

 

 

 

 

 

 

d =

 

 

i=1

 

 

 

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 6.33. Пусть выборка задана таблицей

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

õi

 

0

 

 

 

 

 

 

 

–1

 

 

1

 

 

 

 

 

2

 

ni

 

5

 

 

 

 

 

 

3

 

 

1

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n = 5 + 3 + 1 + 1 = 10. Тогда

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

å xi × ni

 

0×5 + (–1)×3

+1×1+ 2 ×1

 

 

 

 

 

 

 

 

 

xÂ

=

i=1

 

 

 

 

=

= 0;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

d =

02 ×5 + (–1)2 ×3 +12 ×1+ 22 ×1

=

3 +1+ 4

= 0,8.

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

DÂ является смещенной статистической оценкой для D (Х).

Поэтому рассматривают статистическую оценку

s2 =

n

×D , êî-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n -1

Â

 

торая называется исправленной выборочной дисперсией. s2 ÿâëÿ-

ется несмещенной статистической оценкой для DÃ Нетрудно ви-

деть, что при больших n: s2 D .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Â

 

 

 

 

 

 

 

 

 

 

 

 

Величина

d = σ Â

называется выборочным среднеквадрати-

ческим отклонением, а

s2

= s =

n -1

σ Â — исправленным вы-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

борочным среднеквадратическим отклонением.

330