Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
тиун. рук-во.DOC
Скачиваний:
55
Добавлен:
11.04.2015
Размер:
2.02 Mб
Скачать

Тема 3. Повторные независимые испытания

Определение повторных независимых испытаний. Формула Бернулли и ее следствия. Наивероятнейшая частота появления события и ее вычисление. Локальная теорема Муавра-Лапласа. Функция и ее свойства. Формула Пуассона и ее приложения. Интегральная теорема Муавра-Лапласа. Функция Лапласа и ее свойства. Вероятности отклонений частоты от наивероятнейшей частоты и относительной частоты от вероятности появления события.

Л и т е р а т у р а

[2], гл.1, § 3, гл.5, § 3-5; [3], гл.4; [5], гл.5, § 1-4, гл.6, § 5,6; [6], гл.1; [7], гл.5, 6; [8], гл.2, § 1-3; [9], гл.2, § 1-5; [11], гл.28, § 189-195; [12], ч.2, гл.2, § 5-8; [13], гл.20, § 8; [15], гл.4, § 1-3.

О с н о в н ы е ф о р м у л ы и м е т о д и ч е с к и е у к а з а н и я

Если производится n повторных независимых опытов, в каждом из которых появляется либо событие А с вероятностью р, либо событие с вероятностьюq=1-р, то вероятность Рn(m) того, что событие А появится ровно m раз, выражается формулой Бернулли

Рn(m) = рm qn-m. (3.1)

Вероятность того, что А появится хотя бы один раз при n повторных независимых испытаниях, вычисляется по следующей формуле:

Рn (m  1) = 1 – qn . (3.2)

Наивероятнейшая частота m0 удовлетворяет неравенствам

np – q  m0  np + p. (3.3)

Если число np+p – целое, то наивероятнейшее число m0 имеет только одно значение. Этим значением будет целая часть числа np+р. Если np+p – число дробное, то m0 принимает два значения: m0=np-q=np+p-1 и m0=np+p. При достаточно большом числе проведенных испытаний m0 примерно равно np (m0  np).

При большом числе испытаний для вычисления Рn(m) применяются следующие приближенные равенства:

Рn(m)  (3.4)

Рn(m)  (3.5)

В литературе обычно имеются таблицы значений функции и выражения р(m, λ) = .

Вероятность того, что событие А наступит не менее k раз и не более r раз, находится по приближенной формуле

Рn (k  m  r)  Ф- Ф, (3.6)

где Ф(х) = - функция Лапласа, для которой имеется таблица значений.

Формула (3.4) называется локальной теоремой Муавра-Лапласа, формула (3.6) – интегральной теоремой Муавра-Лапласа. Формулу (3.5) называют теоремой Пуассона.

Вероятности отклонений частоты m от наивероятнейшей частоты m0 и относительной частоты W от постоянной вероятности р события А при достаточно больших n вычисляются, соответственно, по следующим приближенным формулам:

Рn Ф , (3.7)

Рn , (3.8)

где Ф(х) – функция Лапласа и - любое положительное число.

При n величина 2ФФстремится к единице. Тогда событиепрактически достоверно. Если числодостаточно мало, то за гипотетическую вероятность р события А можно принять относительную частотуW(А) = этого события. Величина, определяемая равенствомРn , называется надежностью. Таким образом, надежность есть вероятность совпадения частоты W=и вероятности р появления события в отдельном испытании с точностью до: р=.

При практическом применении теории вероятностей часто встречаются задачи на повторение опытов (испытаний). Многие же задачи моделируются как задачи на повторные испытания. Решаются они просто в случае, когда опыты являются независимыми. В этом прежде всего и надо убедиться.

В каждом отдельном опыте появляется либо событие А, либо ему противоположное (в конкретной задаче эти события надо сразу описать). Если вероятность события А во всех опытах постоянна (опыт производится в одинаковых условиях,Р(А)=р, Р()=q1-р), то говорят, что имеет место схема Бернулли. Тогда Рn(m) вычисляется по формуле (3.1).

Может быть и более общая схема: независимые опыты производятся в различных условиях (вероятность события А от опыта к опыту меняется). Имеется способ вычисления Рn(m) и в этой ситуации (см., например, [3] ).

Примерами независмых опытов являются: неоднократное бросание монеты (игральной кости), многократное извлечение карты из колоды (шара из урны, изделия из партии) при условии, что выбранный предмет возвращается.

Иногда допускают ошибку. В отборах без возвращения применяют биномиальное распределение (формулу Бернулли), на самом же деле надо применять гипергеометрическое распределение. Поясним это разбором задачи.

В урне находятся 5 белых и 10 черных шаров. Из урны наугад извлекли 3 шара. Какова вероятность того, что два из них окажутся белыми?

Решение (ошибочное). Обозначим через А событие, состоящее в том, что отдельно взятый шар будет белым. Тогда, согласно условию, за р принимают число : р=, q=. Далее, полагаютn=3, m=2. Вероятность искомого события (два белых шара при вынутых трех) вычисляют по формуле Бернулли:

Р3(2) = .

Приведенное решение было бы верным, если бы опыты проводились в неизменных условиях. Для этого шары надо обратно возвращать в урну и перемешивать. По условию нашей задачи из урны вынули три шара (следовательно, они не возвращались). В этом случае уже нельзя говорить о неизменности условий всех трех опытов, так как после каждого извлечения состав шаров в урне будет меняться.

Для правильного решения применим классический способ подсчета вероятностей. Число возможных исходов будет , из них благоприятными для интересующего нас события будутисходов. Тогда искомая вероятностьР=.

Формула Бернулли (3.1) дает точное значение Рn(m), однако для больших значений n и m появляются вычислительные трудности, прежде всего из-за выражения для . Поясним это примером. Пустьn=1000, m=25, р=0,03. Тогда согласно (3.1) надо вычислять выражение

Поэтому возникает необходимость в более простых формулах для Рn(m). Таковыми являются формулы (но уже приближенные) (3.4) и (3.5).

Формула (3.4) дает тем более близкие к точному значению Рn(m) результаты, чем больше значение . При этом здесь сказывается не только значениеn, но и значение pq. Обычно формулой (3.4) пользуются, когда npq20. Из этого ограничения видно, что чем ближе одно из чисел p или q к нулю (другое число будет близко к единице), тем большим надо брать n. Погрешность этой формулы порядка .

Найдем наибольшее значение выражения pqр(1-р). Рассмотрим функцию f(р)=р(1-р)р-р2, 0  р  1. Очевидно, что она достигает своего наибольшего значения при р=. Следовательно, при одних и тех же значенияхn формула (3.4) дает тем лучшее приближение к значению Рn(m) из формулы Бернулли, чем ближе pq к своему наибольшему значению 0,25, т.е. чем ближе р (отсюда и q) к 0,5.

В случае, если вероятность р близка к нулю и число n мало, формула (3.4) дает заметные отклонения от формулы Бернулли.

Асимптотическая формула (3.5) применяется для редких событий (со значениями р, близкими к нулю). Приближение тем лучше, чем больше n и меньше p. Обычно формулой (3.5) пользуются при условии =np10. Погрешность формулы (3.5) np2.

Задачи с редкими событиями встречаются на практике в лотереях, страховании, при проверке качества изделий с низким процентом брака, в медицине (рождение близнецов, заболевание редкой инфекционной болезнью) и т.п.

Если р близко к единице (например, р0,97), то q близко к нулю (q0,03). Тогда формулу Пуассона (3.5) можно применить для вычисления вероятности того, что произойдетn-m раз. Надо в (3.5) положить =nq, а вместо m написать n-m. Найденная вероятность даст приближенное значение вероятности того, что А произойдет ровно m раз.

Как уже отмечалось, для функций (х) и р(m, ) имеются таблицы. Так как(х) четна ((-х)= (х)), то ее таблицы составлены для х  0. При х>4 можно полагать (х)0, так как (3,99)0,0001 и (х) монотонно убывает при х>0. Если в таблице значений нет нужного аргумента, то можно провести либо округление этого аргумента до ближайшего, либо для нахождения значения функции воспользоваться методом (линейной) интерполяции.

Поясним метод линейного интерполирования для нашей ситуации. Аргумент , которого нет в таблице, будет заключен между некоторыми двумя аргументамих1 и х2, имеющимися в таблице (х1 < < х2). Соответствующие аргументам х1 и х2 значения y1 и y2 нашей функции будут даны в таблице: (х1)y1, (х2)y2. Тогда запишем уравнение прямой, проходящей через точки (х1, y1) и (х2, y2). Оно имеет вид

y-y1=; ограничениех1х2 выполняется автоматически, т.к. х1<х2. Получилась линейная функция y=. Значение этой линейной функции в точкеи принимают за приближенное значение неизвестного().

В ряде учебников имеются таблицы значений функции р(m, )=для некоторыхm и (см., например,[8], [11] ). Иногда приводят (см.[3] ) только значения (одного множителя нашей функции). Значения второго множителяпри небольших значениях m легко вычислить.

Если число n независимых испытаний мало и надо вычислить вероятность появления события А от k до r раз, то надо применить следующую формулу: Рn(k  m  r) = Рn(m). В этой ситуации k и r не могут быть большими (мало n) и все Рn(m) можно вычислить по формуле Бернулли. Приведенная формула есть следствие теоремы о вероятности суммы попарно несовместных событий.

Эту последнюю формулу можно применять и при достаточно большом числе испытаний, если в сумме справа число слагаемых невелико (мало число r-k). При этом для вычисления Рn(m) при малых значениях р (р0,03) надо применять приближенную формулу (3.5), а в остальных случаях – (3.4).

Если же число n велико и число слагаемых в сумме Рn(m) велико, то применяется приближенная формула Муавра-Лапласа (3.6). Условием ее применения является неравенство npq  20.

В этой формуле участвует функция Лапласа Ф(х), называемая еще интегралом вероятностей. Значения этой функции приводятся почти в каждом из рекомендуемых учебников. Только надо помнить, что в ряде учебников (см., например, [7], [8], [11] ) эти значения удвоены. Тогда в (3.6) надо подставлять значения в два раза меньшие (можно также, не уменьшая этих значений, ввести справа в (3.6) множитель , относящийся к обоим слагаемым).

Таблицы Ф(х) приведены для х0. Для отрицательных аргументов значения этой функции находятся на основании ее свойства, что

Ф(-х) = -Ф(х) . Например, Ф(-2) = -Ф(2)  -0,4 772 (см. [5], приложение 2). Далее, для х>5 приближенно полагают Ф(х), так как Ф(5)0,499 997 и Ф(х)прих+.

Сделаем некоторые пояснения по поводу формулы (3.8). Прежде всего она имеет теоретическое значение. Из нее следует так называемый закон больших чисел Бернулли, который будет рассмотрен в дальнейшем. Она объясняет, что статистическое определение вероятности события введено разумно.

Эта формула имеет значительные практические приложения. Зная р, n и , из (3.8) находим надежность . Если известны р, n и , то можно найти точность . Наконец, что очень важно на практике, можно по р, заданным  и  оценить число n (число испытаний, необходимых для какого-нибудь контроля). Более того, можно оценить n только при известных  и  (р- неизвестно).

Надежность  приближенно получается из равенства (3.8):

 = 2Ф . (3.9)

Обозначим через величину :

= . (3.10)

Решая уравнение (3.9) (= 2Ф()), по таблице значений функции Лапласа Ф(х) найдем аргумент , соответствующий данной надежности. Из (3.10) находится точность  при известных р, n и:

 = .

Тогда с надежностью  определяются границы, в которых заключены частость и частота события в серии из n испытаний:

, .

Из (3.10) получается и формула для определения необходимого числа n испытаний при известных р, , :

.

Из последнего равенства при неизвестном р в силу оценки pq=p(1-p)получаем , т.е. достаточно провестиn0 испытаний для определения неизвестной вероятности р появления события с заданной точностью и надежностью.

Р е ш е н и е т и п о в ы х з а д а ч

Задача 1. Вероятность того, что в данный день торговая база уложится в норму транспортных расходов, равна ¾. Определить веротяность того, что торговая база уложится в норму транспортных расходов только в два дня при шестидневной рабочей неделе.

Решение. Обозначим через А событие, что в любой день рабочей недели торговая база уложится в норму своих транспортных расходов, тогда - база не уложится в эту норму. Вероятности этих событий постоянны. Очевидно, что эту задачу можно моделировать как задачу на повторные независимые испытания:n=6, m=2, р=Р(А)=3/4 (q=Р()=1/4). Следовательно, по формуле Бернулли (3.1) искомая вероятность Р6(2)=

Задача 2. В магазин завезли 500 бутылок минеральной воды. Вероятность того, что при перевозке бутылка окажется разбитой, равна 0,002. Найти вероятность того, что магазин получит три разбитых бутылки.

Решение. Испытания, рассматриваемые в задаче, удовлетворяют схеме Бернулли. По условию задачи n=500, m=3, р=0,002. Так как n достаточно велико, а р=0,002 сравнительно мало, то для вычисления Р500(3) можно воспользоваться формулой Пуассона (3.5). Так как =np=1, то

Р500(3)   0,0 613.

Задача 3. По статистическим данным среди специалистов с высшим и средним специальным образованием женщины составляют 60%. На предприятии 240 таких работников. Определить наивероятнейшее число специалистов-мужчин, имеющих среднее специальное и высшее образование, и соответствующую ему вероятность.

Решение. Так как надо определить наивероятнейшее число специалистов-мужчин, то через А обозначим событие, состоящее в том, что выбранный специалист с высшим или средним специальным образованием – мужчина. Тогда событие означает, что выбранная женщина имеет высшее или среднее специальное образование. По условию задачиn=240, p=Р(А)=0,4 (тогда q=Р()=0,6). Следовательно, 2400,4 - 0,6  m0  2400,4+0,4, 95,4 m0  96,4. Так как m0 – целое число, то наиболее вероятно, что 96 мужчин будут иметь высшее или среднее специальное образование. Для приближенного нахождения Р240(96) применим локальную теорему Лапласа (3.4). Вначале вычислим = 0. По таблице (см.[5], приложение 1) найдем (0)0,3 989. Следовательно, искомая вероятность

Р240(96)   0,3989  0,0 526.

Задача 4. Вероятность попадания в цель при отдельном выстреле равна 0,001. Найти вероятность попадания в цель хотя бы один раз, если произведено 5000 выстрелов.

Решение. По условию задачи n=5 000, р=0,001, m  1. Надо найти Р5000 (m1). Можно применить формулу (3.2), где q=1-0,001=0,999. Чтобы не вычислять значение qn=(0,999)5 000, нужно по формуле (3.5) для редких событий вычислить Р5 000(0). Так как =np=5 0000,001=5, то Р5 000(0)=е-5. Тогда искомая вероятность Р5 000(m1)=1-Р5 000(0) =1-е-5 1-0,0 067 =0,9 933.

Задача 5. На автоматическом станке с программным управлением изготовлены 24 изделия. Вероятность того, что изделие будет высшего сорта, равна 0,6. Найти наивероятнейшее число изделий высшего сорта, произведенных на данном станке.

Решение. Проводятся 24 повторных независимых испытания с двумя исходами в каждом (деталь высшего сорта и деталь не высшего сорта). По условию р=0,6, q=0,4, n=24. Наивероятнейшее число изделий высшего сорта находим из неравенств (3.3): 240,6 - 0,4  m0  240,6 + 0,6 или

14  m0  15. Получили два наивероятнейших числа, т.е. m0=14 и m0=15.

Задача 6. По результатам проверки качества отобранного для посева зерна кукурузы всхожесть зерен составила 80%. Определить вероятность того, что среди отобранных и высаженных 400 зерен прорастет от 270 до 330 штук.

Решение. По условию задачи n=400, k=270, r=330. Для вычисления Р400(270  m  330) можно использовать формулу (3.6). Вычислим аргументы:

По таблице Ф(х) найдем Ф(1,25)  0,3 944. Так как Ф(х) нечетна, то

Ф(-6,25) = -Ф(6,25). Учитывая, что Ф(х)0,5 для х>5, получим Ф(6,25)0,5. Следовательно, Р400 (270  m  330)  0,3 944 + 0,5 = 0,8 944.

Задача 7. В автобусном парке имеется 80 машин. Вероятность выхода автобуса на линию равна 0,9. Для обеспечения нормальной работы маршрутов необходимо иметь на линиях не менее 70 машин. Определить вероятность нормального функционирования автобусных маршрутов.

Решение. Для нахождения вероятности того, что из имеющихся в наличии в автобусном парке 80 машин на маршруты выйдут не менее 70, воспользуемся формулой (3.6). По условию n=80, р=0,9, q=0,1. Далее, так как m  70, то k=70, r=80. Вычислим аргументы:

Учитывая, что функция Лапласа нечетна, получим

Р80 (70  m  80)  Ф(2,98) – Ф(-0,75) = Ф(2,98) + Ф(0,75).

По таблице (см. [5], приложение 2) найдем Ф(2,98)0,4 986, Ф(0,75)0,2 734.Искомая вероятность Р80(70m80)0,4 986+0,2 734=0,772.

Задача 8. Школа принимает в первые классы 200 детей. Определить вероятность того, что число девочек будет по абсолютной величине отличаться от наивероятнейшего их числа не более чем на 10, если вероятность рождения мальчика равна 0,515.

Решение. Условие задачи позволяет применить приближенное равенство (3.7). В нашем случае число независимых испытаний n=200, вероятность наступления события в отдельном испытании р=0,485

(q=1-р=1-0,485=0,515), =10. Подставляя данные задачи в (3.7), получим Р200( |m-97|  10)  2Ф 2Ф(1,41).

По таблице (см. [5], приложение 2) найдем Ф(1,41)0,4 207. Следовательно, 2Ф(1,41)0,8 414. Таким образом, с вероятностью 0,8 414 можно ожидать, что число девочек, среди принятых в первые классы 200 детей, будет по абсолютной величине отличаться от наиболее вероятного их числа 97 не более чем на 10 человек.

Задача 9.При установившемся технологическом процессе вероятность изготовления бракованного шарика для шарикоподшипника равна 0,02. Определить вероятность того, что доля бракованных шариков среди 800 изготовленных будет отличаться от вероятности изготовления бракованного шарика не более чем на 0,01 в ту или другую сторону.

Решение. По условию n=800, р=0,02, q=0,98, =0,01. Воспользуемся формулой (3.8). Имеем Р2Ф(0,64). По таблице (см.[5], приложение 2) найдем Ф(0,64)0,2 389. Итак, искомая вероятность приближенно равна 0,4 778.

Задача 10. На керамическом заводе 90% тарелок выпускается продукцией первого сорта. Какое предельное отклонение (по абсолютной величине) доли первосортных тарелок от вероятности изготовления их можно гарантировать с вероятностью 0,9 854 при проверке ОТК завода партии из 560 изделий?

Решение. Согласно условию n=560, р=0,9, q=0,1, РТребуется найти. Воспользуемся формулой (3.8). В силу условия 2Фили Ф(78,881)  0,4 927. По таблице (см.[5], приложение 2) значению 0,4 927 функции Ф(х) отвечает аргумент х=2,44. Таким образом, для отыскания  получаем уравнение 78,881=2,44. Отсюда искомое отклонение =0,031.

Задача 11. Всхожесть семян подсолнечника характеризуется вероятностью р=0,85. Сколько семян подсолнечника нужно посеять для контроля всхожести, чтобы с точностью в 1% гарантирвоать, что 96% из них прорастут?

Решение. По условию р=0,85, q=0,15, =0,01, РИз формулы (3.8) следует, что 2Фили Ф(0,028)=0,48. По таблице (см.[5], приложение 2) значению 0,48 функции Ф(х) отвечает аргумент х2,06. Отсюда 0,0282,06; следовательно, n=5413. Это число определяет объем работы контролирующей лаборатории.

З а д а ч и

  1. В хлопке содержится 20% коротких волокон. Определить вероятность того, что среди пяти отобранных наудачу волокон окажется три длинных.

  2. Письменная экзаменационная работа по математике состоит из пяти задач, причем за решение любой задачи ставится 1 балл. Вероятность решения любой задачи для некоторого абитуриента равна 0,8. Определить вероятность того, что этот абитуриент получит за экзамен не менее 4 баллов.

  1. По данным технического контроля в среднем 15% изготовляемых на заводе часов нуждаются в дополнительной регулировке. Найти вероятность того, что из 300 изготовленных за смену часов 240 не будут нуждаться в дополнительной регулировке.

  2. В стаде, содержащем 2 000 овец, проводятся прививки против заболеваний животных. Какова вероятность того, что при вакцинации заболеют три овцы, если вероятность заболевания каждого животного при вакцинации равна 0,001?

  3. Счетчик Гейгера регистрирует частицы, вылетающие из некоторого радиоактивного источника, с вероятностью 0,0 002. Какова вероятность того, что счетчик зарегистрировал 4 частицы, если за время наблюдения из источника вылетело 15 000 частиц?

  4. Вероятность того, что консервная банка будет недостаточно герметизирована, равна 0,002. Среди скольких банок, отобранных случайным образом, можно с вероятностью 0,9 512 ожидать отсутствие бракованных?

  5. Вероятность того, что на странице книги могут оказаться опечатки, равна 0,015. Определить вероятность того, что с опечатками окажется не более трех страниц книги, содержащей 620 страниц.

  6. Радиолокационная станция за один цикл обзора обнаруживает крылатую ракету с вероятностью 0,25. Сколько потребуется циклов обзора для того, чтобы ракета была обнаружена с вероятностью не меньшей, чем 0,98?

  7. На первый курс института поступило 480 человек. Найти наивероятнейшее число студентов первого курса, проживавших до поступления в институт в сельской местности, и соответствующую вероятность, если численность городского населения составила в этом году 66%.

  8. Оптовая база снабжает 24 магазина, от каждого из которых может поступить заявка на очередной день с вероятностью 0,6 независимо от заявок других магазинов. Найти наивероятнейшее число заявок в день и вероятность получения этого числа заявок.

  9. Опытным путем установлено, что 80% растений рассады помидоров приживаются. Сколько надо посадить кустов помидоров, чтобы наивероятнейшее число неприжившихся было равно 30?

  10. Установлено, что в среднем 70% посетителей уходят из магазина с покупками. Чему равна вероятность того, что из 250 посетителей магазина покупки сделают не менее 160 и не более 200 человек?

  11. При изготовлении на термопластавтомате цветной облицовочной плитки 80% изделий выходит высшим сортом. Определить вероятность того, что число плиток высшего сорта среди 2 000 изготовленных будет по абсолютной величине отличаться от наиболее вероятного числа их не более чем на 30.

  12. Статистическая вероятность наступления несчастного случая в течение года для моряка торгового флота равна 0,0 004. В пароходстве работает 5 000 моряков. Определить: 1) наиболее вероятное число несчастных случаев среди моряков этого пароходства и соответствующую вероятность; 2) вероятность того, что число пострадавших в течение года моряков отклонится от наивероятнейшего числа в ту или другую сторону не более чем на 2 человека.

  13. Известно, что 60% всего числа изготовляемых заводом телефонных аппаратов выпускаются первым сортом. Какова вероятность того, что среди 400 проверенных приемщиком аппаратов доля первого сорта будет отличаться от вероятности изготовления аппарата первого сорта по абсолютной величине не более чем на 0,01?

  14. На склад поступают детали, проверенные ОТК или изготовленные рабочими, имеющими личное клеймо. Вероятность того, что деталь помечена личным клеймом, равна 0,2. Определить, сколько нужно взять деталей, чтобы с вероятностью, равной 0,9 892, можно было утверждать, что доля деталей с личным клеймом среди них будет отличаться от вероятности изготовления детали рабочим с личным клеймом по абсолютной величине не более чем на 0,02?

  15. К распределительному щиту подключено 600 лампочек, вероятность включения каждой из которых за время Т равна 0,8. Найти границу абсолютной величины отклонения частости включенных лампочек от вероятности включения лампочки, если эта граница должна быть гарантирована с вероятностью 0,9 826.

  16. Для определения нормы высева требуется определить всхожесть семян с точностью до 2% и надежностью 98%. Сколько семян надо посеять?