Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2 курс 1 часть / теория вероятности / методичка / Теория вероятностей. ч.1 Случайные события, уч. пособие.doc
Скачиваний:
136
Добавлен:
11.04.2015
Размер:
672.26 Кб
Скачать

20. Большое число испытаний по схеме бернулли

В предыдущем параграфе в задаче 2, где 10 раз подбрасывался кубик, мы уже ощутили громоздкость вычислений по формуле Бернулли (19.1) и (19.2) при большом числе испытаний n (в задаче 2 было n =10). Тогда нам облегчил вычисления принцип обратного события. Там же мы и отметили, что если бы кубик подбрасывался бы 100 раз (т. е. n = 100), то у нас могли бы возникнуть значительные затруднения и принцип обратного события мало бы чем мог помочь. Поэтому возникает потребность нахождения пусть и приближенных, но значительно более простых , чем (19.1) и (19.2), формул вычисления Рn(k) и Рn(k1kk2) при больших значениях n.

Первая группа приближенных формул начинается с формулы Пуассона

Рn(k) ≈ ak eа/ k!, (20.1)

где a = nּp. Если выражение в правой части этой формулы для удобства обозначить

pa(k) = ak ea/ k!, (20.2)

то формула (20.1) принимает вид:

Рn(k) ≈ pa(k). (20.3)

Из формул (19.2) и (20.3) получается приближенная формула для Рn(k1kk2) вида:

Рn(k1kk2) ≈ pa(k1) + pa(k1+1) + … + pa(k2), (20.4)

где слагаемые в правой части вычисляются по формуле (20.2). Чтобы сделать формулу (20.4) такой же короткой, как и (20.3), введем еще одно обозначение

Рa(m) = pa(0) + pa(1) + … + pa(m), (20.5)

где слагаемые в правой части этой формулы также вычисляются по (20.2). Тогда формула (20.4) принимает более простой вид (убедитесь!):

Рn(k1kk2) ≈ Рa(k2) – Рa(k1–1). (20.6)

Вычисления по формуле (20.1) не так уж сложны (если калькулятор под рукой), но если и их не захочется делать, то можно воспользоваться таблицами распределения Пуассона, которые помещены в конце почти всех пособий по теории вероятности (исключая это). В этих таблицах приведены значения pa(k) при разных значениях a и k, а также (но уже в редких пособиях) значения Рa(m) при разных a и m для вычислений по формуле (20.6). При наличии таких таблиц приближенное вычисление вероятностей Рn(k) и Рn(k1kk2) с помощью формул (20.3) и (20.6) становится минутным делом.

Теперь приведем вторую группу приближенных формул:

Рn(k) ≈  (x) /, x = (knp) /, (20.7)

Рn(k1kk2) ≈ Φ(x2) – Φ(x1), x1 = (k1np – 0,5) /,

x2 = (k2np + 0,5) /, (20.8)

где

 (x) = , Φ(x) = , (20.9)

есть так называемые функция Гаусса и функция Лапласа соответственно. Эти функции определяются выражениями (20.9), но пусть Вас это не пугает, т. к. их значения также берутся из соответствующих таблиц (хотя первая из них легко считается и на калькуляторе). Формула (20.7) называется локальной формулой Муавра-Лапласа, а (20.8) – интегральной формулой Муавра-Лапласа. Отметим, что в большинстве учебников в формуле (20.8) отсутствуют слагаемые 0,5 в x1 и x2 , однако, приведенная здесь формула значительно эффективнее.

Почему же для вычисления приближенных значений Рn(k) и Рn(k1kk2) мы привели не одну, а две группы формул: (20.1) – (20.6) и (20.7) – (20.9)? Дело в том, что при одних соотношениях параметров n, p и k лучшее приближение дает одна группа формул, а при других – другая. Общим у этих групп является то, что обе они дают тем лучшее приближение, чем больше n. Недостатком этих формул является отсутствие четких рекомендаций, в каких случаях лучше применять одну группу формул, а в каких другую. Поэтому в разных пособиях можно встретить несколько различающиеся рекомендации по этому поводу. Приводятся следующие выражения для относительной погрешности этих формул: для вычисления Рn(k) и Рn(k1kk2) по приближенным формулам (20.3), (20.4) и (20.6) эта погрешность равна

max { kp , k2/(nk) + np2/q }, (20.10)

а при вычислении по (20.7), (20.8) примерно равна

2 (knp) / (npq) + 0,1 (1 + pq) / (npq). (20.11)

Однако формулы (20.10) и (20.11), по-видимому, часто дают завышенные (а потому малополезные) оценки погрешности.

Считается, что формулы (20.1) – (20.6) дают хорошее приближенное значение для Рn(k) и Рn(k1kk2) в случае больших значений n и маленьких (близких к 0 ) значений р. Примерные рекомендации к применению этих формул: n больше нескольких десятков (чем больше, тем лучше), а число p ≤ 15 / n (т. е. число a = nּp ≤ 15 ). Можно применять указанные формулы и для больших р (близких к 1), но в этом случае их следует применять для вычислений вероятности определенного числа появлений противоположного события Ā, поскольку его вероятность q = 1 – р будет при этом близка к 0, а потому для него предыдущие формулы применимы. При этом надо использовать то обстоятельство, что вероятность Pn(k) числа появлений события А равна вероятности Pn(n – k) числа появлений события Ā (подумайте, почему!).

В случае больших значений n и не маленьких и не больших значений p приближенные значения для Рn(k) и Рn(k1kk2) вычисляются по формулам (20.7) и (20.8). Можно пользоваться следующими приблизительными рекомендациями к применению этих формул: большое значение n, а произведение чисел nּpּq 9.

Как обычно, рассмотрим задачи на применение приведенных формул.

Задача 1. Вероятность в данной местности заболеть некоторой редкой болезнью равна 0,002. Какова вероятность, что в поселке из 1000 жителей болеет более трех человек?

В нашем случае событие А – человек болеет этой болезнью. Мы проводим 1000 независимых испытаний на появление этого события. Эти испытания состоят в том, что мы исследуем каждого жителя поселка на предмет наличия у него этого заболевания. В каждом испытании вероятность появления события А (вероятность обнаружить болезнь) одна и та же и равна p = 0,002, а число испытаний n = 1000. Нам нужно найти вероятность того, что болеет более трех человек, т. е. событие А наступило от 4 раз до 1000 включительно. Такую вероятность мы обозначали Р1000(4 ≤ k ≤ 1000), но ее точное вычисление по формулам (19.2) и (19.1) связаны с громоздкими вычислениями. Поскольку в нашей ситуации a = nּp = 1000 ּ 0,002 = 2 ≤ 15, а nּpּq = =1,996 < 9, то по приведенным выше рекомендациям для приближенного вычисления этой вероятности можно воспользоваться формулой (20.6): Р1000(4 ≤ k ≤1000) ≈ Р2(1000) – Р2(3), поскольку в нашем случае параметр а = nּр = 2, k1 =4, k2 =1000. По таблице значений функции Рa(m) (если она под рукой) находим Р2(1000) = 1, Р2(3) = 0,85712. Поэтому Р1000(4 ≤ k ≤1000) ≈ 0,14288. Отметим, что точное значение Р1000(4 ≤ k ≤1000) = 0,1427…. , поэтому можно сказать, что приближенная формула (20.6) дала 3 верных значащих цифры. Если же таблицы значений функции Рa(m) рядом нет (она встречается редко), то вероятность Р1000(4 ≤ k ≤1000) можно приближенно вычислить по формулам (20.4), (20.2). Однако в этом случае формула (20.4) содержит 997 слагаемых. В такой ситуации помогает принцип обратного события, сформулированный в § 19. Событие, противоположное тому, что событие А появилось от 4 до 1000 раз, состоит, очевидно, в том, что событие А появилось от 0 до 3 раз. Поэтому Р1000(4 ≤ k ≤1000) = 1 – Р1000(0 ≤ k ≤3). Приближенная формула (20.4) для вычисления вероятности Р1000(0≤ k ≤3) состоит всего из четырёх слагаемых: Р1000(0 ≤ k ≤3)  ≈  p2(0)  +  p2(1)  +  p2(2)  +  pa(3)  =  =20e–2/ 0! + 21e–2 / 1!  +  22 e–2 / 2!  +  23 e–2 / 3!  = 19 / (3e2) = 0,8571. Поэтому Р1000 (4 ≤ k ≤1000) ≈ 1 –  0,8571 = 0,14288. Получили тот же приближенный ответ, что и перед этим. Отметим, что если бы мы вычисляли Р1000(4 ≤ k ≤1000) по приближенной формуле (20.8), то получили бы Р1000(4 ≤ k ≤1000) ≈ 0,145. Здесь мы получили бы только две верных значащих цифры (что тоже, впрочем, неплохо). Как мы и предполагали, в данной задаче формула (20.6) дает лучшее приближение, чем формула (20.8).

В следующей задаче займемся приятным – посчитаем деньги в чужих карманах.

Задача 2. В страховой компании 10 тыс. клиентов, застраховавших свою недвижимость. Страховой взнос составляет 2 тыс. рублей, вероятность несчастного случая (за время страховки) p = 0,005, страховая выплата клиенту при несчастном (для клиента и страховой компании) случае составляет 200 тыс. рублей. Определить размер прибыли, которую получит компания почти наверняка, скажем, с вероятностью P = 0,9.

Прибыль компании (обозначим ее буквой R) зависит от числа страховых выплат (обозначим это число буквой k) при несчастных случаях. Ее величина равна разности между суммами страховых взносов и страховых выплат:

R = 20 – 0.2 k (20.12)

млн. рублей. Чем меньше несчастных случаев, тем больше прибыль компании. Какого же числа (обозначим его буквой N) не должно превзойти количество k несчастных случаев с нужным нам уровнем вероятности P = 0,9? Найдем это число, а тогда по формуле (20.12) можно будет оценить прибыль компании. В этой задаче ситуация описывается схемой независимых испытаний Бернулли, причем число этих испытаний n = 10 000 (число клиентов), а p = 0,005 (вероятность появления события А – несчастный случай с клиентом произошел – в каждом из испытаний). Нам необходимо найти число N, для которого выполняется соотношение: Рn(0 ≤ kN) = P, т. е.

Р10000(0 ≤ kN) = 0,9. (20.13)

Выберем приближенную формулу для вероятности в левой части соотношения (20.13). В нашей задаче a = nּp = 10 000 ּ 0,005 = =50 > 15, а nּpּq = 10 000ּ0,005ּ0,995 = 49,75 > 9. Используя приведенные выше рекомендации по применению приближенных формул, заключаем, что в данном случае предпочтительнее пользоваться формулой (20.8). По этой формуле Р10000(0 ≤ k ≤N) ≈ Φ(x2) – Φ(x1), где Φ(x) – функция Лапласа, которая определяется формулой (20.9), x1 = (k1nּp – 0,5) / = (0 – 50 –0,5) / (49,75)0,5 = – 7,16, x2 = (k2 – nּp + 0,5) / = (N – 50 + 0,5) / (49,75)0,5 = (N – 49.5) / 7,05. Учитывая нечетность функции Лапласа и заглянув в таблицу ее значений, получим Φ(x1) = Φ(– 7,16) = – Φ(7,16) = – 0,5. И, наконец, Р10000(0 ≤ kN) ≈ Φ((N – 49,5) / 7,05) + 0,5. Поэтому соотношение (20.13) можно записать в виде Φ((N – 49,5) / 7,05 ) + 0,5 = 0,9. Тогда число N можно искать из следующего уравнения:

Φ((N – 49.5) / 7,05 ) = 0,4 (20.14)

По таблице значений функции Лапласа находим, что Φ(x) = 0,4 при x = 1,28. Поэтому (N – 49,5) / 7,05 = 1,28, откуда N = 58,524. Учитывая, что число N , конечно же, должно быть целым, можно взять N = 59 (или N = 58). Поэтому с вероятностью P = 0,9 страховых выплат будет не более 59. Поэтому в формуле (20.12) число k не превосходит 59, а поэтому величина прибыли R не менее 20 – 0,2 · 59= = 8,2 млн рублей: R ≥ 8,2 млн рублей.

Если бы мы захотели предсказать величину прибыли с еще большей вероятностью и взяли бы уровень надежности P = 0,995 (вместо P = 0,9), то аналогичные расчеты дали бы R ≥ 6,5 млн рублей. Таким образом, прибыль скорее всего будет больше 8,2 млн рублей, но уж практически точно не может оказаться ниже 6,5 млн рублей. Сравнение результатов для P = 0,9 и P = 0,995 показывает, что увеличение риска страхования может привести к возрастанию прибыли компании. Это есть реализация известного принципа в предпринимательской деятельности: менее рискованные, но более надежные финансовые операции не приносят сверхприбылей.