Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
2 курс 1 часть / теория вероятности / методичка / Теория вероятностей. ч.1 Случайные события, уч. пособие.doc
Скачиваний:
136
Добавлен:
11.04.2015
Размер:
672.26 Кб
Скачать

18. Переоценка гипотез, формула байеса

Снова рассмотрим эксперимент, в котором может появиться (или не появиться) некоторое событие А, а также связанные с этим экспериментом гипотезы В1, В2, …, Вn. Поскольку эти гипотезы образуют ПГНС (помните?), то в результате эксперимента обязательно должно появиться одно из этих событий, причем в точности одно из них. Какое? Раньше нас этот вопрос не интересовал, так как наш интерес был связан не с гипотезами, а только с событием А (вероятность его появления). Мы знали лишь вероятности Р(В1), Р(В2), … , Р(Вn), с которыми могли появиться каждое из этих событий-гипотез, а также условные вероятности Р(А/В1), Р(А/В2) , … , Р(А/Вn). Теперь событие А нас интересовать совершенно не будет, так как мы будем точно знать, что в результате эксперимента это событие действительно произошло. Не поможет ли нам эта информация узнать, какая из гипотез В1, В2, …, Вn реализовалась в данном эксперименте (том, в котором событие А произошло)? Мы по-прежнему не сможем ответить точно на этот вопрос. Однако полученная информация (что событие А произошло) поможет нам переоценить шансы (т. е. вероятности) появления в данном эксперименте той или иной гипотезы. Таким образом, мы переходим от безусловных (доопытных) вероятностей гипотез Р(В1), Р(В2), … , Р(Вn) к условным вероятностям Р(В1/А), Р(В2/А) , … , Р(Вn/А), которые учитывают полученную информацию о том, что событие А произошло. Найдем, например, Р(В1/А). Используя формулу для вероятности произведения двух событий (14.1) можно записать Р(А·В1) = Р(А) Р(В1/А) или по-другому Р(А·В1) = Р(В1) Р(А/В1). Приравняв правые части записанных равенств, получим: Р(А) Р(В1/А) = Р(В1) Р(А/В1). Отсюда следует, что Р(В1/А) = Р(В1) Р(А/В1) / Р(А). Аналогичную формулу можно получить и для остальных гипотез. Таким образом, переоценки гипотез проводятся по формуле

Р(Вi /А) = Р(Вi) Р(А/Вi) / Р(А), i = 1, 2, …, n. (18.1)

В этой формуле Р(Вi) и Р(А/Вi) нам известны, а Р(А) может быть вычислена по формуле полной вероятности либо из каких-то других соображений. Если Р(А) в (18.1) вычислять по формуле полной вероятности (17.1), то получаем для любого i = 1, 2, …, n.

Р(Вi /А) = Р(Вi) Р(А/Вi) / ( Р(В1) Р(А/В1) + Р(В2) Р(А/В2) + …

… + Р(Вn ) Р(А/Вn )). (18.2)

Это и есть формула Байеса.

А теперь задачи на эти формулы. Первая задача – простая, она иллюстрирует саму схему применения формулы Байеса.

Задача 1. На стене развешено 10 винтовок, причем 4 из них с оптическим прицелом, а 6 – с обычным. Вероятность попасть в мишень из винтовки с оптическим прицелом 0,95, а с обычным – 0,8. Стрелок поразил мишень из наугад взятой винтовки. Из какой винтовки он стрелял с большей вероятностью.

Снова эксперимент разделяется на два – случайный выбор винтовки и стрельба из нее по мишени. В качестве гипотез возьмем все возможные исходы первого эксперимента. Это два события: В1 – выбрана винтовка с оптическим прицелом, В2 – выбрана винтовка с обычным прицелом. Ясно, что это пара противоположных событий (если не произошло В1, значит произошло В2 и, наоборот), а потому их можно взять в качестве гипотез. Событие А – мишень поражена (это то событие, которое произошло). Нам требуется сравнить между собой числа Р(В1/А) и Р(В2/А). Используем формулу Байеса Р(В1/А) = =Р(В1) Р(А/В1) / (Р(В1) Р(А/В1) + Р(В2) Р(А/В2)). По условию Р(В1) = =4/10 = 0,4 (т. к. винтовок с оптическим прицелом 4 из 10), а Р(В2) = =6/10 = 0,6, Р(А/В1) = 0,95, Р(А/В2) = 0,8. Поэтому по формуле Байеса получим Р(В1/А) = 0,4 · 0,95 / (0,4 · 0,95 + 0,6 · 0,8) = 0,38 / 0,86 = =0,442. Вероятность Р(В2/А) тоже можно найти по формуле Байеса, но проще это сделать, учтя противоположность событий В1 и В2 (см. формулу (13.2)): Р(В2/А) = 1 – Р(В1/А) = 0,558. Таким образом, правдоподобнее (хотя и ненамного), что стрелок выстрелил из обычной винтовки.

Следующая задача – это чуть измененная задача 2 из предыдущего параграфа.

Задача 2. Имеются 2 коробки с номерами 1 и 2, в каждой из которых по 12 шаров. В 1 коробке 3 белых шара и 9 черных, во второй 4 белых и 8 черных. Кроме коробок имеется корзина с тремя шарами, на двух из которых нарисована цифра 1, а на одном цифра 2. Сначала из корзины наугад выбрали один шар, а затем из коробки с номером вытащенного шара снова наугад вынули шар. Он оказался белым. Какова вероятность, что из корзины был вынут шар с номером 1?

Событие А (которое уже произошло) – вынут белый шар. В качестве гипотез удобно взять те же события, что были взяты ранее в аналогичной задаче: В1 – из корзины вынут шар с номером 1, В2 – с номером 2. Обратите внимание, что если решается задача на формулы переоценки гипотез (18.1) или (18.2), то гипотезы надо выбирать так, чтобы одна из них была тем событием, вероятность которого надо найти. Нам необходимо найти Р(В1/А). Из формулы Байеса (18.2) имеем Р(В1/А) = Р(В1) Р(А/В1) / (Р(В1) Р(А/В1) + Р(В2) Р(А/В2)). Поскольку из трех шаров в корзине только на двух проставлен номер 1, то до опытные (безусловные) вероятности гипотез Р(В1) = 2/3, а Р(В2) = 1/3. Если вынут шар с номером 1 (т. е. произошло событие В1), то шар тянут из первой корзины, в которой белых 3 из 12. Поэтому Р(А/В1) = 3/12 = 1/4. Точно также Р(А/В2) = 4/12 = 1/3. Тогда по выписанной выше формуле Р(В1/А) = 2/3·1/4 / (2/3·1/4 + 1/3·1/3) = 3/5. Как видно, хотя в первой коробке белых шаров меньше, все же вероятнее тянули именно из нее.

А теперь несколько изменим условие задачи 4 из предыдущего параграфа и посмотрим, насколько обоснованными будут наши обвинения спортсмена в принятии допинга.

Задача 3. Известно, что некий профессиональный тяжелоатлет в среднем перед одним из 10 соревнований принимает допинг. Анализ его результатов показывает, что без допинга он поднимает рекордный вес в 6 попытках из 9 (в среднем), а с допингом – в 8 попытках из 10. На соревновании спортсмен поднял рекордный вес. Какова вероятность, что перед ним он принял допинг?

Событие А – в данном соревновании спортсмен взял рекордный вес – то же, что в аналогичной задаче на формулу полной вероятности. Да и гипотезы те же: В1 – допинг перед данным соревнованием принят, В2 – не принят. Надо найти Р(В1/А). По условию доопытные вероятности гипотез Р(В1) = 1/10, а потому Р(В2) = 9/10. Из условия задачи Р(А/В1) = 8/10, а Р(А/В2) = 6/9. Из формулы Байеса (18.2) имеем Р(В1/А) = Р(В1) Р(А/В1) / (Р(В1) Р(А/В1) + Р(В2) Р(А/В2)) = = 0,1 · 0,8 / (0,1 · 0,8 + 0,9 · (6/9)) = 0,118. Так что наши обвинения, скорее всего, будут несправедливыми.

Дальше опять задача на студенческую тему.

Задача 4. 10 студентов пришли сдавать экзамен, включающий 20 вопросов. По качеству подготовки студентов можно разделить на 4 группы: 1) 3 человека подготовились отлично (знают ответы на все вопросы), 2) 4 человека подготовились хорошо (знают 16 из 20), 3) 2 человека подготовились удовлетворительно (знают 10 из 20), 4) один человек плохо подготовился (знает 5 из 20). Вызванный наугад студент ответил на 3 предложенных вопроса и получил отличную оценку. Можно ли быть уверенным, что оценка поставлена заслуженно?

На языке теории вероятностей вопрос можно сформулировать следующим образом: велика ли вероятность, что вызванный студент действительно “отличник” (т. е. из первой группы). Эксперимент опять можно разделить на 2 последовательных эксперимента: вызов студента из какой-либо группы и его ответ на предложенные вопросы. В качестве гипотез берем все возможные несовместные исходы первого эксперимента: В1 – вызванный студент из 1 группы , … , В4 – вызванный студент из 4 группы. Событие А – студент ответил на 3 вопроса (это событие произошло). В задаче требуется найти вероятность того, что этот студент был из первой группы (знал все вопросы), т. е. Р(В1/А). Снова используем формулу Байеса Р(В1/А) = =Р(В1) Р(А/В1) / ( Р(В1) Р(А/В1) + Р(В2) Р(А/В2) + Р(В3) Р(А/В3) + + Р(В4) Р(А/В4)). Вычислим все вероятности, входящие в правую часть этой формулы. Поскольку из 10 студентов только трое в первой группе, то вероятность случайно вызвать именно такого Р(В1) = 3/10 = 0,3. Аналогично, Р(В2) = 0,4, Р(В3) = 0,2, Р(В4) = 0,1. Поскольку студент из 1 группы может ответить на любые 3 вопроса (он знает все вопросы), то Р(А/В1) = 1. Найдем Р(А/В2) , т. е. вероятность того, что студент из второй группы (он знает 16 вопросов из 20) ответит на случайно выбранные 3 вопроса. Проще всего перевести этот вопрос на язык шаров (задачу о шарах мы раньше уже решили): в корзине 20 шаров (т. к. 20 вопросов), из которых 16 белых (вопросы, которые знает) и 4 черных (не знает). Из корзины наугад тянут 3 шара (задают 3 вопроса). Какова вероятность, что все они белые (т. е. из тех, которые знает)? Такую задачу мы решили в общем виде в § 9 и получили для ее решения формулу (9.1). Применим ее при n = 16 (число белых шаров), m = 4 (число черных), k = 3 (число вынимаемых шаров) и i = 3 (необходимое число белых в выбранных). Так мы получим Р(А/В2) =  /  = 0,491. Вероятность Р(А/В3) тоже получим из (9.1) при n = 10, m = 10, k = 3 и i = 3: Р(А/В3) = /  = 0,105. Вероятность Р(А/В4) получается из (9.1) при n = 5, m = 15, k = 3 и i = 3: Р(А/В3) =  /  = 0,009. Теперь из формулы Байеса (выписанной выше для этой задачи) получим, что вероятность того, что оценка получена заслуженно, Р(В1/А) = 0,58. А потому вероятность ошибочности полученной оценки (вероятность противоположного события) равна 1 – 0,58 = 0,42 . Это многовато. Поэтому для большей объективности оценки желательно было задать дополнительные вопросы .

А вот задача из медицинской тематики.

Задача 5. Известно, что в среднем 1 из 700 мальчиков рождается с лишней Y-хромосомой. Среди таких детей агрессивное поведение встречается в среднем у 20 мальчиков из 21. У обычных детей такое поведение встречается намного реже – в одном случае из 21. У данного мальчика наблюдается агрессивное поведение. Велика ли вероятность, что у него лишняя Y-хромосома?

Определим гипотезы (это снова будет пара противоположных событий): В1 – у обследуемого мальчика есть лишняя Y-хромосома, В2 – у него их сколько положено. Событие А (которое произошло) – у данного мальчика агрессивное поведение. Нас просят оценить вероятность Р(В1/А). Чтобы перевести на язык вероятностей слова о том, что в среднем у стольки-то мальчиков из стольки-то встречается то-то, мы должны вспомнить (или, скорее всего, снова взглянуть на) замечание, сделанное после формулы полной вероятности (17.1). Если это сделать, то станет ясно, что Р(В1) = 1/700, Р(В2) = 1 – Р(В1) = =699/700, Р(А/В1) = 20/21, Р(А/В2) = 1/21. По формуле Байеса (18.2) получим: Р(В1 /А) = Р(В1) Р(А/В1) / (Р(В1) Р(А/В1) + Р(В2) Р(А/В2) ) =

= (1/700)ּ(20/21) / ((1/700)ּ(20/21) + (699/700)ּ(1/21)) = 0,028. Маловато! Скорее всего, причину такого поведения надо искать в другом.