- •Сводный курс. Часть 4. Теория вероятностей и математическая статистика
- •19.2.Вероятность случайного события
- •19.3.Основные вероятностные схемы (теоремы)
- •19.3.3. Полная вероятность и формула Бейеса
- •19.3.4.Схема повторных независимых испытаний
- •19.3.4.1.Формулы Бернулли и Пуассона
- •19.3.4.2.Локальная и интегральная теоремы Лапласа
- •20.2. Законы распределения случайных величин.
- •20.3.Числовые характеристики случайных величин.
- •20.4.Типовые распределения.
- •20.4.3.Многомерные случайные величины.
- •20..5.Законы больших чисел.
- •21.2. Обработка статистических данных
- •21.3. Статистические распределения
- •21.7. Точечные оценки числовых характеристик генеральной
- •21.9. Проверка статистических гипотез
- •21.10. Типовые примеры оценки гипотез.
- •21.10.2. Проверка гипотезы о равенстве двух математических ожиданий двух нормально распределенных СВ, дисперсии которых известны для больших независимых выборок .(стр213).
- •21.10.3.Проверка гипотезы о равенстве двух математических ожиданий двух нормально распределенных СВ, дисперсии которых НЕизвестны и равны. (стр215).
- •21.10.4. Проверка гипотезы о равенстве среднего выборочного и гипотетического генерального среднего для нормально распределенной СВ.
9
19.3.4.1.Формулы Бернулли и Пуассона
Решим задачу: вычислить вероятность, что А появится точно k раз в серии n независимых испытаний.
Решение. Обозначим искомую вероятность Pn(k).Отметим, что нас не интересует последовательность, в которой А появляется в серии, а интересует
только число k. В этом смысле исходы |
_ _ _ _ |
_ _ _ _ _ _ _ _ _ _ _ _ |
А А А А, |
А А А А, А А А А, А А А А |
равноправны для нас при n=4 и k=1. В таком случае по теореме умножения независимых событий получаем вероятность появления k раз события А и непоявления n-k раз этого события равной pnqn-k. Т.к. таких ситуаций будет
столько, сколько сочетаний можно составить из n элементов по k элемнтов, то
Pn(k)=Cnkpnqn-k.
Комментарий. Полученную формулу называют формулой Бернулли. Она удобна, если серия невелика и вероятность p достаточно велика.”Велика” – в этой ситуации означает – “близка к 0,5”.
Следствия.
1. Если в схеме повторных независимых испытаний нас интересует событие “А появилось не более k1 раз “, то на основании теорем сложения и
i=k
формулы Бернулли получим Pn(k≤ k1)= ∑1 Cnipnqn-i.
i=0
Аналогично и другие следствия.
2.Если серия очень велика, а p очень мала ( если np=const), тогда формула Бернулли трудно применима (для ручной работы).Выполним некоторые преобразования,положив np= λ . Тогда получаем
|
|
|
|
k |
|
n |
q |
n-k |
= |
n(n − |
1)...(n −(k −1)) |
λ k |
λ n−k |
= |
n(n −1)...(n(m −1))...(n −m)...3 2 1 |
= |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
Cn |
p |
|
|
|
|
|
|
|
k! |
|
|
n |
1− n |
|
n n...n |
|
|
|
|
||||||||||||
|
λk |
|
λ |
n |
|
|
λ −k |
|
λ k |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
λ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
= |
|
|
|
|
|
|
|
= |
|
k! е |
|
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
k! 1− n |
|
1− n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
19.3.4.2.Локальная и интегральная теоремы Лапласа |
|
|
|
|
|||||||||||||||||
|
|
|
Если в СПНИ |
p велика и велико n , то справедливо Pn(k)= |
1 |
ф(х), |
где |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
npq |
|
|
|
|
|
|
|
1 |
|
|
|
2 |
|
|
|
|
х= k −np . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
(ф)x= |
|
е− |
х |
; |
|
|
Формула |
|
наиболее |
точна при |
больших |
n. |
||||||||||||||||||||||
|
2 |
|
|
|
||||||||||||||||||||||||||||||
|
|
|
2π |
|
|
|
|
|
|
|
|
|
|
|
npq |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Доказательства опускается, т.к. формула эмпирическая (получена но основе опытов, экспериментов).
Комментарии.
1.Значения ф(х) затабулированы (представлены в виде таблицы). 2.ф(х) - четная и потому таблица построена только для х>0. 3.ф(х) - быстроубывающая и потому при аргументе х>3,…,5 ф(х)=0.
4.Формулы Пуассона, Бернулли и локальная теорема перекрывают весь диапазон значений n и p.
5.Не следует удивляться малым значениям Pn(k) при больших n, т.к. достоверной будет ситуация , что А появится хотя бы один раз или не появится
9
10
совсем. Каждому из таких событий нужна своя часть вероятности от общей части, равной 1.
Следствия из формул.
|
|
|
|
|
|
k −1 |
1.Pn (А появится менее k раз)= ∑Pn(i) . |
||||||
|
|
|
|
|
|
i=1 |
|
|
|
|
k |
|
|
2.Pn(k1 ≤ k ≤k2)= ∑2 |
Pn(k) . |
|||||
|
|
|
|
k =k1 |
|
|
Интегральная теорема Лапласа. |
||||||
Если |
в СПНИ p |
достаточно велика, то при n →∞ справедлива |
||||
приближенная формула Pn(k1 ≤ k ≤k2)= Ф(х2)-Ф(х1), где |
||||||
|
|
х |
t2 |
|
|
|
Ф(х) = |
1 |
∫е− |
|
dt , х= k |
−np . |
|
2 |
||||||
|
2π |
0 |
|
|
|
npq |
Док-во. Используем следствие 2 из предыдущей теоремы, где каждое слагаемое вычислим по локальной теореме Лапласа. Получим
k |
k |
1 |
х |
1 |
|
Pn(k1 ≤ k ≤k2)= ∑2 |
Pn(k) = ∑2 |
ф(х)= ∑2 |
ф(х). Мы видим, что эта |
||
k =k1 |
k =k1 |
npq |
х2 |
npq |
|
сумма похожа на интегральную с отличием только в множителе, записанном
перед |
ф(х). Выясним смысл этого |
множителя. |
Положим k=i+1 |
и тогда |
|||||||||||||||||
х2= i +1−np |
; если положить k=i, то получим х1= i −np |
. Отсюда легко получить |
|||||||||||||||||||
|
npq |
|
|
|
|
|
|
|
|
|
|
|
|
|
npq |
|
|
|
|
||
х2-х1= |
1 |
|
= х. |
После |
этого |
выражение |
для |
|
Pn(k1 ≤k ≤k2) |
становится |
|||||||||||
|
|
npq |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
интегральной суммой. А при больших n просто интегралом. Получаем |
|||||||||||||||||||||
|
|
|
|
|
1 |
х2 |
|
t2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
Pn(k1 ≤ |
k ≤k2)= |
∫ |
е− |
|
dt . |
Преобразуем полученное равенство, |
используя |
||||||||||||||
2 |
|||||||||||||||||||||
|
|
|
|
|
2π |
х |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
х2 |
t2 |
1 |
0 |
t 2 |
1 |
х2 |
|
t2 |
|
|||
свойства интегралла |
|
|
∫е− |
|
dt = |
∫е− |
|
dt + |
∫е− |
|
dt = |
|
|||||||||
|
|
2 |
2 |
2 |
|
||||||||||||||||
|
|
|
|
|
|
|
2π |
х |
|
|
2π |
х |
|
|
2π |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
1 |
х2 |
t2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
= |
∫е− |
|
dt =Ф(х2)-(х1). |
(Сначала интеграл по всему отрезку заменили на |
|||||||||||||||||
2 |
|||||||||||||||||||||
|
2π |
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
интеграл по сумме отрезков, а затем во втором интеграле изменили порядок интегрирования, что привело к смене знака интеграла).
Замечания.
1.Ф(х) – затабулирована; называется интеграл вероятностей; обозначается часто erf(x); нечетная из-за четности подинтегральной функции.
2.Так как подынтегральная функция быстроубывающая, то таблица Ф(х) содержит только значения до х=3,…,5.
3.Т.к. P(0 ≤ k ≤n)=P(Ω)=1,то при х>3,…,5 имеем Ф(0)=0,5. В самом деле,
из геометрического смысла интеграла от ф(х) следует, что площадь под кривой равна 1 (единице). А ввиду симметрии криволинейной трапеции под кривой ф(х) следует, что половина площади равна 0,5, что и утверждается. Смотри рисунок ниже.
10
11
4.На свойстве 3 и будущих приложениях Ф(х) основан тот факт, что в
|
|
|
|
|
|
|
|
|
|
2 |
х2 |
|
t2 |
||
литературе стречаютcя функции другого вида : |
|
(х)= |
∫е |
− |
|
dt и |
|||||||||
Ô |
|||||||||||||||
2 |
|||||||||||||||
|
|
|
|
|
|
|
|
|
|
2π |
0 |
|
|
|
|
|
|
|
1 |
х2 |
|
t 2 |
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|||||||
|
Ô |
(х)= |
∫е |
− |
|
dt . Таблицы этих функций различаются |
существенно. Но |
||||||||
|
2 |
||||||||||||||
|
|
|
2π |
−∞ |
|
|
|
|
|
|
|
|
|
|
использовать в любых расчетах их можно, если знать причину таких различий и
учитывать это. Например, между табличными значениями Ф и Ô разность равна 0,5 (использованы только значения для положительных значений аргумента, и потому левая часть криволинейной трапеции не использована).
Значения Ф и Ô различаются в 2 раза (за счет множителя перед интегралом). И т.д.
5. В свойстве 3 использован тот факт, что при m=0 и n → ∞ получаем
х= |
0−np |
=- |
np |
=-∞, а при m=n имеем х= n −np |
= n(1− p) |
= |
nq |
= |
nq |
=∞. |
|
npq |
|
q |
npq |
npq |
|
npq |
|
p |
|
19.3.4.3.Отклонение частоты от вероятности Оценим величину отклонения относительной частоты появления
события А от вероятности появления этого события в схеме повторных независимых испытаний.
Пусть имеем серию n независимых испытаний с вероятностью p появления события А в каждом испытании (p известна а priori - до опыта). Если
же мы проведем серию n испытаний, то вычислим w= mn - относительную частоту появления А в серии испытаний. Для оценки отклонения используем величину P( mn − p <δ ), т.е. вычислим вероятность модуля отклонения w от p.
|
|
m |
|
<δ или -ε |
n |
< m −np |
|
n . |
|
Сначала преобразуем |
неравенство |
− p |
ε |
||||||
n |
pq |
||||||||
|
|
|
|
npq |
|
pq |
Или, иначе говоря, оценим величину P( mn − p <ε )=
11
12
=P(-ε |
n |
< m −np |
ε |
n |
)=P(х1<x<x2)=Ф(х2-х1)=Ф(ε |
n |
)-Ф(-ε |
n |
)= |
|
pq |
npq |
|
pq |
|
pq |
|
pq |
|
=2Ф(ε pqn ).
Из этого соотношения видно что, если при неизменных априорных p , q и постоянной ε увеличивать объем серии n, то надежность (вероятность
выполнения) требования (условия) mn − p < εувеличивается. Если же требовать
высокую точность этого условия (малостьε), то вероятность такого требования (надежность его выполнения) уменьшается при постоянном объеме серии.
По заданной надежности и точности можно указать объем испытаний - затрат на эксперимент.
Задача. Сколько раз следует бросить игральную кость, чтобы с надежностью 0,9876 (с такой вероятностью) можно было гарантировать, что w появления 6
(шестерки) на верхней грани будет отличаться от 16 не более, чем на 0,01?
Решение. P( |
|
m |
1 |
|
<0,01)=2Ф(0,01 |
n |
. По таблице для Ф(х) находим х, при |
||||||
|
|
||||||||||||
|
|
− |
|
|
|
||||||||
n |
6 |
||||||||||||
|
|
1 5 |
|||||||||||
|
|
|
|
|
|
|
|
|
|
|
6 6 |
|
|
котором P=0,9876, |
|
а Ф(х)=0,4938. Это будет, если х=2,5. Решаем уравнение |
|||||||||||
0,01 |
1 |
n |
5 |
=2,5 и находим n>12000. |
|
|
|||||||
|
|
|
|||||||||||
(( |
|
)( |
|
)) |
|
|
|
|
|
|
|
|
|
6 |
6 |
|
|
|
|
|
|
|
|
20.Случайные величины 20.1.Определение и классификация
Определение. Случайная величина - действительная функция от случайного события.
Или иначе С.В.-величина, которая в результатах испытания может принимать одно и только одно числовое значение, неизвестное заранее и зависящее от случайных причин, не учтенных и не могущих быть учтенными.
Обозначение X, Y, Z .Их значения - x, y, z. Пример20.1.
1. Число выпавших очков при бросании игральной кости. 2.Число грузовиков, проходящих за 1 час через КПП. 3.Расстояние точки падения ядра от точки метания. 4.Периметр сечения ствола дерева.
С.В.-дискретная (прерывная) принимает отдельные изолированныя значения с определенными вероятностями. Количество значений может быть и бесконечно.(Примеры 1,2).
С.В. - непрерывная, может принимать любое значение из некоторого конечного или бесконечного промежутка. Количество значений всегда бесконечо. (Примеры 3,4).
12