Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Лекции поТВ (140с).doc
Скачиваний:
18
Добавлен:
01.05.2019
Размер:
5.88 Mб
Скачать

Три основных формы интегральной теоремы Лапласа

Для лучшего усвоения материала введем условную классификацию утверждений интегральной теоремы Лапласа и перечислим задачи, которые решаются с помощью каждой из них.

1. В качестве первой формы теоремы примем общую формулу для вычисления вероятности попадания случайной величины в заданные интервалы: .

2. Вторая форма предназначена для вычисления вероятности попадания случайной величины в интервалы, симметричные относительно центра: Р(|m – a|  tm) = 2Ф(t).

Действительно, для симметричных интервалов ma + tm , ma ‑ tm , , . Вычисляем:

Р(|m – a|  tm) = Р(m m  m2) = Ф(t) – Ф(–t) = Ф(t) + Ф(t) = 2Ф(t). 

В качестве примера применения выведенной формулы ответим на вопросы: "Какова вероятность того, что отклонения случайной величины m от центра a = np не превысят , 2, 3?

Используя таблицы интегральной функции Лапласа, получим:

Р(|m – a|  m) = 2Ф(1) = 20,3413 = 0,6826; Р(|m ‑ a|  2m) = 2Ф(2) = 20,4772 = 0,9544; Р(|m ‑ a|  3m) = 2Ф(3) = 20,4987 = 0,9974.

Только в 3-х случаях из 1000 возможны появления отклонений, превышающие три сигмы; с гарантией 95% можно утверждать, что для распределения Лапласа (и нормального закона Гаусса) случайные отклонения не превысят две сигмы (это утверждение может быть ошибочным лишь в 5-и случаях из 100).

3. Запишем неравенство |m – a|  t в эквивалентном виде и далее (разделив обе части неравенства на n): .

Получаем следующее выражение, которое мы назовем "Третьей формой интегральной теоремы Лапласа": или же . В описании этой формулы два раза встречается слово вероятность Р и р, что приводит к неприятным словосочетаниям типа: "Вероятность того, что относительная частота отклонится от вероятности р появления события в одном испытании не более чем на , равна удвоенному значению функции Лапласа с аргументом ". Громоздко и малопонятно. Желательно избегать в одном предложении двух одинаковых слов, да еще с разным смыслом; для этого в любом языке есть синонимы. Например, вероятность некоторого утверждения можно назвать "гарантией", "надежностью", "уровнем доверия". Кстати, вероятность противоположного утверждения называют "уровнем значимости" и обычно обозначают греческой буквой альфа:  = 1 – Р. Если потребуется, то вероятность р появления события в одном испытании можно назвать "долей в совокупности", а относительную частоту – просто долей. Выражение называется "погрешностью". Теперь теорему можно сформулировать так: "С уровнем доверия P = 2Ф(t) можно утверждать, что отклонение относительной частоты от своей доли в совокупности р (от своего предельного значения р) не превысит погрешности .

Формула или связывает вместе четыре величины n, p, , P. Если в условиях задачи заданы любые три величины, то четвертую можно найти по вышеприведенной формуле. В связи с этим появляется 4 типа задач.

I. Дано n, p, . Требуется найти Р.

Заданы параметры распределения n, p. Дополнительно задана допустимая погрешность . Требуется найти гарантию утверждения , как часто оно будет выполняться.

Решение: Из выражения для погрешности находим t и вычисляем уровень доверия (гарантию) P = 2Ф(t).

Пример. В процессе статистических испытаний монета (р = 0,5) будет подброшена n = 100 раз. Можно ли утверждать, что в результате опыта отклонение относительной частоты от своего теоретического значения (погрешность ) не превысит 0,01?

Найдем уровень доверия утверждения . Из выражения вычисляем t = 0,2 и далее по таблицам Лапласа находим P = 2Ф(0,2) = 20,079 = 0,158. Уровень доверия 15,8% не достаточен, чтобы гарантировать выполнение заданного условия; т.к. только в 16 случаях из 100 возможны столь отклонения ( = 0,01).

II. Дано n, p, Р. Требуется найти .

Наши утверждения должны быть надежными со стандартным уровнем доверия 90% , 95% , или 99% . Какую предельную погрешность мы можем ожидать с таким заданным уровнем доверия?

Решение: Из соотношения P = 2Ф(t) при заданном Р по таблицам интегральной функции Лапласа находим t. Далее вычисляем предельную ожидаемую погрешность

.

Пример. Предполагается подбросить монету 100 раз. Какую погрешность следует ожидать с гарантией 95% ?

Из выражения 0,95 = 2Ф(t) с помощью таблиц Лапласа находим t = 1,96  2. Далее вычисляем . Иными словами, относительная частота при 100 испытаниях может варьировать в довольно широких пределах от 0,4 до 0,6.

III. Дано, p, , Р. Требуется найти n.

Погрешность  уменьшается с увеличением числа испытаний. Сколько же требуется провести испытаний, чтобы получать надежные и точные прогнозы?

Решение: Из соотношения P = 2Ф(t) при заданном Р находим t. Далее записываем условие для предельной погрешности , откуда при известных p, , t находим n: .

Пример. Сколько раз надо подкинуть монету, чтобы с гарантией 90% снизить погрешность до 0,05? Иными словами, сколько требуется испытаний, чтобы с гарантией 90% относительная частота появления герба при бросании монеты не выходила за пределы интервала (0,45; 0,55)?

Из соотношения 0,9 = 2Ф(t) находим t = 1,64. далее из неравенства определяем .

IV. Дано n, P и  m/. Найти р.

В предыдущих задачах были заданы параметры распределения и требовалось предсказать результат опыта (задача теории вероятностей). В задаче IV известен результат опыта, и надо сделать заключение о параметрах распределения (именно в этом и заключается статистический способ определения вероятности).

Решение: Соотношение P = 2Ф(t) при заданном Р определяет t. Далее записываем условие | m/– p |  , которое должно выполняться с заданным уровнем доверия Р: . Из этого неравенства находим р.

Пример. В результате 400 бросков монеты относительная частота появления герба получилась равной 0,5. Какие значения параметра р согласуются с такими результатами опыта? Заключение должно иметь 90%‑й уровень доверия.

Из соотношения 0,9 = 2Ф(t) находим t = 1,64. Далее выписываем неравенство , возводим его в квадрат и преобразуем: (0,5 – р) 0,0822р(1 – р); 1,0067р– 1,0067р + 0,25  0; отсюда р р  р, где рр – корни квадратного трехчлена: р1,2 = 0,5  0,041. Итак, по результатам опыта можно сделать заключение, что с гарантией 90% искомая вероятность р не выйдет за пределы интервала 0,46  р  0,54.

В заключение темы "Интегральная теорема Лапласа" заметим, что основная асимптотическая формула дает достаточно точные значения лишь для больших n > 100. Причина этого – в слишком неточной замене интегральной суммы интегралом с теми же самыми пределами интегрирования. На рис. 5.4 изображен полигон распределения Лапласа для n = 10, p = 0,3 (локальная формула Лапласа является достаточно точной аппроксимацией распределения Бернулли даже для небольших значений n). Пусть требуется вычислить    Р(2  m  6) =P(2) + P(3) + P(4) + P(5) + + P(6) = P(m). Так как m = 1, то Р(2  m  6) = P(m)m. Это – площадь столбиковой фигуры (см. рис. 5.4) с границами (m– 0,5) и (m+ 0,5), поэтому более правильным будет замена интегральной суммы интегралом, пределы которого несколько шире, чем в общепринятой формуле:

.

Так, для нашего примера n = 10, p = 0,3 точное значение Р(2  m  6), рассчитанное по формулам Бернулли, равно P(m) = 0,840; по стандартной формуле Лапласа – Ф(t6) – Ф(t2) = 0,736 (погрешность 12,4%); по уточненной формуле – Ф(t6,5) – Ф(t1,5) = 0,842 (погрешность всего 0,2%).

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]