- •Оглавление
- •Предисловие
- •Задачи математической статистики
- •Генеральная и выборочная совокупности
- •Статистическое распределение выборки
- •Графическое изображение статистического распределения выборки
- •Эмпирическая функция распределения
- •Числовые характеристики статистического распределения выборки
- •Точечные оценки параметров распределения
- •Свойства статистических оценок
- •Доверительные интервалы
- •Доверительный интервал для математического ожидания нормально распределенной генеральной совокупности при известном среднем квадратическом отклонении
- •Доверительный интервал для математического ожидания нормально распределенной генеральной совокупности при неизвестном среднем квадратическом отклонении
- •Понятие о проверке статистических гипотез о законе распределения генеральной совокупности
- •Корреляционная зависимость. Выборочный коэффициент корреляции. Линейная корреляция. Выборочное линейное уравнение регрессии
- •Сборник задач по курсу «Теория вероятностей и математическая статистика»
- •Примерный список вопросов для подготовки к зачету
- •Список литературы (обязательной и дополнительной) Основная литература
- •Дополнительная литература
- •Справочные издания
- •Интернет-ресурсы
- •Электронные издания
- •Словарь терминов
Доверительные интервалы
Пусть по данным выборки { x1, x2, … , xn } с.в. Х объема n , используя некоторую статистику
tn = f (x1, x2, … , xn) ,
получили статистическую оценку tn параметра t всей случайной величины Х (т.е. всей генеральной совокупности). Если статистика обладает хорошими свойствами (из перечисленных выше), то мы вправе ожидать, что tn ≈ t. Но хотелось бы дополнительно понять степень приближения. Насколько отличается tn от t, т.е. чему равно отклонение | tn−t| ? Возьмем, например, какое-нибудь маленькое число δ > 0 (0.1, 0.01 и т.п.) . Можно ли утверждать, что | tn−t| < δ, т.е. истинный параметр t содержится в интервале (tn− δ, tn+ δ) ? Поскольку оценка tn является значением соответствующей случайной величины Tn (т.е. зависит от выборки), то статистические методы дают вероятностный ответ на этот вопрос, т.е. позволяют определить вероятность γ, с которой это неравенство выполняется. Пусть tn –полученная статистическая оценка параметра t . Интервал вида (tn− δ, tn+ δ) называется интервальной оценкой параметра t с доверительной вероятностью (или надежностью) γ, если с вероятностью γ этот интервал «покрывает» этот параметр ( t(tn− δ, tn+ δ) ), т.е. выполняется: Р(| Tn−t|< δ)= γ. Доверительную вероятность обычно берут на уровне 0.9, 0.95, 0.99 и т.п. . Число α=1− γ называется уровнем значимости интервальной оценки, оно показывает вероятность того, что параметр t выйдет за доверительный интервал: Р(| Tn−t|> δ)= α.
Доверительный интервал строится по следующей схеме. Сначала задается требуемый уровень значимости γ, по которому и подбирается число δ из условия, чтобы выполнялось Р(| Tn−t|< δ)= γ.
Конечно, нельзя утверждать, что найденный доверительный интервал обязательно покроет искомый параметр t. Но в этом можно быть уверенными на 95% при γ=0.95 и на 99% при γ=0.99 . Это значит, что если сделать много выборок (в идеале бесконечно много), то в 95% случаев (при γ=0.95) вычисленные доверительные интервалы действительно покроют параметр t.
Доверительный интервал для математического ожидания нормально распределенной генеральной совокупности при известном среднем квадратическом отклонении
Если речь идет, например, об измерении каких-нибудь величин одним прибором, то часто среднее квадратическое отклонение σ (ошибка измерения) бывает известна и не меняется от измерения к измерению.
Пусть с.в. Х распределена нормально с параметрами М(Х)=а и σ(Х)= σ, причем σ известно, а а нет. Требуется построить доверительный интервал для математического ожидания, покрывающий параметр а с заданной надежностью (т.е. доверительной вероятностью) γ . Пусть сделана выборка { x1, x2, … , xn } с.в. Х объема n и по ней вычислено выборочное среднее
.
Как уже говорилось, полученная выборка есть реализация системы независимых случайных величин X1, X2, … , Xn , каждая из которых тоже имеет нормальное распределение с теми же параметрами а и σ . При этом вычисленное выше выборочное среднее есть реализация соответствующей случайной величины
.
Можно (но не так просто) доказать, что с.в. , определенная этой формулой, тоже распределена по нормальному закону. Используя свойства математического ожидания и дисперсии, легко найти параметры этого распределения:
.
Для построения доверительного интервала с заданной надежностью γ найдем такое δ, чтобы выполнялось неравенство . Для любой с.в.Х, распределенной по нормальному закону, ранее была выведена формула , гдеФ(х) – функция Лапласа. Применяя ее для нашего случая с полученными выше выражениями для математического ожидания и среднего квадратического отклонения, получим
Поэтому искомое δ должно удовлетворять уравнению . Обозначим черезt такое число, что (такое число ищется из таблицы функции Лапласа). Тогдаδ должно удовлетворять уравнению , откуда. Таким образом, мы получили, что доверительный интервал
покрывает неизвестный параметр а с доверительной вероятностью γ , где − найденное по выборке выборочное среднее, а значение параметраt определяется из равенства по таблице значений функции Лапласа.
Пример. Генеральная совокупность некоторого признака Х распределена нормально с известным средним квадратическим отклонением σ=0.4 . Для определения среднего значения признака Х была сделана выборка объема n=20, по которой вычислено выборочное среднее . Найти доверительный интервал для математического ожиданияа признака Х с надежностью γ=0.99 .
Решение. Для находим по таблице функции Лапласа соответствующее значение параметраt=2.58 . Тогда по выписанной выше формуле с вероятностью γ=0.99 среднее значение а признака Х заключено в интервале .
Пример. Генеральная совокупность некоторого признака Х распределена нормально с известным средним квадратическим отклонением σ=3 . Для определения среднего значения признака Х была сделана выборка объема n=36, по которой вычислено выборочное среднее . Найти доверительный интервал для математического ожиданияа признака Х с надежностью γ=0.95 .
Ответ: 3.12<a<5.08 .