- •Лекция № 1 Место и роль дисциплины в общеобразовательной структуре
- •Алгебра случайных событий
- •Понятие вероятности случайного события.
- •Лекция №2 Статистическая устойчивость вероятности события.
- •Аксиоматическое определение вероятности (по Колмагорову).
- •Элементарные теоремы теории вероятности.
- •Теорема вероятности полной группы событий.
- •Теорема сложения вероятностей.
- •Лекция № 3. Теорема о полной вероятности
- •(Схема независимых последовательных испытаний длиной n)
- •Биноминальное распределение (1) случайной величины
- •Геометрическая вероятность случайного события
- •Лекция №4 Полиномиальное распределение (схемы)
- •Ассимтотические приближения биноминального распределения (для схемы Бернулли)
- •3Способа аппроксимации данной формулы:
- •Лекция №5 Случайная величина
- •Функция распределения для непрерывной случайной величины
- •Лекция №6 Числовые характеристики случайной величины
- •Моментные характеристики
- •Центрированные моменты Центральные моменты
- •Дисперсия для непрерывной случайной величины
- •Лекция № 7
- •Примеры распределения случайной величины.
- •Лекция № 8
- •Лекция № 9
- •Лекция № 10
- •Лекция № 11 Теорема числовых характеристик
- •Лекция № 12 Центральные предельные теоремы
- •Случайные процессы
- •Свойства случайного процесса
- •Лекция № 13
- •Лекция № 14 Разложение апериодических случайных процессов.
- •Спектральная плотность случайного процесса.
- •Лекция № 15
- •Лекция № 16
- •Основные задачи математической статистики
- •Лекция №17 Задача оценивания параметров распределения Формальная постановка задачи
- •Лекция №18 Представление об интервальных оценках
- •Лекция 19 Логическая схема проведения испытаний статистической гипотезы.
- •Лекция № 20 Корреляционный и регрессионный анализ
- •Лекция № 21 Анализ временных рядов
Лекция №18 Представление об интервальных оценках
В предыдущем параграфе оценка параметров рассматривалась как точка на числовой оси. Точечные или локальные оценки параметров. В практических задачах для ситуации удобно использовать другой взгляд на приближение к истинному значению параметров, т.е. влиять на оценку параметра.
Поскольку параметр может принимать отдельное значение из некоторого множества, то задают на оси некоторый интервал (α,β)
Pд= P{ α ≤ a ≤ β }
α a β
Pд – доверительная вероятность.
Истинное значение параметра будет находиться внутри этого интервала. Такая интерпретация оценки называется интервальной (доверительной) оценкой. Нужно задать 3 числа: g, α, β.
Существует 2 метода получения истинных оценок:
Метод, основанный на Баессовском подходе;
Подход Фишер-Неймана (метод доверительных интервалов ).
Суть метода, основанного на Баессовском подходе
При первом используют такие предположения: неизвестный параметр а есть случайная величина со случайным распределением w(a). В конкретном опыте имеем дело с какой-то фиксированной реализацией параметра а. При фиксированном а, одним из точечных методов находят оценку параметра а.
Поскольку оценка – это случайная величина, то чтобы она стала известной, нужно задать ее распределение, например, g(a*/a) – условная плотность распределения оценки a* при фиксированном значении параметра а.
Задача заключается в нахождении доверительного интервала для а. Формула Байесса позволяет связать наблюдаемое смещение a* с важной причиной этого следствия.
Переходим к условной плотности появления реализации параметра а, если мы наблюдаем оценку а* в опыте:
- интеграл той области, где определены значения параметра а.
Апосторная вероятность (после опыта):
P{ (k1 ≤ a ≤ k2 )/a*} =
Априорная вероятность (до опыта):
P{ k1 ≤ a ≤ k2 } =
Метод нужно использовать тогда, когда известно что параметр а - случайная величина, распределенная по известному закону.
Суть метода Фишера-Неймана
При этом методе считается, что параметр а – это неизвестная величина, в частности может быть и случайной величиной. Идея построения доверительных интервалов поясняется следующим графиком:
а*
С2(а*,ξ) С1(а*,ξ)
а*
γ2
а
а2 а1
γ1
На вертикальной оси могут находиться оценки параметра а, при фиксированном значении а. Ось является представлением g(a*/a) условной плотности появления параметра при его фиксированном значении.
По стержню распределена плотность. Плотность этого стержня будет пропорциональна этой функции:
γ 1(а,ξ)
γ 2(а,ξ)
(1)
Выражение (1) означает вероятность того, что значение попадет в этот отрезок. Точки будут двигаться по некоторым правилам γ 1 и γ 2.
Заштрихованная область означает вероятность того, что оценка в любом случае будет в интервале от γ 1 до γ 2. Если получим условную плотность, то можно найти доверительный интервал для получения оценок по формуле (1).
Проведем опыт и получим оценку. Пересечения точек, если их спроектировать на ось а. дают нам а1 и а2 , которые определяют область изменения параметра а. Если параметр попадет в эту область, то его оценка с заданной вероятностью Р будет находиться в интервале от γ 1 до γ 2.
Шаг 1: используя один из методов, получения точечных оценок стремится найти условную плотность: g(a*/a). Если она найдена, то используют соотношение (1), задавая величину Рд, находят интервалы γ 1 и γ 2. Если же непосредственно найти условную плотность нельзя найти, то нужно сконструировать вспомогательную случайную величину, для которой может быть найдена условная плотность и для нее составляется уравнение типа (1).
Пример построения доверительного интервала для мат. ожидания случайной величины, распределенной по нормальному закону с известной дисперсией.
(параметр G считается известным)
X = (x1,x2,…,xk) – считается, что провели опыт и сделали выборку. Необходимо найти параметр mx. Точеной оценкой мат. ожидания является среднеарифметическая оценка:
- среднее значение (является случайной величиной)
имеет тоже нормальный закон распределения:
по теореме Чебышева
;G – среднеквадратичное отклонение
n – объем выборки.
Преобразуем случайную величину, чтобы исключить неизвестные, формируем новую случайную величину:
Закон распределения для η:
=
P{| - mx| ≤ ξ}= Pд
P{| - mx| ≤ ξ}=
Ф(ξ) - Ф(-ξ) = 2 Ф(ξ) = Pд
Ф(х) =
P{| - mx| ≤ ξ}= Pд
Ф(ξ) = Pд/2
Pд – вероятность того, что модуль не превысит ξ.
|- mx| =|η| ≤ ξ
F(x)
1
Pд
x tg
- интервальная оценка mx
- точечная оценка или среднее значение.
Проверка статистических гипотез
К задаче проверки статистических гипотез обращаются в тех случаях, если исследователю неизвестна функция распределения случайной величины х. Это означает, что он выдвигает статистическую гипотезу.
F*(x) = Fт(x), где F*(x) – это эмпирическая функция распределения. Исследователь задает значения параметров, например, Fт(x)=1-е-0,7х – экспоненциальная величина. Исследователь должен записать конкретно значения параметров, например, 1-е-0,7х.
В качестве количественных значений параметров используют оценки полученные либо по методу подобия, либо по методу min χ2.