- •Федеральное агентство по образованию
- •Случайное событие
- •Алгебра событий.
- •Элементы комбинаторики
- •Формула полной вероятности.
- •Формула для апостериорной вероятности (формула Байеса)
- •Локальная теорема Лапласа
- •Интегральная теорема Лапласа
- •Случайные величины.
- •Совместное распределение случайных величин.
- •Числовые характеристики случайных величин
- •Математическое ожидание
- •Дисперсия
- •Коэффициент корреляции
- •Функция распределения, ее свойства.
- •Биномиальное распределение
- •Распределение Гаусса.
- •Законы больших чисел.
- •Характеристики выборки.
- •Выборочное среднее, выборочная дисперсия.
- •Гистограмма и полигон
- •Оценка характеристик выборки.
- •Точечные оценки
- •Доверительный интервал. Общее понятие.
- •Доверительный интервал математического ожидания. Случай 1.
- •Распределение
- •Доверительный интервал для дисперсии
- •Распределение Стьюдента.
- •Доверительный интервал математического ожидания. Случай 2.
- •Понятие о теории проверки статистических гипотез.
- •Ошибки при проверке гипотез
- •Проверка гипотезы о функции распределения.
- •Однофакторный дисперсионный анализ
- •Литература
Ошибки при проверке гипотез
Принятие решения на основе статистического критерия носит случайный характер, поэтому не исключены ошибки. Возможны следующие ситуации.
1. Гипотеза верна, и она не отвергается. Все в порядке: наше решение отражает истинное положение.
2. Гипотеза верна, но она отвергается. В этом случае говорят, что допущена ошибка I рода. Поскольку нулевая гипотеза верна, статистика Z действительно имеет то распределение, на основании которого принималось решение. Тем не менее выборочное значение статистики попало в критическую область. Вероятность этого события по определению равна уровню значимости .
Вероятность ошибки I рода равна уровню значимости критерия.
Но уровень значимости задается произвольно. Поэтому в нашей власти снизить вероятность ошибки I рода до сколь угодно низкого уровня.
3. Гипотеза неверна, и она отвергается. Снова все в порядке: отвергнута неверная гипотеза.
4. Гипотеза неверна, но она не отвергается. Тогда говорят, что допущена ошибка II рода. В этой ситуации выборочное значение попало в область принятия решения, тогда как гипотеза на самом деле неверна. Если распределение статистики Z известно и в предположении, что верна альтернативная гипотеза , то можно посчитать вероятность ошибки II рода: это условная вероятность того, что Z попадает в область при условии, что верна гипотеза . Вероятность ошибки II рода обычно обозначают через
.
В большинстве случаев нельзя добиться минимального значения вероятностей и одновременно. Поступают обычно следующим образом: вероятность ошибки I рода фиксируется, а затем добиваются минимума вероятности ошибки II рода. За счет чего можно уменьшить при фиксированном значении ? Только за счет выбора критической области: при заданной альтернативе критическую область выбирают таким образом, чтобы значение (вероятность принять неверную гипотезу) было наименьшим из возможных. В этом случае вероятность отвергнуть неверную гипотезу максимальна. Это число называют мощностью критерия. Таким образом, задача состоит в построении наиболее мощного критерия при заданном уровне значимости.
Проверка гипотезы о функции распределения.
Пусть - выборка наблюдений некоторой случайной величины .
Гипотеза: : генеральная совокупность имеет функцию распределения F(x)
против альтернативы, что функция распределения не такова.
За меру расхождения примем величину
Теорема (Пирсона). Пусть т параметров функции распределения оцениваются по выборке. Тогда прираспределение меры расхождениястремится к распределениюсстепенями свободы
.
Однофакторный дисперсионный анализ
Пусть результаты наблюдений составляют k независимых выборок (групп), полученных из k нормально распределенных генеральных совокупностей, которые имеют, вообще говоря, различные средние . Каждая группа содержитзначений,. Общее число наблюдений равно:
Проверяется гипотеза о равенстве средних во всех k выборках:
Нулевая гипотеза является сложной: предполагается лишь, что математические ожидания совпадают, о конкретном значении ничего не известно. Альтернативная гипотеза состоит в том, что хотя бы две выборки имеют различные средние.
Обозначим через -й элемент j-й выборки,. Групповое среднее :
Общее среднее
Основное тождество дисперсионного анализа
Общая сумма квадратов отклонений от среднего есть сумма квадратов между группами плюс сумма квадратов внутри групп.
.
,
Теорема Если нулевая гипотеза верна, то случайные величины,имеют распределениесоответственно с и степенями свободы.
Если нулевая гипотеза верна, то случайная величина распределена по закону Фишера с, степенями свободы.
Распределение Фишера строится на основе распределения :
При заданном уровне значимости а критическая область находится на правом хвосте распределения Фишера, то есть правее квантили порядка
Фактор, в соответствии с которым сгруппированы данные, можно признать статистически значимым, если выборочное значение статистики F удовлетворяет неравенству
.
В этом случае гипотеза о равенстве математических ожиданий не подтверждается экспериментальными данными.