- •Предмет и система правовой статистики.
- •Особенности юридической статистики. Методологические особенности правовой статистики и ее связь с другими науками и учебными дисциплинами
- •Современная организация правовой статистики в Российской Федерации.
- •Научно-практическое значение материалов правовой статистики.
- •История уголовно-правовой статистики советского периода.
- •Понятие статистического наблюдения, этапы его проведения.
- •Организационные вопросы статистического наблюдения.
- •Ошибки регистрации и репрезентативности.
- •Единый учет преступлений и документы первичного учета в правоохранительных органах.
- •Выборочный метод. Генеральная и выборочная совокупность. Типы выборок.
- •Табличный и графический методы представления данных статистики.
- •Существуют правила построения таблиц:
- •Статистическое распределение выборки. Эмпирическая функция распределения. Свойства эмпирической функции распределения.
- •Определения
- •Свойства эмпирической функции распределения Эмпирическое распределение для фиксированного
- •Числовые характеристики статистического распределения (выборочные среднее, дисперсия, среднеквадратичное отклонение, мода, медиана, моменты, асимметрия и эксцесс, квантили).
- •Понятие дисперсии
- •Виды дисперсии
- •Правило сложения дисперсии в статистике
- •Свойства дисперсии
- •Основные сведения
- •[Править]Правило трёх сигм
- •[Править]Интерпретация величины среднеквадратического отклонения
- •[Править]Практическое применение
- •[Править]Климат
- •[Править]Спорт
- •[Править]Технический анализ
- •[Править]Пример использования
- •[Править]Определение
- •[Править]Замечания
- •[Править]Дециль
- •[Править]Перцентиль
- •[Править]Квантили стандартного нормального распределения
- •[Править]Определение
- •[Править]Замечания
- •[Править]Таблица квантилей
- •Оценка параметра и свойства оценок. Статистические оценки параметров распределения
- •Точечное оценивание параметров распределения.
- •Интервальное оценивание параметров распределения. Интервальное оценивание среднего квадратичного отклонения нормального распределения.
- •Статистическая гипотеза. Постановка задачи проверки статистических гипотез. Понятие статистической гипотезы
- •Ошибки первого и второго рода при проверке гипотез.
- •[Править]Определения
- •[Править]о смысле ошибок первого и второго рода
- •[Править]Вероятности ошибок (уровень значимости и мощность)
- •20. Проверка гипотез о законе распределения. Критерий согласия «Хи–квадрат» Пирсона
- •[Править]Статистика критерия
- •[Править]Правило критерия
- •Нормальный закон распределения и его основные характеристики.
- •[Править]Свойства
- •[Править]Моделирование нормальных случайных величин
- •[Править]Центральная предельная теорема
- •Статистические связи. Условное среднее. Причинная и функциональная связи. Статистическая связь
- •Парная корреляция. Уравнение регрессии. Линия регрессии.
- •[Править]Цели регрессионного анализа
- •[Править]Математическое определение регрессии
- •[Править]Метод наименьших квадратов (расчёт коэффициентов)
- •[Править]Интерпретация параметров регрессии
- •25. Корреляционный момент, коэффициент корреляции их свойства.
Ошибки первого и второго рода при проверке гипотез.
шибки первого рода (англ. type I errors, α errors, false positives) и ошибки второго рода (англ. type II errors, β errors, false negatives) в математической статистике — это ключевые понятия задач проверки статистических гипотез. Тем не менее, данные понятия часто используются и в других областях, когда речь идёт о принятии «бинарного» решения (да/нет) на основе некоего критерия (теста, проверки, измерения), который с некоторой вероятностью может давать ложный результат.
[Править]Определения
Пусть дана выборка из неизвестного совместного распределения , и поставлена бинарная задача проверки статистических гипотез:
где — нулевая гипотеза, а — альтернативная гипотеза. Предположим, что задан статистический критерий
,
сопоставляющий каждой реализации выборки одну из имеющихся гипотез. Тогда возможны следующие четыре ситуации:
Распределение выборки соответствует гипотезе , и она точно определена статистическим критерием, то есть .
Распределение выборки соответствует гипотезе , но она неверно отвергнута статистическим критерием, то есть .
Распределение выборки соответствует гипотезе , и она точно определена статистическим критерием, то есть .
Распределение выборки соответствует гипотезе , но она неверно отвергнута статистическим критерием, то есть .
Во втором и четвертом случае говорят, что произошла статистическая ошибка, и её называют ошибкой первого и второго рода соответственно. [1][2]
|
Верная гипотеза |
||
|
|
||
Результат применения критерия |
|
верно принята |
неверно принята (Ошибка второго рода) |
|
неверно отвергнута (Ошибка первого рода) |
верно отвергнута |
[Править]о смысле ошибок первого и второго рода
Как видно из вышеприведённого определения, ошибки первого и второго рода являются взаимно-симметричными, то есть если поменять местами гипотезы и , то ошибки первого рода превратятся в ошибки второго рода и наоборот. Тем не менее, в большинстве практических ситуаций путаницы не происходит, поскольку принято считать, что нулевая гипотеза соответствует состоянию «по умолчанию» (естественному, наиболее ожидаемому положению вещей) — например, что обследумый человек здоров, или что проходящий через рамку металлодетектора пассажир не имеет запрещённых металлических предметов. Соответственно, альтернативная гипотеза обозначает противоположную ситуацию, которая обычно трактуется как менее вероятная, неординарная, требующая какой-либо реакции.
С учётом этого ошибку первого рода часто называют ложной тревогой, ложным срабатыванием илиложноположительным срабатыванием — например, анализ крови показал наличие заболевания, хотя на самом деле человек здоров, или металлодетектор выдал сигнал тревоги, сработав на металлическую пряжку ремня. Слово «положительный» в данном случае не имеет отношения к желательности или нежелательности самого события.
Термин широко используется в медицине. Например, тесты, предназначенные для диагностики заболеваний, иногда дают положительный результат (т. е. показывают наличие заболевания у пациента), когда, на самом деле пациент этим заболеванием не страдает. Такой результат называется ложноположительным.
В других областях, обычно, используют словосочетания со схожим смыслом, например, «ложное срабатывание», «ложная тревога» и т. п. В информационных технологиях часто используют английский термин false positive без перевода.
Из-за возможности ложных срабатываний не удаётся полностью автоматизировать борьбу со многими видами угроз. Как правило, вероятность ложного срабатывания коррелирует с вероятностью пропуска события (ошибки второго рода). То есть, чем более чувствительна система, тем больше опасных событий она детектирует и, следовательно, предотвращает. Но при повышении чувствительности неизбежно вырастает и вероятность ложных срабатываний. Поэтому чересчур чувствительно (параноидально) настроенная система защиты может выродиться в свою противоположность и привести к тому, что побочный вред от неё будет превышать пользу.
Соответственно, ошибку второго рода иногда называют пропуском события или ложноотрицательным срабатыванием — человек болен, но анализ крови этого не показал, или у пассажира имеется холодное оружие, но рамка металлодетектора его не обнаружила (например, из-за того, что чувствительность рамки отрегулирована на обнаружение только очень массивных металлических предметов).
Слово «отрицательный» в данном случае не имеет отношения к желательности или нежелательности самого события.
Термин широко используется в медицине. Например, тесты, предназначенные для диагностики заболеваний иногда дают отрицательный результат (т. е. показывают отсутствие заболевания у пациента), когда, на самом деле пациент страдает этим заболеванием. Такой результат называется ложноотрицательным.
В других областях, обычно, используют словосочетания со схожим смыслом, например, «пропуск события», и т. п. В информационных технологиях часто используют английский термин false negative без перевода.
Степень чувствительности системы защиты должна представлять собой компромисс между вероятностью ошибок первого и второго рода. Где именно находится точка баланса, зависит от оценки рисков обоих видов ошибок.