4.1. Основные определения и используемые понятия.

Рассмотрим ситуации, приводящие к задаче проверки статистических гипотез. Случайная величина ξ  F(x), при этом F(x) неизвестно; случайная величина ξ  F(x, θ), при этом неизвестен набор параметров θ распределения (или некоторые из них). Так как при этом случайная величина представлена в виде выборочных значений {x_j}, j = 1 ÷ n, то речь идёт о сравнении выборочного распределения с некоторым гипотетическим теоретическим распределением, причём во втором случае вместо проверки статистической гипотезы можно решать задачу оценки параметров. Ещё один класс задач, связанных с проверкой статистических гипотез, можно сформулировать так: имеются две случайные величины ξ и η, соответственно представленные выборками {x_j}, j = 1 ÷ n; {y_k}, k = 1 ÷ m . При этом могут возникнуть следующие гипотезы. Из одной ли генеральной совокупности извлекались выборки (можно ли считать незначимой различие в выборочных оценках параметров распределения по разным выборкам)? Каков тип распределения генеральной совокупности, из которой, предположительно, извлекались обе выборки? Есть ли статистическая связь между этими случайными величинами и каков её характер?

Можно все задачи проверки статистических гипотез условно разделить на следующие группы: проверка гипотез о вероятностях; проверка гипотез о параметрах распределений (чаще – средних и дисперсиях; реже - расположения и формы, в этом случае могут привлекаться и моменты более высокого порядка); проверка гипотез о функциях распределения (в частности, гипотез согласия). Гипотезы о наличии и виде статистической зависимости обычно рассматривают в рамках теории корреляции.

Определение 4.1. Случайная величина ξ, которая служит для статистической проверки гипотез, называется статистикой критерия, а правило проверки называют собственно критерием.

Определение 4.2. Проверка гипотезы состоит в том, что если наблюдаемое значение статистики критерия принадлежит некоторому определённому множеству S, т.е. наступает событие {ξ Ѕ}, то основная гипотеза H₀ отвергается.

Определение 4.3. Гипотеза называется простой, если она однозначно определяет функцию распределения генеральной совокупности (а также и выборки). Все остальные гипотезы называются сложными.

Пример 4.1. Гипотеза H₁: ξ N(0; 1) – простая, а гипотеза H₁: ξ N(μ; ²) – сложная, если μ и ² не конкретизированы.

Если выдвигаются две взаимоисключающие гипотезы H₀ и H₁ (т.е. верна одна и только одна из них), то одну из них (её обычно обозначают H₀) называют основной, а вторую конкурирующей или альтернативной. Одну из гипотез надо принять, и тем самым отвергнуть другую. Обычно и критерий и решение (принять или отвергнуть) формулируются относительно основной гипотезы.

Построение критерия означает, что все возможные значения выборки разбиваются на два множества, т. е выборочное пространство Rⁿ = I U Ī. При этом, если X I, то гипотеза H₀ отвергается, а если X Ī, то принимается. Множество I обычно называют критической областью или множеством критических значений, а множество Ī – множеством или областью допустимых значений.

При этом возможны следующие ситуации:

— гипотеза H₀принимается и она верна;

— гипотеза H₀отвергается, хотя она верна (ошибка I рода);

— гипотеза H₀ принимается, хотя она не верна (ошибка II рода);

— гипотеза H₀отвергается и она не верна.

Для дальнейшего построения критерия требуется выполнение некоторой эмпирической, не связанной с используемым статистическим материалом, операции: выбор уровня значимости критерия. Под последним понимается величина 1 – ε, где ε некоторая малая вероятность (ε = 0,01; 0,02; 0,05 или в процентах q = 1%, 2%,5% и т. п.), отвечающая событиям, которые в данной обстановке исследования считаются (с некоторым риском) практически невозможными. Иногда через ε (или q/100) обозначают сам уровень значимости. В любом случае вероятность попадания критерия в область допустимых значений при справедливости гипотезы H₀равна 1 – ε.

Замечание 4.1. Если значение критерия, вычисленное на основе выборочных данных, окажется вкритической области, то гипотезуH₀отвергают, так как попадание в эту область при выполнении гипотезы практически невозможно. Если же оно окажется вобласти допустимых значений, то ещё нельзя утверждать, что гипотезаH₀подтвердилась; можно лишь утверждать, что наблюдённое значение критерия не противоречит этой гипотезе и она допустима вплоть до получения нового статистического материала, способного изменить ситуацию.

Смысл ошибок I и II рода хорошо виден на простом примере. Пусть рассматривается простая гипотеза H₀: F(x) = F₁(x) против простой альтернативы H₁: F(x) = F₂(x). Тогда вероятность отвергнуть верную «нулевую», т. е. вероятность ошибка I рода α = P{x  I} = 1 – F₁(x_ε) ≤ ε, а вероятность принять неверную «нулевую» гипотезу уже определяется распределением F₂(x), т. е. вероятность ошибка II рода β = P{x  Ī} = F₂(x_ε) тогда является достаточно малой величиной.

Вычисление вероятностей ошибочных решений при справедливости сложных гипотез, как правило, невозможно, т. к. неизвестно конкретное распределение выборки. И всё-таки, чем более опасными признаются ошибки первого рода, тем меньшее значение уровня значимости критерия ε следует выбирать.

Замечание 4.2. Уровень значимости критерия проверки гипотезы контролирует таким образом лишь ошибки первого рода. Уменьшение ε уменьшает α, но при этом понижаетсячувствительностькритерия так как расширяется область допустимых значений и возрастает вероятность ошибки второго рода β.

Определение 4.4. Величина 1 – β, равная вероятности отвергнуть неверную гипотезу H₀, называется мощностью критерия.

Замечание 4.3. Неравенствоα = P{x I}=1 –F₁(x_ε) ≤ ε неоднозначно определяет критическое множество. Выбирают ту из возможностей, которая обеспечивает минимум вероятности ошибки второго рода, или, что тоже самое,максимум мощности критерия (наиболее мощный критерий – НМК).

Замечание 4.4. В ряде случаев, особенно при проверке гипотез, связанных с параметрами распределений, «нулевой» гипотезе может противопоставляться множество альтернатив {H_θ}, каждая из которых может зависеть от конкретного параметраθ (вариант сложной альтернативы). Всё сказанное выше об ошибках второго рода и мощности критерия остаётся справедливым, но относится к каждой из альтернатив, а сами эти величины могут являться функциями параметров.

<<< < Предыдущая 1 2 3 4 5 67 / 267 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > Следующая >>>

Соседние файлы в папке Теор.вероятн. и матем.стат

#
13.02.2015407.55 Кб31Пр.2 ТВиМС,альб.табл..doc
#
13.02.20152.44 Mб109Практ-ум по Теор.Вер-й и Матем. Стат.,ч.3.doc
#
13.02.20153.78 Mб89Практ-ум по Теор.Вер-й и Матем.Статист.,ч.2.doc
#
13.02.20152.64 Mб157Практикум по ТВ и МС,ч.1,end-вар-т.doc