Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теор.вероятн. и матем.стат / Практ-ум по Теор.Вер-й и Матем.Статист.,ч.2.doc
Скачиваний:
89
Добавлен:
13.02.2015
Размер:
3.78 Mб
Скачать

3). Критерий Смирнова – Мизеса (критерий ω2)

В качестве меры расхождения эмпирической F*(x) и гипотетической F(x) функций распределения рассматривается средний квадрат отклонения по всем возможным значениям случайной величины, что влечёт потерю некоторой информации по сравнению с критерием Колмогорова. Итак, выборочная статистика имеет вид

ω2 = =(4.4)

Так как эмпирическая функция распределения F*(x) или Fn (x) является несмещённой оценкой теоретического распределения, т.е. M[F*(x)] = F(x), а дисперсия D[F*(x)] = F(x)(1 – F(x)), то, при выполнении нулевой гипотезы согласия, среднее значение и дисперсия статистики ω2 равны: M[ω2] = 1/6n; D[ω2] = (4n – 3) /180n3; не зависят от гипотетического распределения и в асимптотике равны нулю. Удобнее использовать статистику Z = n ω2, для которой M[Z] = 1/6. По сравнению с распределением Колмогорова распределение статистики Z довольно быстро сходится к предельному распределению (уже при n40 они практически совпадают), которое табулирована. В Приложении III в таблице 1 приведены некоторые критические значения для распределения Z. Нулевая гипотеза отвергается с уровнем доверия γ при превышении выборочной статистики критерия над критическим значением.

4.3. Проверка гипотез относительно двух выборок

а. Критерий Колмогорова – Смирнова однородности двух выборок.

Пусть X = (x1, …, x n)  F; Y = (y1, …, y m)  G, где F и G – непрерывные функции распределения.

Проверяется гипотеза

H 0 : F = G против H1 : FG. (4.5)

Предлагаемый критерий – асимптотический с уровнем значимости 1– ε.

Замечание 4.6. Если проверяемая гипотеза о двух выборках имеет вид (4.5), то есть проверяется гипотезао совпадении двух распределений, то критерии, привлекаемые для её решения, называюткритериями однородности. Но нередко в задаче о двух выборках проверяется гипотезао совпадении тольконекоторых параметров распределений.

Пусть Fn и Gm – эмпирические функции распределения, построенные по выборкам X и Y соответственно. Введём величину

. (4.6)

Если верна гипотеза H 0 , то при увеличении объёмов выборок эмпирические функции распределения сходятся по вероятности к общему пределу, то есть Dn,m 0. То, с какой скоростью это происходит, показывает следующая теорема (без доказательства).

Теорема Колмогорова –Смирнова. Пусть верна гипотеза H 0 и общая функция распределения двух выборок непрерывна. Тогда для любого y > 0 при n → ∞, m → ∞ .

Пусть q таково,что K (q) = 1 – ε. Положим критическое множество

, (4.7)

то есть мы отвергаем гипотезу об однородности, если расхождение между двумя эмпирическими функциями распределения достаточно велико. При больших n вероятность ошибки 1-го рода α =≈1–K(q) ≈ ε.

b. Проверка гипотез о совпадении параметров распределений.

Рассмотрим задачу проверки согласия двух распределений, представленных своими выборками, на основе сравнения некоторых параметров этих распределений. Вообще говоря, все параметры практически употребляемых распределений выражаются через свои первые четыре момента. Однако, задача статистического сопоставления произвольных распределений даже на уровне двух первых моментов (проблема Беренса – Фишера) до сих пор не имеет общего решения. Поэтому далее предполагаем, что обе выборки извлечены из нормальных распределений, параметры которых, однако, неизвестны. К тому же, данная ситуация на практике встречается наиболее часто.

Проверка гипотезы о совпадении средних.

Особенно часто в приложениях встаёт вопрос о сравнении центров распределения двух нормально распределённых величин ξ и η. В таком случае полагаем (по основной гипотезе),что выборки X и Y извлечены из нормально распределённой генеральной совокупности.

В данном случае проверяется гипотеза

H 0 : m1 = m2 против H1 : m1m2. (4.8)

При этом предполагается, что дисперсии теоретических распределений совпадают, хотя и не известны: неизвестно.

Для построения критерия используем выборочные средние и дисперсии

.

В силу того, что инезависимы и распределены нормально:

N(m1, σ2/n) = ; N(m2, σ2/m) = ,формируем на их основе статистику, имеющую стандартное нормальное распределение:

Z = [– (m1m2)]/{σ2(1/n + 1/m)}1/2  N(0, 1). (4.9)

Также по свойству выборок из нормального распределения

nSX212 ; mSY222, (4.10)

причём эти случайные величины независимы, т. к. построены по независимым выборкам. Далее, по свойству распределения хи-квадрат, статистика

S2 = (nSX2mSY2) / [σ2(n + m – 2)]  (4.11)

не зависит и распределена похи-квадрат с (n + m – 2) степенями свободы. Таким образом, если верна гипотеза H0 , то статистика

ψ = Z /S = (4.12)

имеет распределение Стьюдента с (n + m – 2) степенями свободы. По таблице распределения Стьюдента находим величину q такую, что (–q) =ε/2.Тогда P{–q < ψ <q } = (q) –(–q) = 1 –ε.Вероятность ошибки первого рода α = P{(x1, …, xn; y1, …, ym)  Κ} = ε, где критическая область

Κ = {(x1, …, xn; y1, …, ym) : | ψ | ≥ q }.

Проверка гипотезы о совпадении дисперсий.

Здесь проверяется основная гипотеза

H0 : σ12 = σ22 против H1 : σ12σ12 . (4.13)

Из величин (4.9) можно построить случайную величину

η = nSX2/(n – 1)σ12 : mSY2/(m – 1)σ22 = , (4.14)

имеющую распределение Фишера. С помощью таблиц этого распределения находят числа q1 и q2 такие, что (q1) =ε/2; (q2) =ε/2. Тогда

P{q1 < η <q2 } = (q2)–(q1)= 1 – ε.Гипотеза H0 отвергается, если η (q1 , q2). Вероятность этого события (в предположении верности гипотезы H0) в точности равна ε. Критическая область Κ = {(x1, …, xn; y1, …, ym) : η (q1 , q2)}.