Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Теор.вероятн. и матем.стат / Практ-ум по Теор.Вер-й и Матем.Статист.,ч.2.doc
Скачиваний:
89
Добавлен:
13.02.2015
Размер:
3.78 Mб
Скачать

4.4. Непараметрические ранговые критерии.

Определение 4.5. Статистический критерий, распределение которого не зависит от вида или хотя бы параметров распределения основной или альтернативных гипотез, называется непараметрическим.

Часто приходится сравнивать две выборки или две серии независимых наблюдений однородных величин X и Y, причём наблюдённые значения xi и yj дают различные значения выборочных средних () или обнаруживают различные рассеяния (). Возникает вопрос: можно ли считать эти расхождения существенными, значимыми или их следует приписать случайностям выборок.

Основная и альтернативная гипотезы в данном случае могут быть сформулированы как в виде (4.1) или (4.5) так и виде (4.8) и (4.13).

Большинство мощных непараметрических критериев используют статистики, основанные не на самих выборочных наблюдениях, а на так или иначе присвоенных им номерах-рангах, или на значениях сопоставленной им логической переменной. Критерии первого типа называют ранговыми. Многие ранговые критерии, применяемые к решению обозначенных выше задач, по сути своей представляют критерий, предложенный впервые Вилкоксоном.

a. Критерий инверсий Вилкоксона.

Предлагаемый критерий особенно удобен при следующей формулировке нулевой и альтернативной гипотез: H0 – обе выборки извлечены из одной совокупности, т. е. FX = FY (совпадение выборочных распределений); H1: FX < FY или FX > FY .

Критерий основан на числе инверсий, под которыми понимается следующее: наблюдения, полученные в двух выборках, располагаются в общую последовательность в порядке возрастания их значений, например в виде

x1 y1 y2 x2 y3 x3 x4 x5 y4 x6 y5 y6 y7 x7 x8 x9 y8 y9 y10 x10 y11 x11 y12. (4.15)

Если какому либо значению x предшествует некоторый y, то эта пара даёт инверсию (можно наоборот, рассматривать предшествование y –ов x-ам). Статистикой критерия является величина u общее число инверсий.

Гипотеза H0 отвергается, если число u превосходит выбранную в соответствии с уровнем значимости границу, определяемую из того, что при объёмах выборок m > 10 и n > 10 число инверсий u распределено приблизительно нормально с математическим ожиданием и дисперсией:

Mu = mn /2; Du = mn (m + n + 1)/12. (4.16)

Пример 4.2. В рассмотренной последовательности из двух выборок (4.14) m = 12, n = 11; ux = 2 + 33 + 4 + 37 + 10 + 11 = 57 для x- ов и uy = 21 + 2 + 4 + 5 + 36 + 39 +10 + 11 = 79 для y– ов; Mu = 1211/2 = 66; Du = 121124/12 = 264; σu = (Du)1/2 ≈ 16,25. Зададимся, например, пятипроцентным уровнем значимости (q = 5%; ε = q/100 = 0,05) и по таблице стандартного нормального распределения находим критическое значение tq = 1,96 симметричной двусторонней критической области для гипотезы H0, определяемой уравнением

P{tq} = P {|Mu | > tqσu}.

Для рассматриваемого примера границы критической области равны:

u1 = 66 – 1,96 16,25 = 34,15 ≈ 34; u2 = 66 + 1,96 16,25 = 97,85 ≈ 98.

Так как ux ; uy  (u1, u2) = (34; 98) , то гипотеза H0 не отвергается (нет оснований считать выборочные распределения различными). Вероятность ошибки при этом равна 0,05.

b. Критерии Манна – Уитни и Сиджела – Тьюки.

Рассматриваемые здесь ранговые статистические критерии являются своеобразными модификациями критерия Вилкоксона и используются в задачах проверки гипотез о параметрах распределений.

Критерий Манна- Уитни предназначен для проверки нулевой гипотезы о равенстве выборочных средних значений, т. е. H0: . Точнее: наблюдаемые различия между выборочными средними носят чисто случайный характер, определяемый случайностью эксперимента.

Для получения статистики критерия выборки выстраивают в общую последовательность в порядке возрастания (или убывания) и каждому выборочному значению в этом ряду сопоставляется ранг rk – его номер в этом ряду (k = 1  m + n) Одинаковым выборочным значениям присваивается одинаковый ранг, равный среднему арифметическому из номеров этих значений в общем ряду. Далее считается сумма рангов U величин xi (или yj). Статистика U (для варианты X) удовлетворяет соотношениям

MU = n(m + n + 1)/2; DU = mn (m + n + 1)/12, (4.17)

которые задают параметры нормального распределения при тех же условиях для m и n. Поэтому критическая область для гипотезы H0 строится так, как описано выше. Отметим лишь, что в выражении для MU следует заменить n на m при расчёте статистики критерия для варианты Y.

Критерий Сиджела – Тьюки предназначен для проверки нулевой гипотезы о равенстве выборочных дисперсий, т. е. H0:=против H1:.

Порядок формирования статистики критерия и принятия решения почти совпадают с той же процедурой для критерия Манна – Уитни. Различие состоит лишь в процедуре присвоения номеров (а, значит, и рангов) выборочным значениям, упорядоченным в общем ряду. Первый номер присваивается первому члену ряда; второй и третий – последнему и предпоследнему; четвёртый и пятый – второму и третьему членам ряда и т. д. После этого номера одинаковых по величине вариант усредняются. Сумма полученных при этом рангов для вариант одной из выборок (любой) и составляет статистику U критерия.

Пример 4.3. Рассмотрим те же две выборки, что и в предыдущем примере и полагаем, что последовательность (4.15) выстроена в порядке возрастания и варианты y5 y6 y7 x7 x8 x9 имеют одинаковоё значение. Таблица рангов:

x y y x y x x x y x y y y x x x y y y x y x y

1 2 3 4 5 6 7 8 9 10 13 13 13 13 13 16 17 18 19 20 21 22 23

1 4 5 8 9 12 13 16 17 20 20,6 … 20,6 15 14 11 10 7 6 3 2

Тогда статистика U для элементов выборки X имеет значение: U1 = 120; U2 = 136,2. Величины MxU = 132; MyU = 144; σU ≈ 16,25. Критическое значение tq = 1,96 и обе статистики не превосходят свои верхние критические значения: Uq = 164 в первом и Uq = 176 во втором случаях. Поэтому нулевые гипотезы о равенстве выборочных средних и дисперсий следует в данном случае отвергать нет оснований.