книги / Непараметрическая статистика
..pdfа для альтернативы сдвига
Нш I / F И / Т / ^ ) ] - ' } - и л / ^ ' и м н о ,
ЛА-*-®
равномерно поЛ для всех f e [ 0 ,l] .
Применим эти результаты и теорему 9.6 1 для вычисления мощностей конкретных тестов. Например, для ДЛг-теста при масштабной альтернативе имеем:
Пт РяЛ( F t ) = l —P {|г(0-5(^ , 8)|< C.(DN)},
N-*оэ
где
S ( t , 6 ) = - 6 F - ' ( t ) - f [ F - ' ( t ) ] .
Аналогично, для Dt- при той же альтернативе получаем
Нш рд+ ( F t ) = l - P { z ( t X s ( t t 8)+Ся (£>£)}, O C t< \.
Лг-»-со Л
Для семейства симметричных относительно нуля распре делений и масштабных альтернатив Гельцер и Пайк [1] предложили тест, основанный на абсолютных значениях наб людений. Тестовая статистика записывается в виде
|
Од. =sup {у аП /ууЫ - р ч ®)])» |
||
|
0<г><со |
|
|
где V = \ X \ и F*(x) = 2 F (v ) — 1. Для этого теста |
|||
limp |
* (F e)^ = l-P {z(0 ^ s* (F 8)+ C a(D)v)!, |
||
м-,» |
л |
|
|
где |
|
|
|
s * ( t , b ) = - b F ' |
4t) |
f* [F*-l(t)] = |
|
|
/ + 1 |
■2f |
F |
|
-8 0 - |
i l t )
Вычисление мощностей в случае, когда функции s(t, б) или s*(t, б) являются линейными, производится сравнительно просто; Я- Гаек и 3. Шидак [1] приводят многочисленные примеры такого рода. Некоторые результаты можно получить, если нелинейные функции s и s* ограничить кусочно линей ными функциями (смотри, например, Квайд [1], Гельцер [1]), хотя уже и в этом случае возникают большие трудности Если нас интересует лишь качественное сравнение мощностей, то можно воспользоваться тем фактом, что для неравенства Pi>Рг достаточным условием является неравенство S \(f, б) < >5г(Г б). Например, для двойного экспоненциального рас пределения и масштабной альтернативы s* (t, б) ^ s ( t , б) для
8* |
235 |
всех / и б. Следовательно £>дг -тест в этом случае обладает
большей мощностью, чем D %-тест. |
|
a(t), невыполнение |
К сожалению, нелинейность границ |
||
неравенств между ними (в случае |
их |
пересечения), а иног |
да — невозможность получения a(t) |
в явном виде, существен |
но ограничивают возможности данного метода.
Таким образом, рассмотрев известные аналитические под ходы к сравнению тестов по их мощности, мы приходим к об щему утверждению, что эти подходы позволяют сравнивать не любые тесты и не при любых альтернативах.
§ 9.7. О Б О Д Н О М Э В Р И С Т И Ч Е С К О М М Е Т О Д Е С Р А В Н Е Н И Я М О Щ Н О С Т Е Й Т Е С Т О В С О Г Л А С И Я С 1 Р У К 1 У Р Ы
Можно сформулировать несколько типичных задач, в ко торых возникает необходимость сравнения тестов по их мощ ности.
1. Если задано несколько альтернатив Gb ..., Gk , то как упорядочатся мощности РЛЕ, Gi), ..., ,(F, Gk) теста согла сия с F, основанного на заданном расстоянии р (заданной статистике 5)?
2. Если задана конкретная альтернатива G и некоторый класс тестов на однотипных расстояниях*, то такой тест из этого класса будет наиболее мощным при данной альтерна тиве?
3. Если задан набор альтернатив Gu ..., Gk и набор тестов 5 Ь ..., S t , основанных на разнотипных расстояниях, то какие пары «тест— альтернатива» предпочтительны в смысле мощ ности?
4. Если задана альтернатива G и два разнотипных теста, то какой из них предпочтителен?
Если бы у нас были методы аналитического вычисления мощностей любых тестов при любых альтернативах, ответить на эти вопросы было бы просто. Однако сложность (а иногда невозможность) вычисления мощностей вынуждают нас ис кать других путей. На то, что такие пути должны существо вать, указывает сам характер перечисленных задач: нам не требуется знать ни точного значения мощностей, ни даже только их разности; мы вполне удовлетворились бы знаком разности. Таким образом, мы приходим к следующей задаче: для каких тестов {5} и при каких альтернативах {т(и)} мож
но сделать суждения типа |
(тг) или (3*, (т )^ р ^ |
(т) |
без вычисления мощностей |
(или распределений статистики)? |
|
* Например, расстояния d4 |
(§ 9.2) при разных 'F однотипны, a |
d2 и |
d4— разнотипны. |
|
|
236
По отношению к тестам согласия структуры d в ряде случаев на этот вопрос можно ответить, опираясь на некоторые общие свойства классов тестов, рассматриваемых альтернатив и тес товых статистик. Перейдем к обсуждению этих свойств*.
Согласно теореме Чэпмена (см. § 9.6) о мощности моно тонного теста структуры d при альтернативах, подчиняющих
ся неравенству, можно сделать суждение сразу: для |
таких |
тестов, если ti («) ^ т 2(ы), «<=[0,1], р (TI) ^ P (т2). В |
этом |
случае сравнение мощностей сводится к сравнению альтер натив.
Для удобства будем рассматривать альтернативы в кано
нической форме, т. е. т (u)=GF~1 (и), 0 < и ^ 1 . |
В таком |
|
представлении любая гипотеза F соответствует равномерному |
||
в [0,1] распределению то= « ; |
в силу монотонности F сдвиго |
|
вые альтернативы сохранят |
односторонность |
(т. е. либо |
т^то, либо т^то). При фиксации медианы и квантиля уров ня, отличного от 0,5 (например, 0,95), все симметричные рас
пределения |
упорядочатся по |
свойству, |
которое |
Гаек [1] |
предложил |
назвать «степенью |
затянутости |
хвостов» |
(напри |
мер, некоторые стандартные |
распределения располагаются |
следующим образом в порядке возрастания степени затяну тости хвостов: нормальное, логистическое, двойное экспонен
циальное (распределение Лапласа), |
распределение Коши). |
П р и м ер 9.7.1. Оказывается, что |
степень затянутости |
хвостов влияет на различие между гипотезой и альтернати вой в канонической форме: на рис. Д.5.1 приведены графики альтернатив правостороннего сдвига при одинаковом (0= 0,4) сдвиге; нумерация кривых соответствует номеру распределения в вышеприведенном ряду. Опираясь на час тичную упорядоченность тестов структуры d и характер ука
занных альтернатив сдвига |
(рис. Д.5.1), можно сразу |
сде |
|||
лать В Ы В О Д , ЧТО П О С К О Л Ь К У |
Д Л Я |
B C e X U Т ^ Т г ^ Т з , P (ti)^ |
|||
(т2) |
(тз). Суждения о |
^ (Т4) сделать нельзя, |
по |
||
скольку |
неравенство T^ |
TI |
выполняется не для всех и. |
|
|
Рассмотренный пример ставит два вопроса: 1) существу |
|||||
ют ли другие ситуации |
(а не только гипотеза сдвига), в ко |
торых можно делать столь же однозначные выводы о срав нении мощностей? 2) какие заключения можно сделать в тех случаях, когда неравенство между альтернативами выполня ется не для всех «?
Ответ на первый вопрос можно получить, лишь обобщив понятие частичной упорядоченности, введенное только дляод-
■* Отметим, |
что попытка |
построения метода сравнения мощностей без |
их вычисления |
изложена в |
работе Тарасенко и Шуленина [2]. Однако |
Д. М. Чибисов [3] указал на недостаточную строгость обоснования метода. В данном параграфе метод изложен с учетом этой критики.
237
носторонних альтернатив. Такое обобщение становится оче видным, как только мы объединим воедино условия упоря доченности для правосторонней (TI^ T2) и для левосторонней альтернатив (T2^ TI): если для любых « с [0 ,1 ] выполняется условие
| Ti (ы) —То(м) I < |т2(«)—■То (и) |, |
(9.7.1) |
то |
|
Р* ( t i X P i Ы - |
|
В такой форме понятие частичной упорядоченности |
тестов |
структуры становится применимым и к масштабным альтер нативам. (Аналогично обобщается понятие монотонности)
П р и м ер 9.7.2. Затянутость хвостов влияет на степень удаленности альтернативы от гипотезы не только при сдви ге, но и при изменении масштаба. На рис. Д.5.2 приведены графики альтернатив масштаба (для о= 1,25; а0= 1 ) . номера кривых соответствуют нумерации примера 9.7.1. Легко ви деть, что условие частичной упорядоченности выполняется для всех приведенных масштабных альтернатив, и мы можем
в этом |
случае |
сделать |
вывод, что |
для монотонных |
тестов |
структуры d |
p5 ( t i) > P i Ы З гр * |
(т4). |
которой |
||
Для |
альтернативы, |
каноническое |
представление |
т* имеет сложную форму, суждение о мощностных свойствах частично упорядоченного теста можно сделать, если можно подобрать такую альтернативу т(и, а ), которая, с одной сто роны, позволяла бы достаточно просто вычислить мощность, а с другой — характеризовалась бы некоторым парамет ром сс, меняя который, мы могли бы заключить т* в полосу: г (и, cii)—т о |^ |т * (и ) —т о |^ |т (« , сс2) —то|. Тогда снова 1Дт(м, ai)) (т * )> р (т(«, а2)).
Обратимся теперь ко второму вопросу. Суждения, получа емые подобно тому, как это сделано в примерах 9.7.1 и 9.7.2, справедливы при любых объемах выборки, но эта общность достигается ценой строгого выполнения неравенств (9.7.1) для всех и. Именно поэтому мы ничего не могли сказать о мощности при т4 в примере 9.7.1. Если теперь учесть некото рые свойства тестовых статистик, то можно продвинуться дальше. Вспомним, что статистика есть оценка некоторого «расстояния» р (F, G), и что, как правило, эта оценка являет ся состоятельной. В силу этого для тестов, основанных на та
ких |
статистиках, можно утверждать, |
что если р (ть то) > |
|
> р |
(т2, То), то найдется такое No (объем выборки), что при |
||
N > N 0 |
(TI) > р Р (т2) . |
|
|
П р и м ер 9.7.3. В условиях примера |
9.7.1 при достаточно |
большом N мощность теста Смирнова при т4 превысит мощ ности при остальных трех альтернативах.
238
Недостатком суждений, подобных только что приведенно му, является неопределенность величины JV0, однако это не лишает их полезности.
Ясно, что мощность теста неоднозначно определяется ве личиной «расстояния», однако ясно также, что верхняя грань мощности монотонно возрастает с ростом р. Это позво
ляет делать некоторые суждения о мощностных |
свойствах |
|||||
тестов путем сравнения «расстояний». |
тестов, |
порождаемых |
||||
П р и м е р |
9.7.4. Рассмотрим |
класс |
||||
расстоянием |
вида p=Jqp(77, G) |
\р (F) |
dF, где |
ф—заданная |
||
непрерывная |
функция |
аргументов, а |
ф — весовая |
функция. |
||
Пусть F и G заданы. |
Спрашивается, |
при каком ф(К) верх |
няя грань мощности теста будет наибольшей? Ответ сводится к нахождению ф(К), обеспечивающего супремум р при задан
ных F, G и ф. Выразим р через |
канонически |
приведенные |
|
F и G: р— (ф(«, т (и)) ф |
(и) |
du. Супремум |
р достигается |
при ф ( и ) = Еk8 (и—ик ), где |
{uk} — значения и, |
при которых |
ф(ы, т) имеет максимумы. Таким образом, тест из рассматри ваемого класса, имеющий максимальную огибающую мощ
ности, есть тест, порождаемый расстоянием р— 2ф (ик, k
т (и,;)). Это позволяет утверждать, например, что для масш табных альтернатив, %(и) которых один раз пересекает т о ( н ) ,
I'Ov-TeCT Купера ( VN—D^ -f DN) будет более мощным, чем
-^дг-тест Колмогорова.
П р и м е р 9.7.5. Покажем, что при любых симметричных распределениях в случае масштабной альтернативы G(x) —
—F(ax) тест Смирнова на абсолютных величинах выбороч ных значений будет иметь всегда значительно большую верх нюю грань мощности, чем тесты Смирнова и Колмогорова на исходных выборочных значениях, и близкую (возможно, равную) мощность с тестом Купера. Для этого сравним со ответствующие «расстояния» pt= su p (тг(й)—и), i = 1, 2, где
т( — приведенная альтернатива для исходной выборки, а тг —
приведенная альтернатива для абсолютных |
значений. При |
симметричности F и G имеем: |
|
Ti (w) = -F (aF ~1 («)), тг(й) = 2 F (aF~l |
(9-7-2) |
Нахождение максимумов функций р,-=тг(н)—и, (= 1 , 2 при водит к следующим уравнениям для значений ит1, соответ
ствующих положениям этих максимумов:
^ f[oF~Hunl) ] = / ( F ^ ( u ml)),
oF~l( Um?_± |
gg?±jA |
(9.7.3) |
239
Um2 |
1 |
Легко видеть, что и т1~ — |
= «0- Отсюда |
P 2 = 2 F [ a F _ 1 ( « о) ] — 2 « O = 2 { F [ CTF —1 (WO) ] — WO} = 2 p i |
( 9 7 4 ) |
Столь большое увеличение расстояния типа Колмогорова — Смирнова между гипотезой и альтернативой при переходе от выборочных значений к их абсолютным величинам и явля ется основанием для утверждений, сделанных в первом пред ложении данного примера. Суждение о тесте Купера следует из того, что п (и) —и имеет два экстремума, каждый из кото рых равен p i (см. рис.
Как видим, предлагаемая методика позволяет делать вы воды о мощностях тестов без их вычисления Следующий па раграф содержит экспериментальные данные, подтверждаю щие эти выводы.
§ 9.8 ОБ ЭКСПЕРИМЕНТАЛЬНОМ СРАВНЕНИИ КРИТЕРИЕВ
СОГЛАСИЯ СТРУКТУРЫ d
Из предыдущих параграфов становится ясным, что теоре тическое исследование мощностных свойств тестов и эвристи ческие способы не всегда могут в полной мере удовлетворить потребность в указании предпочтительных критериев согла сия при некоторых заданных условиях. Современная вычис лительная техника предоставляет выход из этого положения, которым, судя по литературе, все чаще начинают пользовать ся исследователи. Этот выход состоит в экспериментальном сравнении тестов.
Техника статистического эксперимента в принципе доста точно проста. Сначала генерируется выборка из любого ин
240
тересующего нас конкретного распределения Затем по этой выборке вычисляются сравниваемые тестовые статистики По лученные значения сравниваются с критическими значениями для соответствующих статистик (при одинаковых уровнях значимости). Проводя такой эксперимент многократно на различных выборках одинакового объема, можно вычислить относительные частоты принятия альтернативы различными тестами. Эти частоты и являются оценками соответствующих мощностей, и их сравнение позволит сделать суждения о предпочтительности того или иного теста в данной ситуации.
Некоторая трудность может возникнуть из-за того, что точные или асимптотические распределения тестовых ста тистик при нулевой гипотезе известны не для всех статистик В таких случаях естественно воспользоваться статистически ми оценками критических значений, в качестве которых мо гут служить соответствующие порядковые статистики реали зовавшихся значений тестовых статистик.
Ценность таких статистических экспериментов в значи тельной мере зависит от того, насколько общие выводы мож но сделать на их основе, т. е. от того, в какой мере результа ты экспериментирования с фиксированными альтернативами останутся справедливыми для некоторого множества других альтернатив Поэтому весьма важным было бы установление некоторых классов альтернатив, обладающих определенными общими свойствами по отношению к данному классу тестов. Здесь может быть полезной классификация распределений по симметричности, одновершинности и затянутости хвостов,
а также стандартизованное (каноническое) |
представление пар |
||||||||
конкурирующих гипотез |
(см. Добавление |
к Части |
I) |
Ста |
|||||
тистический эксперимент, |
который мы |
опишем ниже, |
был |
||||||
приведен для |
ряда критериев согласия |
и указанных альтер- |
|||||||
|
|
|
|
|
|
|
Т а б л и ц а |
9 8 1 |
|
|
|
Нормальная альтернативная сдвига |
|
|
|||||
а |
TN |
71А' |
|
i0N |
о2 |
|
|
1■< |
|
|
“ а/ |
|
|
|
|||||
0,90 |
0,01 |
0,02 |
|
0,00 |
0,00 |
|
0,03 |
0,05 |
|
0,10 |
0,13(0,17) |
0,16(0,11) |
0,08(0,11) |
0,09(0,10) |
0,14(0,18) |
0,10(0,15) |
|||
0,20 |
0,45(0,46) |
0,40(0,40) |
0,33(0,29) |
0,36(0,29) |
0,39(0,39) |
0,34(0,32) |
|||
0,25 |
0,53 |
0,48 |
|
0,40 |
0,40 |
|
0,51 |
0,42 |
|
0,30 |
0,70 |
0,65 |
|
0,54 |
0,57 |
|
0,60 |
0,57 |
|
0,40 |
0,88(0,91) |
0,82(0,77) |
0,80(84) |
0,83(0,86) |
0,80(0,82) |
0,73(0,74) |
|||
0,50 |
0,99 |
0,95 |
|
0,94 |
0,95 |
|
0,96 |
0,86 |
|
0,60 |
1,00 |
1,00 |
|
0,99 |
1,00 |
|
0,99 |
0,92 |
Здесь в скобках приведены некоторые результаты повторного экспери мента при других выборках.
241
|
|
|
|
|
|
Т а б л и ц а |
9.82 |
|
|
|
|
Альтернатива сдвига Коши |
|
|
|
||
а |
|
|
2 |
4 |
|
M -J .O |
M |
l - 1) |
Ч |
|
<°N |
D N |
|||||
0,05 |
0,19 |
0,10 |
0,12 |
0,14 |
0,19 |
0,10 |
0,20 |
|
0,10 |
0,49 |
0,25 |
0,32 |
0,38 |
0,50 |
0,20 |
0,55 |
|
0,15 |
0,72 |
0,48 |
0,62 |
0,67 |
0,76 |
0,35 |
0,82 |
|
0,20 |
0,89 |
0,69 |
0,83 |
0,85 |
0,91 |
0,55 |
0,93 |
|
0,25 |
0,99 |
0,86 |
0,95 |
0,96 |
0,99 |
0,75 |
0,99 |
|
0,30 |
1,00 |
0,99 |
1,00 |
1,00 |
1,00 |
0,91 |
1,00 |
|
наТив сдвига и масштаба (Жирова, Тарасенко, Шуленин [1]) при JV = 50, а = 0 ,0 5 — табл. 9.8.1—9.8.5.
Зависимости мощности критерия Реньи от параметра b при ведены на рис. 9.8.1 для нормального распределения и на рис. 9.8.2 для распределения Коши.
* |
|
|
|
|
|
Т а б л и ц а 9 8 3 |
|
|
Логистическая масштабная альтернатива |
|
|
||||
8 |
D N |
M |
i - 1 ) |
4 |
4 |
v A ~~DM +DN |
|
1,00 |
0,02 |
|
0,03 |
0,05 |
0,04 |
|
0,02 |
1,30 |
0,05 |
|
0,03 |
0,06 |
0,05 |
|
0,16 |
1,50 |
0,10 |
|
0,06 |
0,11 |
0,15 |
|
0,63 |
1,60 |
0,23 |
|
0,03 |
0,17 |
0,27 |
|
0,70 |
1,80 |
0,40 |
|
0,10 |
0,41 |
0,59 |
|
0,92 |
2,00 |
0,60 |
|
0,22 |
0,78 |
0,88 |
|
0,98 |
2,20 |
0,83 |
|
0,33 |
0,93 |
0,96 |
|
1,00 |
2,40 |
0,90 |
|
0,46 |
0,97 |
0,99 |
|
1,00 |
|
|
|
|
|
|
Т а б л и ц а 9 8 4 |
|
|
Лапласовская масштабная альтернатива |
|
|
||||
8 |
|
М |
4 - 1) |
4 |
Q2 |
VN=D++DJJ |
|
|
|
“ Л' |
|
|
|||
1,00 |
0,03 |
0,02 |
0,03 |
0,03 |
|
0,04 |
|
1,30 |
0,02 |
0,04 |
0,04 |
0,03 |
|
0,05 |
|
1,50 |
0,10 |
0,05 |
0,07 |
0,06 |
|
0,42 |
|
1,60 |
0,12 |
0,06 |
0,05 |
0,09 |
|
0,51 |
|
1,80 |
0,26 |
0,18 |
0,30 |
0,43 |
|
0,88 |
|
2,00 |
0,44 |
0,17 |
0,58 |
0,70 |
|
0,91 |
|
2,20 |
0,57 |
0,27 |
0,75 |
0,86 |
|
0,97 |
|
2,40 |
0,73 |
0,32 |
0,88 |
0,93 |
|
1,00 |
|
2,60 |
0,84 |
0,43 |
0,95 |
0,98 |
• |
1,00 |
242
|
|
|
|
|
Т а б л и ц а 9 8.5 |
|
|
Масштабная альтернатива Коши |
|
|
|
в |
|
M i* 1) |
2 |
Q 2 |
|
D N |
|
и N |
|
||
1,00 |
0,04 |
0,05 |
0,03 |
0,03 |
0,02 |
1,30 |
0,07 |
0,09 |
0,08 |
0,08 |
0,16 |
1,50 |
0,06 |
0,07 |
0,04 |
0,05 |
0,26 |
1,60 |
0,12 |
0,09 |
0,09 |
0,07 |
0,40 |
1,80 |
0,16 |
0,07 |
0,12 |
0,11 |
0,60 |
2,00 |
0,35 |
0,17 |
0,25 |
0,27 |
0,75 |
2,20 |
0,36 |
0,23 |
0,40 |
0,47 |
0,82 |
2,40 |
0,49 |
0,25 |
0,57 |
0,63 |
0,91 |
2,60 |
0,61 |
0,31 |
0,69 |
0,74 |
0,94 |
На основании экспериментальных данных можно сделать следующие выводы.
243
р
ко
6 ( 0 , S )
0 , 9 |
'ж |
ж |
|
S |
|
о,а
1 /
0,7 |
~7 2 |
|
0,6 |
Н л / |
|
4 |
||
|
||
|
^ 6 ( 0 , 2 5 ) |
0,5
0,4
0,3
02
О,'
0,03 О,/О О,Г5 |
0,20 |
0,23 0,30 |
<*■ |
Рис 98 2
1. Мощности рассмотренных критериев согласия для аль тернатив сдвига примера 9.7.1 возрастают при переходе к рас пределениям с более затянутыми хвостами. Этот факт под тверждает эвристические выводы § 9. 7.
2. |
Предпочтительность Т Jj -теста Мозеса |
при логиче |
ской альтернативе сдвига полностью согласуется с результа |
||
тами |
работы Белла и Доксума [1], в которой |
показана ло |
кальная оптимальность TN -теста при этой альтернативе |
||
3 Мощность |
R~N |
(6, 1)-теста Реньи существенно зависит |
от параметра 6. |
Для |
рассмотренных альтернатив сдвига она |
максимальна при 6 = 0,5
4DN -тест Смирнова предпочтительней RN (6, 1)-теста Реньи для альтернатив сдвига с быстро спадающими хвоста ми; для распределений с сильно затянутыми хвостами (рас пределение Коши) картина обратная.
5Для альтернатив сдвига с быстро спадающими хвоста
ми со^-Тест Крамера-Мизеса-Смирнова предпочтительнее
24Л