Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

uchebnik10

.pdf
Скачиваний:
35
Добавлен:
21.03.2015
Размер:
8.26 Mб
Скачать

разных уровней значимости а и соответствующих порогов дове­

рительной вероятности Р.

,При использовании критерия '1..2 для построення доверитель­

ного интервала применяют двусторонний уровень значимости,

т.

е. а=2,5% (для Рн)

и Р= 100-2,5=97,5%

(для Рв) 95%-но­

ro

интервала. Границы

95%-ного доверительного интервала

Clпределяют по формулам

 

 

 

 

(n -1)s~

; РВ=

(n -1)s~

 

Рн=

2

2

'

 

"1.~,5

 

"1.97,5

 

где S2x - выборочная дисперсия, n - объем выборки.

Пример 9. В рассмотренном примере 8 применим описанный способ к определению границ 95% -ного доверительного интер­

вала для генеральной дисперсии ряда распределения кальция

(мг%) в сыворотке

крови обезьян. Имеем n= 100;

(n-1)s2x =

=991,60= 158,40. В

табл. VII

Приложений

для

n-1 =99 и

а=2,5% находим х2 = 128,42 и для Р=97,5% -

х2 =

73,36. Отсю­

да Рн = 158,40/128,42= 1,23 и

Рв = 158,40173,36=2,16. Границы

доверительного интервала для стандартного отклонения оказы-

ваются следующими: РН=11 1,23= 1, 11; РВ=V 2,16= 1,47.

Доверительный интервал для коэффициента вариации. Гра­

ницы доверительного интервала для генерального коэффициен­ та вариации Cv определяют по следующим формулам:

Р

н

=

 

Си

.

Р

Си

 

 

 

 

 

1 +К у! 1

+ 2Си2 '

 

в

где К = ,/

 

t

-

 

 

2

;

Cv=sx/x.

 

 

 

 

r

(n-1)

 

 

 

Пример 10. Коэффициент вариацин, характеризующий варь­

ирование кальция (мг%) в сыворотке крови обезьян, оказался

равным 10,6%, илн Cv=0,106. Определим границы 95%-ного доверительного интервала для генерального параметра Cv.

Предварительно вычисляем величину К

 

1 96

0,139.

 

'

 

 

 

 

V 2 (100 -

1)

Подставляем известные значения в формулы:

 

 

0,106

 

0,106

 

1 +О,139У! +2(0,106)2

1 +0,139·0,11

 

~::~~ =0,093, или 9,3 %;

 

 

0,106

 

0,106

-

PB==~~~~~~~~~-

1-0,141

1-0,139У

1 +2(0,106)2

 

-

0,106

0,123, или 12,3 %.

 

0,859

 

 

 

 

 

 

109

Это означает, что при повторных выборках в данных усло­

виях коэффициент вариации не превысит 12,3% и не окажется

ниже 9,3 %. Довольно узкий доверительный интервал (9,3- 12,3%) указывает на то, что выборочный коэффициент вариа­

ции Cv= 10,6% достаточно точно репрезентирует генеральны~

параметр Cv.

Доверительный интервал для доли. Доля - это среДFЯЯ, ко­

торая характеризует количество единиц в выборке, имеющих учитываемый признак. Общее число таких единиц в генераль­

ной совокупности составляет генеральную долю (p=m/N).

Границы доверительного интервала для генеральной доли­ PH<.P~PB - определяют так же, как и для генеральной сред­

ней рядовой изменчивости, т. е. Ри=р-tSт и PB=p+tsт. Эти

формулы применяют тогда, когда выборочные доли р и q рав­

ны между собой или незначительно отклоняются от 50%-ной численности групп. Если же это условие не выполняется (при

75% <.p~25%), доверительные границы для генеральной доли

следует определять по формуле

р

1

r(т+~) + t2 1 /

т(n - т)

-t

!.:. J '

(71)

 

n + t2

2

-

V

n

4

 

где n -

число наблюдений;

т -

абсолютная численность одной

из групп; t - нормированное отклонение, определяемое по зна­

чению вероятности (Р).

Прuм,ер 11. В рабочем поселке с N числом жителей спосо­ бом бесповторного случайного отбора было обследовано 150 че­ ловек, из которых 20 оказались больными. Определить вероят­ ные границы генеральной доли больных в данном населенном

пункте. Выборочная доля больных р=m/n=20/150=О,13, или

13%. Исходим из Р=0,95 и соответственно t=I,96~2. Подстав­

ляя известные данные в формулу (71), находим

+.!.J=

р-

1

[(20+ .!.\)

+ 2" /

20(150-20)

- -

150 +4

2

-

V

150

4

1~4

(22 + 2V 18,3)= 1~4

(22 + 8,56)=0,143 + 0,056.

Отсюда границы доверительного интервала оказываются

следующимн: Ри=0,143-0,056=О,087, или 8,7%; Рв =0,143+

+0,056=0,199, или 19,9%.

Таким образом, с вероятностью Р=95% можно утверждать,

что генеральная доля больных находится между граНИцами от

8,7 до 19,9% от общего числа лиц N, проживающих в данном

населенном пункте.

ГЛАВА V

КРИТЕРИИ ДОСТОВЕРНОСТИ ОЦЕНОК

У.1. СТАТИСТИЧЕСКИЕ rИПОТЕЗЫ И ИХ ПРОВЕРКА

в гл. IV было показано, что выборочные характеристики

являются оценками генеральных параметров, которые, как пра­

вило, остаются неизвестными. Там же описаны точечные и ин­

'I'ервальные способы оценки неизвестных параметров по значе­

ниям выборочных характеристик 1.

Ниже будут обсуждаться сравнительные оценки генераль­

ных параметров по разности, наблюдаемой между сравнивае­

мыми выборками. Это важно, так как ни одно исследование не

обходится без сравнений.

Сравнивать

приходится данные опы-

u

u

u

та с контролем, урожаиность однои культуры с урожаиностью

другой, продуктивность одной группы животных с продуктив­

ностью другой и т. д.

О преимуществе той или иной из сравниваемых групп судят

обычно по разности между средними долями и другими выбо­ рочными показателями - величинами случайными, сопровожда­ емыми ошибками репрезентативности.

Вопрос о достоверности выборочной разности с ее ошибкой

u u

приходится решать исходя из тои или инои гипотезы, т. е. предположения или допущения относительно параметров сравнивае­ мых групп, которое выражено в терминах вероятности и может

быть проверено по выборочным характеристикам.

В области биометрии широкое применение получила так

называемая нулевая гипотеза (НО). Сущность ее сводится к

I предположению, что разница между генеральными параметра­

I ми сравниваемых групп равна нулю и что различия, наблюдае-

мые между

выборочными характеристиками, носят

не систе-

.матический,

а исключительно случайный характер.

Так, если

одна выборка извлечена из нормально распределяющейся сово­

купности с параметрами !lx и ах, а

другая -

из совокупности

с параметрами !ly и Оу, то нулевая

гипотеза

исходит

из

того,

что !lx=!lY и ах = Оу, т. е. !lx-!lу=О

и ox-ау=О (отсюда

и на­

звание гипотезы - нулевая).

 

 

 

 

Противоположная

нулевой -

альтернативная

гипотеза

(На) - исходит из предположения, что !lx-!lУ:#:О и ox-ау:#:О.

Для проверки принятой гипотезы, а следовательно, и досто­

верности оценки генеральных параметров по выборочным дан­ ным используют величины, функции распределения которых

1 В настоящем пособни термнн «оценка:. прнменяется в двояком смысле:

и как собственно оценка, выражаемая числом, н как самый процесс оценнва­

ння генеральных пара метров по выборочным показателям,

111

известны. Эти величины, называемые критерия,м,и достоверно.

сти, позволяют в каждом конкретном случае выявить, удовле·

творяют ли выборочные показатели принятой гипотезе. Функ.

ции распределения указанных величин табулированы, т. е. сведены в специальные таблицы, где содержатся значения функ·

ции для разных чисел степеней свободы k или объема выбор· ки n и уровней значимости а.

Уровень значимости, или вероятность ошибки, допускаемой

при оценке принятой гипотезы, может различаться. Обычно

при проверке статистических гипотез принимают три уровня

значимости: 5%-ный (вероятность ошибочной оценки Р=0,05),

1%-ный (Р=0,О1) и 0,1 %-ный (Р=0,001). В биологических

исследованиях часто считают достаточным 5%-ный уровень

значимости. При этом нулевую гипотезу не отвергают, если в результате исследоваиия окажется, что вероятность ошибочно­

сти оценки относительно правильности принятой гипотезы пр~

вышает 5%, т. е. Р>О,О5. Если же Р<О,О5, то принятую гипо·

тезу следует отвергнуть на взятом уровне (а). Ошибка при

этом возможна не более чем в 5% случаев, т. е. она малове­

роятна.

При более ответственных исследованиях уровень значимости может быть уменьшен до 1 или даже до 0,1 %. Трем упомяну­

тым уровням значимости (а) отвечают (при нормальности рас­

пределения используемого критерия) нормированные отклоне­

ния

(t):

при а1

(Р=0,05) нормированное отклонение t1 = 1,96;

при

а2

(Р=0,О1) -

t2=2,58; при аз

(Р=О,О01) -

tз=3,29; и

соответственно

пороги доверительной

вероятности

(1-а) рав­

ны Р1 = 0,95, Р2 = 0,99

и Рз = 0,999.

 

 

В

области биометрии применяют

два вида статистических

критериев: nара,м,етрические, построенные на основании пара­

метров данной совокупности (например, х и S2x ) И представля­

ющие функции этих параметров, и неnара,м,етрические, пред­

ставляющие собой функции, зависящие непосредственно от ва­

риант данной совокупности с их частотами. Первые служат

для проверки гипотез опараметрах совокупностеи, распределя-

емых по нормальному закону, вторые - для проверки рабочих

гипотез независимо от формы распределения совокупностей, из которых взяты сравниваемые выборки. Применение параметри­

ческих критериев связано с необходимостью вычисления выбо-

рочных характеристик -

среднеи величины и показателеи вари-

ации, тогда как при использовании непараметрических крите­

риев такая необходимость отпадает.

При нормальном распределении признака параме1'рические

критерии обладают большей мощностью, чем непараметриче­

ские критерии. Они способны более безошибочно Фтвергать

нулевую гипотезу, если она не верна. Поэтому во всех' случаях,

когда сравниваемые выборки взяты из нормально раепределя-

112

ющихся совокупностей, следует отдавать предпочтение пара­

метрическим критериям.

В случае очень больших отличий распределений признака

от нормального вида следует применять непараметрические

критерии, которые в этой ситуации оказываются часто более

мощными. В ситуациях, когда варьирующие признаки выража­

ются не числами, а условными знаками, применение непара­

метрических критериев оказывается единственно возможным.

Из параметрических критериев в биометрии применяют t-критерий Стьюдента и F-критерий Фишера. Первый исполь­

зуют для сравнительной оценки средних величин, второй - для

оценки дцсперсиЙ. Ниже рассмотрен отдельно каждый из этих

критериев.

У.l. ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ

t-критерий Стьюдента (t-распределение). Использование формулы Гаусса-Лапласа (44) для сравнительной оценки

средних величин затруднено тем, что в качестве аргументов в

эту формулу входят генеральные параметры J.t и (J (которые,

как правило, остаются неизвестными), тогда как при обработ­

ке и сравнении выборочных групп приходится пользоваться не

генеральными, а выборочными характеристиками х и SX. Учи­ тывая это обстоятельство, английский математик В. Госсет (печатавшийся под псевдонимом Стьюдент), в 1908 г. нашеJI

x-r-

закон распределения величины 1= ----''''''в которой- гене-

а/Уn

ральный параметр (J заменен на его выборочную характеристи­

ку sx, т. е. нашел закон распределения значений

1= x-r- .

(72)

s/Yn

Оказалось, что отношение разности между выборочной и

генеральной средними к ошибке выборочной средней непрерыв­

но распределяется согласно следующей формуле:

n -1

!(i)=C( 1+ t2 )--2- для -00<1<+00,

n-I

где С - константа, зависящая только от числа степеней свобо­

ды k=n-l.

Открытый Стьюдентом и теоретически обоснованный Р. Фи­

шером закон t-расnределения служит основой так называемой

теории малой выборки, которая характеризует распределение

выборочных средних в нормально распределяющейся совокуп­

ности в зависимости от объема выборки. t-распределение зави-

113

СИТ только от числа степеней свободы k=n-l, причем с YB~ личением объема выборки n t-распределение быстро приближ~­ ется к нормальному с параметрами JL=O и (1= 1 и уже Прl n~30 не отличается от него. Это видно из табл. 34, в KOTOpOI. наряду с табулированными значениями функции HopMa.'IbHOfC

распределения приведены табул~

рованные значения t-распределеНИr

для разных значений t.

Более наглядное представлени~

о характере t-распределения дае:

I

, ..... - r=

х=О ·t +2t +Jt

Рис. 20. Кривая t-распределе­

ния (1) при n=3 на фоие иор­ мальной кривой (2)

рис. 20, на котором на фоне HO~' мальной кривой изображена (боле~

пологая) кривая t-распределенИf. при n=3. t-распределение симмет­ рично и отражает специфику ра(; пределения средней арифметич~ ской в случае малой выборки в з<:

висимости от ее объема (n). Для выборок, объем которых Прf­

вышает 30 единиц, величина t распределяется нормально и Ht:

зависит от числа наблюдений. Если же n<30, характер t-pa'

пределения находится в зависимости от числа наблюдений г.

ТаБJJица

 

 

Нормированное отклонение t

 

Распределение

 

1,5

2,0

2,5

3,0

 

0.5

1.0

3.5

Нормальное

383

683

866

955

988

997

9995

Стьюдента прн

 

 

 

816

870

 

 

n=3

333

577

728

905

927

n=20

377

670

850

940

978

993

998

n=зо

383

683

866

955

988

997

9995

Прuмечанuе. Значения фуикции даны чнслами после запятой.

для практического использования t-распределения составле

на специальная таблица (см. табл. V Приложений), в ~OTOPOГ

содержатся критические тоqки (tst) (от англ. standard - но[·

ма, образец) для разных уровней значимости а и чисел стеПt-· ней свободы k. Как пользоваться этой таблицей в разных сл"

чаях применения t-критерия, будет показано ниже.

О Ц е н к а раз н о с т и с р е д н и х. Сравнивая друг с др}'­

гом две независимые выборки, взятые из нормально распреДЕ­ ляющихся совокупностей с параметрами 111 и 112, можно пред

положить, что 111-112=D, а дисперсия этой разности (12D3H~­

чения генеральных параметров неизвестны, однако несложнс

найти велиqины выборочных средних и разность между нимr

114

(Х'-Х2) =d. Нулевая гипотеза сводится к предположению, что

11' = 112.

Критерием для

проверки Но-гипотезы служит отно­

шение

 

 

 

 

 

 

 

 

t

 

(х, - X2)-(fJ., +fJ.2)

,

 

 

 

 

s-

-

 

 

 

 

 

XI - X t

 

где t -

переменная

величина, следующая t-распределению

Стьюдента с

числом

степеней

свободы

k= (n,-l) + (n2-1) =

= n, + n2-2,

а S х,-;;

-

ошибка

указанной разности, обознача­

емая в дальнейшем символом Sd.

Так как, согласно Но-гипотезе, 11'-112=0, то t-критерий вы­

ражается в виде отношения разности выборочных средних к

своей ошибке, т. е.

'= -Х, -Х-2 =~. sd Sd

Но-гипотезу отвергают, если фактически установленная ве­ личина t-критерия (обозначаемая символом tф) превзойдет или

окажется равной критическому (стандартному) значению tst

Этой величины для принятого уровня значимости а и числа сте­

пеней свободы k=n, +n2-2, т. е. при условии tф~tst.

Ошибку разности средних Sd определяют по следующим

формулам:

а) для равночисленных выборок, т. е. при n'=n2,

Sd=V S2 -t- S2 =

\'/

~(Х! - х,)2 + ~ (Х! - Х2)2

_

..1', ..1'.

V

n(n-I)

n(n-I)

 

= 1,/

~(Хl - х,)2 + ~(Хl -

Х2)2 ;

(73)

JI

 

(n - 1) n

 

 

б) для неравночисленных выборок, т. е. при n,=Fn2,

 

-у (n,-I)si+(n2-I)S~( n'+n2 ) _

 

Sd-

n, +n2-2

-

 

 

n'n2

 

= .. 1 ~(ХI-Х,)2+~(Хi-Х2)2

(n'+n 2 ) .

,(74)

V

n, +n2- 2

nln2

 

В этой формуле вместо (n, + n2 ) можно использовать (-1- +

nln2 n,

+_1).

n2

Прuм.ер 1. Изучали влияние кобальта на массу тела кроли­ ков. Опыт проводнли на двух группах животных: опытной и

контрольной. Были исследованы кролики в возрасте от полу-

115

тора до двух месяцев, массой тела 500-600 г. Опыт продо.r­

жался полтора месяца. Животных обеих групп содержали н, одном и том же кормовом рационе. Однако опытные КРОЛИКЕ

в отличие от контрольных ежедневно получали добавку к рацр­ ону в виде водного раствора по 0,06 г хлористого коба.аьта Ю: 1 кг живой массы тела. За время опыта животные дали сл~

дующие прибавки живой массы тела (табл. 35).

 

 

 

 

 

Таблица 3:-

Привесы. r

Отклоиения от среднеА

I(вадраты отклонениА

 

 

арифметической

 

 

опыт

коитроль

ОПЫТ

контроль

ОПЫТ

контроль

580

504

58

22

3364

484

692

560

54

34

2916

1 156

700

420

62

106

3844

. 11 236

621

600

17

74

289

5476

640

580

2

54

4

2916

561

530

77

4

5929

16

680

490

42

36

1764

1296

630

580

8

54

64

2916

 

470

 

56

 

3136

2:=5104 2:=4734

.%1=638 .%2=526

-

-

-

-

,

2:=18174 2:=28632 2:=46806

Средние арифметические привесов: в опыте х, =5104/8=

=638 г, в контроле Х2=4734/9=526 г. Разница 'Х'-Х21 =d=

= 112 г. Чтобы установить, достоверна или случайна эта ра:,.­

ница, нужно определить ошибку разности средних по форму­

ле (74):

,.------

Sd=V ~~076 99:88 =V736,8=27,14.

Отсюда tф= 112/27,13=4,1. По табл. V Приложений для 1%-н(, ГО уровня значимости и числа степеней свободы k=9+8-2= l;'

находим tst=2,95. Так как tф>tst. нулевая гипотеза опроверг"

ется на высоком уровне значимости (P<O,Ol). Разница межд'

средними величинами опыта и контроля оказалась в высшеi'­

степени достоверной.

Прu.мер 2. На двух группах лабораторных мышей - опыт

ной (n,=9) и контрольной (n2=11) ~ изучали воздействие ю.

организм нового препарата. После месячных испытаний масс..

116

тела животных, выраженная в граммах, варьировала следую­

щим образом:

в опЫтной группе 80, 76, 75, 64,

70, 68, 72, 79, 83

 

ХI = 74,1

В контрольной группе 70, 78, 60, 80, 62, 68, 73, 60, 71,

66, 69

Х2= 68,8

Разница между средними !ir.-x21 =5,3 г.

Для определения

ошибки этой

разности предварительно рассчитаем

девиаты:

D. = ~ (Xi -

х)2 = ~x2 -

(~x)2/n = (802 +

762 + ... + 832) -

-6672/9=302,89 н D 2= (702+782+602+ ... +692)-7572/11=

=443,64. Отсюда ошибка разностн средних выразится величиной

S2 = 302,80 +443,64 (9 + 11 )=

14930,6

838 и s =У8 38 =

d

9+11-2

9.12

1782,0'

d

,

=2,89. Критерий

tф=5,30/2,89= 1,83.

Для

k=9+ 11-2= 18 и

5%-ного уровня

значимости в

табл. V Приложений

находим

tst=2,10. Так как tф<tst, нулевая гипотеза остается в силе. Неопровержение Но-гипотезы нельзя рассматривать как до­

казательство равенства между неизвестными параметрами сово­

купностей, из которых извлечены сравниваемые выборки.

В таких случаях вопрос о преимуществе одной статистической

совокупности перед другой остается открытым. Ведь не исклю­ чено, что при повторных испытаниях Но-гипотеза может ока­

заться несостоятельноЙ. Более того, и в тех случаях, когда

Но-гипотеза опровергается, не следует спешить с окончатель­

ным выводом.

Следует заметить, что вышеизложенное применение t-крите­

рия предполагает, что дисперсии сравниваемых групп одинако­

вы: (12. = (122. Если это не так, то величину критерия находят

по формуле

t

2

2

'

VSl/nl + S2/ n 2

 

а число степеней свободы - по следующим формулам:

2n-2

а) при nl=nZ k=n - l+ ----- .

фs~ +фsi

(75)

(76)

Так, при изучении влияния кобальта на массу тела кроли-

ков (см. пример 1) дисперсии равны si

1 18174=2596,3

 

 

 

8-1

 

н s~=

1

28632=3579,0 (см. табл. 35). Видно, что S2 >S2

1

..

9 -1

.

2

 

 

 

117

Следовательно, величину критерия необходимо определять с уче­

том неравенства

дисперсий. Преднарительно найдем

s'l./n. =

= 2596,3j8= 324,54

и s22/n2= 3579,0/9=397,67. Величина

t-крите-

рия равна fф=638-526IVЗ24,54-r-397,67=4,17. Затем опре­

деляем (S2./n.)2J(n.+ 1) = 324,542j9= 11702,6 и

(s22/n2)2/(n2+1)=

=397,672/10= 15813,9. В результате k=722,22J27516,6-2= 17.

Для k= 17 и а= 1% в табл. V Приложений

находим tst=2,90.

Так как tф=4,17>fst=2,90, то Но-гипотеза отвергается.

Правильное применение t-критерия предполагает нормаль­ ное распределение совокупностей, из которых извлечены срав­ ниваемые выборки, и равенство генеральных дисперсий. Если

эти условия не выполняются, то t-критерий применять не сле­

дует. В таких случаях более эффективными будут непарамет­

рические критерии.

Оценка средней разности между выборками с

поп а р н о с в я з а н н ы м и в а р и а н т а м и. Сравниваемые

выборки нередко представляют собой ряды попарно связанных вариант, т. е. являются зависимыми выборками. В таких слу­

чаях оценкой разности между генеральными средствами 11.- -112=D будет средняя разность, определяемая из суммы раз­

ностей между попарно связанными вариантами сравниваемых

групп, т. е.

 

 

 

 

d= ~dl

 

(77)

 

 

 

 

 

n

 

 

 

Оценкой генеральной дисперсии (12 разности

средних 11.-112=

== D будет выборочная дисперсия

 

 

 

 

 

 

s2=

~(dl - (j)2

 

(78)

 

 

 

 

 

n - I

 

 

 

В формулах (77) и (78)

n -

число

парных

наблюдений;

di=

=Xj-Y/; величина i.l идентична разности средних, т. е.

 

d

~dl

=

(- - )

 

 

 

 

 

n

Xt-X2 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Ошибку

средней разности

а, обозначаемую символом

Sd,

определяют по формулам

 

 

 

 

 

.. /~(dl-d)2.

 

'"' 2

(~di)2

 

= {

~dl-

n

(79)

Sd=V n(n-I)

n(n-I)

или

 

 

 

 

Sd-- у l

(~d~ -d-2) .

 

(80)

n-I

n

 

 

118

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]