Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

uchebnik10

.pdf
Скачиваний:
35
Добавлен:
21.03.2015
Размер:
8.26 Mб
Скачать

Iисло степеней свободы устанавливают по вторичному числу

:лассов с учетом ограничений свободы вариации, которая в ,азных случаях бывает различной. Так, при оценке эмпириче­

:ких распределений, следующих нормальному закону, число

~тепеней свободы k=N-З (с учетом трех ограничений свободы

Jариации: n, х и sx). Если же оценке подлежит распределение,

~ледующее закону Пуассона, число степеней свободы уменьша­

'тся на единицу, т. е. k=N-2 (с учетом двух ограничений :вободы вариации n и Sx 2 или х). в других случаях число сте­

{еней свободы устанавливают особо (см. ниже).

Таблнца 45

Частоты

 

 

 

 

 

d'

 

q-!-

 

d'

 

 

 

d-f-f'

d'

-

f (1)

f'Q

-

эмпири,

вычисленнЫе

-s(l)

ческие f

"

 

 

J'

 

 

 

J'q

 

 

 

 

 

 

 

1

 

3

 

5

6

7

8

9

 

2

4

9

f

16:~ }1I,6

0,4

0,16

0,01

0,0594

0,9406

10,91

0,01

3

112

 

31

 

34,3

3,3

10,89

0,32

0,1736

0,8264

28,35

0,38

71

 

67,8

3,2

10,24

0,15

0,3429

0,6571

44,55

0,23

82

 

77,6

4,4

19,36

0,25

0.3918

0,6082

47,20

0,41

46

 

51,2

5,2

27,04

0,53

0,2589

0,7411

37,94

0,71

19

 

19,5

0,5

0,25

0,01

0,0989

0,9011

17,57

0,01

f }6

б:~ }5,0

1,0

1,00

0,20

0,0247

0,9753

4,88

0,20

 

 

 

~=267

~=267

-

-

1,47

-

-

-

~=

 

 

 

 

 

 

 

 

=1,95

Прu,Мечанuе. Последнне четыре графы

понадобятся в дальнейшем

(см.

IJрнмер 7 разд. VI.3).

 

 

 

 

 

 

 

На величине критерия 'Х,2 сказывается степень точности, с

~акой определены теоретически вычисленные или ожидаемые

тастоты. Поэтому при сопоставлении эмпирических частот с

iычисленными частотами последние не следует округлять до

~елых чисел 1.

Нулевая гипотеза сводится к предположению, что разлйчия,

.1аблюдаемые между эмпирическими и вычисленными или ожи­

J;аемыми частотами, носят исключительно случайный характер. l,ля проверки нулевой гипотезы нужно фактически полученную

Jеличину 'Х,ф2 сравнить с ее критическим значением 'X,2 st . Если

"е до 0,5. Прн k=2 мнннмальное значение f'составляет 2. И только прн k= 1

ilннмальное значенне f'должно быть не менее 4.

(Прu'м. ред.)

1 Технику расчета теоретнческих частот

варнационного ряда см. в

абл, зо.

 

139

"ф2~,,2st, то нулевая гипотеза должна быть отвергнута на при­

нятом уровне значнмости с числом степеней свободы k. Кри­

тические точки ,,2st приведены в табл. VII Приложений.

Пример 1. В табл. 28 приведены эмпирические и вычислен­

ные по нормальному закону частоты распределения длины те­

ла у 267 мужчин. Из приведенных данных видно, что между

эмпирическими и вычисленными частотами нет полного совпа­

дения. Нужно установить, случайны или закономерны эти раз­

личия, т. е. выяснить, следует ли это распределенне нормаль­

ному закону. Расчет ,,2-критерия, который Оказался равным

1,47, приведен в табл. 45.

В данном случае число вторичных классов N=7. Число

степеней свободы k=7-3=4. Исходя из 5%-ного уровня зна­

чимости в табл. VII Приложений находим ,,2st =9,49. Эта ве­

личина значительно превышает "ф2=1,47, что не позволяет от­

вергнуть Но-гипотезу. Следовательно, существуют достаточные

основания для утверждения, что данное распределение следует

нормальному закону.

Критерий ,,2 применяют и для оценки сходства между ва­

риационными рядами, частоты которых распределяются в гра­

ницах одних и тех же классов. В таких случаях критерий ,,2

определяют по формулам:

2

k

2')

-N;

(100)

при n1=nz х

=4 ~

11

 

( 1_1/1+/2

 

 

 

 

 

 

(101)

в этих формулах fl и f2 - частоты сравниваемых распреде.'Iе­ ний; nl=!.fl-0бъем одного (любого), а n2=Щ2 -объем .1)1\'-

гого ряда распределения; N=nl+n2. Число степеней своб(I.I'.; k определяют по числу классов N без единицы, т. е. k=N-l.

При этом частоты, меньшие 5, не объединяют, как это приня­

то в отиошении теоретически вычисленных частот.

Пример 2. Урожай фасоли, полученный иа делянках от по­ сева крупных fl и мелких f2 семян, распределился следующим

образом (табл. 46).

С помощью формулы (100) находим ,,2=4·104,78-200+200=

=419,12-400= 19,12. Эта величина не превышает критическую точку ,,2st =20,09 для k=9-1 =8 и 1%-ного уровня значимо­ сти (см. табл. VII Приложений) , что не дает оснований для непринятия нулевой гипотезы. Следовательно, наблюдаемые

между частотами этих рядов различия носят не систематиче­

ский, а случайный характер.

1 См.: Плохuн.сtшЙ Н. А. Алгоритмы биометрии. М., 1980. С. 101,

140

 

 

 

 

 

Таблица 46

семян. Mr

,.

Частоты

,.'

,.+,.

/.+/.

 

Масса

 

 

 

 

Л

 

 

"

 

 

 

125

1

1

1

2

0,50

175

5

3

25

8

3,12

225

17

7

289

24

12,04

275

45

22

2025

67

30,22

325

70

88

4900

158

31,01

375

51

69

2601

120

21,68

425

10

7

100

17

5,88

475

1

2

1

3

0,33

525

О

1

О

1

0,00

Сумма

200

200

-

-

104,78

Пример 3. Изучали основной вид очанки (Euphrasia pralcurta Chitr.) и одну из ее разновидностей (Е. curta Fr.) - расте­

ния, произрастающего в центральных областях европейской

части РСФСР. Анализ вида производили по числу растений,

зацветающих из того или иного (по счету) узла. Нужно было

u

u

выяснить, в какои

мере основнои вид очанки отличается от ее

разновидности, что имеет прямое отношение к проблеме видо­

образования, совершающегося в природе. Результаты наблюде­

ний и их обработка приведены в табл. 47.

Используя формулу (101), находим %ф2= [1772/(124Х

Х53)] (91,71-1242/177) =4,767(91,71-86,87) =23,07. Эта вели­

чина превосходит критическую точку

%2st =21,67 для k= 10-

-1=9 и 1%-ного уровня значимости

(см. табл. VII Приложе­

ний) . Следовательно, на высоком уровне значимости (Р<0,01)

u •

можно заключить, что основнои вид очанки и ее разновидность

достоверно различаются по числу растений, зацветающих из

того или иного (по счету) узла. Этот вывод, вероятно, позво­

ляет рассматривать разновидность очанки (Е. curta Fr.) как за­

рождающийся вид.

При группировке выборки в четырехпольную или много­

польную таблицы критерий %2 определяют по следующей фор­

муле:

(102)

где d - разница между эмпирическими и теоретически вычис­ ленными или ожидаемыми частотами; f'- ожидаемые частоты.

Нулевую гипотезу, или предположение от отсутствии до-

141

стоверных различий между эмпирическими и ожидаемыми ча(

тотами, проверяют с помощью табл. VII Приложеиий, в кот(:

рой приведеиы критические точки 'Х,2st для разных уровней ЗН2 чимости а и чисел степеней свободы k. Но-гипотеза отвергает ся, если 'Х,ф2~'Х,2st для принятого уровня значимости и ЧИСЛЕ степеней свободы, определяемого по числу строк и столбцOl

(без учета итогов таблицы) по следующей формуле:

k=(c-l)(r-l),

где с - число строк, г - число граф или столбцов таблицы.

Таблица 4~

Колнqество

Частоты

 

 

 

t1

,.

 

 

 

узлов

 

,.+/.

':2

 

 

на стеблях

'2

/.+/.

растеннй

 

 

 

 

 

6

1

О

1

1

1,00

7

8

О

8

64

8,00

8

23

1

24

529

22,04

9

30

11

41

900

21,95

10

38

18

56

1444

257,8

11

12

14

26

144

5,54

12

7

3

10

49

4,90

13

4

4

8

16

2,00

14

1

1

2

1

0,50

15

О

1

1

О

0,00

Сумма

124

53

177

-

91,71

 

При этом, как и при распределении выборки в вариациов

ный ряд, правильное применение критерия 'Х,2 основано на Tpt:- бовании, чтобы в клетках таблицы было не меньше пяти ожи­ даемых или теоретически вычисленных вариант 1. Кроме того, критерий 'Х,2 не следует применять. к выборкам, значения кото­

рых выражены в процентах или другими относительными чис­

лами.

Прuм.ер 4. В классических опытах Г. Менделя по многогиб­

ридным скрещиваниям разных сортов гороха, отличающихся

друг от друга по форме и окраске семян, было получено в

первом опыте

330 круглых и 101

угловатых, а во втором-

355 желтых и

123 зеленых семени.

Соответствуют ли эти дан­

ные ожидаемому по схеме Менделя расщеплению признаков

в гибридном потомстве в отношении 3: 1? Чтобы ответить на

этот вопрос, нужно рассчитать ожидаемые частоты с доминант-

1 См, примечание редактора к с, 138,

142

IЫМИ И рецессивными признаками, а затем сравнить их с по­

,ученными в опыте. Так, из общего числа 330+101=431 соб­ )анных в первом случае семян ожидали (3/4)431 =324,25 круг­

IЫХ и (1/4)431 = 107,75 угловатых. Во втором случае из 355+

J..123=478 семян ожидали (3/4)478=358,50 желтых и

1/4)478= 119,50 зеленых семян. Сопоставляем эти величины с

:оответствующими данными опыта (табл. 48).

 

 

 

 

 

 

Таблица 48

 

Форма семян

 

Окраска семян

 

Показателн

 

 

Всего

 

 

Всего

 

углова·

семян

 

 

семян

 

круглая

желтая

зеленая

 

тая

 

 

 

 

 

 

 

 

f

330

101

431

355

123

478

"

323,25

107,75

431

358,5

119,5

478

 

 

-

 

 

-

d

6,75

6,75

3,5

3,5

d 2

45,56

45,56

-

12,25

12,25

-

d21f'

0,14

0,42

0,56

0,034

0,103

0,137

Критерий ХI2 =0,56 и Х22 =0,14. Эти

величины не превыша­

:>т критическую точку

X2 st=3,84 для

k=(2-1)(2-1)=1 и

i%-НОfО уровия значимости, что не дает оснований для отвер­

'ания нулевой гипотезы. Следовательно, данные опыта не про­ "иворечат ожидаемому по схеме Менделя соотношению доми­ laHTHblx признаков и рецессивных 3: 1.

 

 

 

 

 

Таблица 49

Показателн

Желтые

Желтые

Зеленые

Зеленые

Всего

морщнни,

морщини·

глаДКне

гладкие

семян

 

стые

стые

 

 

 

 

{,

315

108

101

32

556

 

313

104

104

35

556

d

2

4

3

3

-

d 2

4

16

9

9

-

d2/f'

0.01

0,15

ОМ

0,26

0,51

прu,м,ер 5. В другом опыте Менделя в потомстве F 2 от посе­

за гибридных семян произошло расщепление на 315 желтых 'ладких, 108 желтых морщинистых, 101 зеленых гладких и 32

;еленых морщинистых семени. Необходимо выяснить, соответ­

'твуют ли эти данные ожидаемому по схеме Менделя расщеп­ iению признаков в соотношении 9:3:3: 1.

143

Как и в предыдущем СЛJ'чае, находим ожидаемые частотс:

{9/16)556=313; (3/16)556= 104 и (1/16)556=35. Сравниваеь.

полученные в опыте и рассчитанные по схеме ~енделя часто ты (табл. 49). В данном случае хф2=О,51. Для k= (4-1) (2-

-1) =3 и 5%-ного уровня значимости в табл. VII ПриложенИI'_ находим х2 51=7,82. Так как Хф2<х251, нет оснований возражаТL

против нулевой гипотезы. Это означает, что данные опыта до

стоверно согласуются с ожидаемым соотношением 9:3:3: 1.

Втех случаях, когда результаты наблюдений ГРУППИРУЮТСf_

вчетырехпольную таблицу по схеме опыт - контроль, крит<­

рий х2 определяют по следующей формуле:

 

n (1 ad _ Ье1_ ; )2

2

= (а+ Ь)(с + d)(a + е)(Ь+d) ,

х.

 

(103

где а, Ь, с и d - численности групп, помещенные в клетках ч~

тырехпольной таблицы, а n=a+b+c+d - общее число НЗ('

людений.

 

 

 

ТаБJlица 5r

 

ЧИСJlО семии в корзиике

 

ОПЫJlение

 

 

Всето семяи

 

заПОJlиенных

пустых

 

Естественное

а=113

Ь=42

а+Ь=155

(контроль)

 

 

 

Добавочное

 

d=11

c+d== 142

(опыт)

е=131

В сег о

а + с=244

Ь + d=53

n=297

Прuм.ер 6. Испытывали влияние добавочного опыления н.. урожай подсолнечника. Полученные результаты приведены F

табл. 50.

Из табл. 50 видно, что добавочное опыление дает прибавк'­ урожая этой культуры. Применим критерий х2 к оценке Пl'

лученных результатов:

2 = 297 (1113·11 - 42.1311

- 297/2)2

= 1763.

х.ф

244.53.155.142

 

'

Эта величина превосходит критическую, точку X2 st=10,83 ДЛf k= 1 и 0,1 %-ного уровня значимости, что позволяет oTBepfHYTr нулевую гипотезу на высоком уровне значимости (Р<О,ООI, Разницу между контролем и опытом следует признать CTaTr

стически достоверной.

144

Из приведенного примера видно, что применение формулы

(103) осложняет вычислительную работу, особенно при нали­

чии многозначных чисел. Это неудобство можно обойти исполь­

зуя следующую формулу:

2_~ (d-O,5)2

 

(104)

"

f'

Х - ..

 

b~l

 

 

 

где d= (fi-f/) - разность между наблюдаемыми f

и ожидае­

мыми или вычисленными f' численностями групп, которые рас­

считывают по формуле

f'

(105)

 

N

Здесь nс - итоги частот по строке, а nг - итоги частот по гра­

фам или столбцам четырехпольной или многопольной таблицы;

N =nс+nг - общее число наблюдений.

Применим формулы (104) и (105) к только что рассмот­

ренному примеру. Расчет величины критерия '1.2

показан

в

табл. 51.

 

 

 

 

 

 

 

 

 

 

 

Таблица 51

Частоты

 

 

 

<d-O.5)·

 

 

 

f-f'-d

d-O.5

(d-o,5)1

 

набllюдае-

ВЫЧНСllен·

l'

 

мые f

ные r

 

 

 

 

113

127,3

14,3

13,8

190,44

1,5

 

131

116,7

14,3

13,8

190,44

1,6

 

42

27,7

14,3

13,8

190,44

6,9

 

11

25,3

14,3

13,8

190,44

7,5

 

~=297

~.... 297

-

-

-

~=17,5

Приведенные во второй графе вычисленные частоты (f')

получены

следующим

образом:

fl'= (244·155)/297= 127,3 (см.

табл. 51);

f2'= (244·142)/297= 116,7;

fз'= (53·155)/297=27,7

и f/= (53·142)/297=25,3. Остальные

действия

понятны

из

табл. 51. Суммируя последний столбец этой таблицы, находим

Хф2= 17,5.

VI.3. криrЕРИА SlCТPEMCKoro I

Задавшись целью исследовать критерий согласия '1.2 Пирео­ на на его практическую годность, проф. Б. С. Ястремский на­

шел, что закон распределения '1.2 не дает базы для суждения о

степени близости между теоретически вычисленными и эмпи-

145

рически наблюденными частотами. Критерий '1} указывает не

на степень сходства между эмпирическими и вычисленными

частотами, а лишь на вероятностную оценку расхождения меж­

ду ними. Имея в виду эту особенность х2-критерия, Ястремский

( 1948) построил другой критерий согласия, который в общем

виде записывается так:

 

 

J

IC-NI

(106)

 

 

Jf2N +46

 

 

 

где с=~ (f - 1')2 ;

N - число групп

или классов вариацион-

""-

f' q

IC-N I берут без

учета знака); е - вели­

ного ряда

(разность

чина, зависящая от числа групп N; при N~20e не превосхо­

дит 0,6. Так как число классов или групп обычно не превы­ шает 20, то величину 4 е можно считать равной 2,4; q= l-р,

где p=f(t), т. е. функция нормированного отклонения, а f и f'- соответственно эмпирические и вычисленные частоты ряда.

Величина J имеет непрерывную функцию распределеиия и

подчинена нормальному закону. Следовательно, с вероятностью Р=99,5% можно утверждать, что различия, наблюдаемые между эмпирическими f и вычисленными " частотами носят случайный характер, если J~3,0.

Лрu,М,ер 7. Применим критерий согласия Ястремского к

оценке ряда распределения длины тела у 267 мужчин. Необ­

ходимые данные содержатся в табл. 45. В последних четырех

столбцах этой таблицы показан расчет величины С, входящей в состав формулы Ястремского, которая оказалась равной 1,95. Эта величина рассчитана следующим образом. В табл. 45 при­ ведены значения функции f(t), соответствующие нормирован­

ным отклонениям членов ряда t= (Xi-X)/Sx (см. табл. 28). Так как частоты классов объединены, то и значения f(t) тоже

объединяются. Так, первая варианта Х\ отклоняется от средней на t=-2,77. Этой величине отвечает ,и) =0,0086 (см. табл. 11

Приложений). Соседняя варианта Х2 отклоняется от средней

на t=-2,03. Этой величине соответствует ,и) =0,0508, поэтому

f(t) =0,0086+0,0508=0,0594. Эта величина и записана в 6-м

столбце табл. 45. Остальные действия понятны из той же таб­

лицы.

Число вторичных классов равно 7. Подставляя известные

величины в формулу (106), находим J= (1,95-7)/V2. 7+2,4=

=5,05/4,05=1,25. Эта величина не превышает даже 5%-ного

уровня значимости, которому отвечает t= 1,96, что не дает ос­

нований для отвергания Но-гипотезы. Следовательно, можно

утверждать, что вычисленные по нормальному закону частоты

хорошо согласуются с частотами данного эмпирического ряда.

При использовании !-критерия частоты классов ряда, мень-

146

аие пяти, можно не объединять. Принято также вычислять

-критерий упрощенным и приближенным способом, придавая Jеличине с, входящей в состав формулы (106), следующее зна·

,ение:

С= !

(f -f'd')2

.

Такого рода преобразования сокра·

цают

затраты

времени

и

объем вычислительной работы при

mределении величины J-критерия Ястремского.

ПРU'м'ер 8. В табл. 27 содержатся эмпирические и вычислен­ lые частоты распределения 517 случаев поражения клеток аль­

оа-частицами.

Проверим, отвечает ли это распределение зако­

(у Пуассона.

Расчет

вспомогательных

величин

приведен

в

"'абл. 52

(вычисление частот см. в табл.

26).

 

 

 

 

 

 

 

 

Таблица

52

I(оличество

 

Частоты

 

 

 

 

 

 

 

 

 

d'

 

поражени!!

 

 

 

Разиица

 

 

m

 

мые f

иые f'

"'"

----

 

 

d=f-f'

 

 

КЛеТОК

иаблюдае-

вычислеи-

 

/'

 

а-частицами

 

 

 

 

О

 

112

115,34

"3,34

11,1556

0,10

 

1

 

168

173,04

5,04

25,4016

0,15

 

2

 

130

129.77

0,23

0.0529

0,00

 

3

 

68

64,88

3,12

9,7344

0,15

 

4

 

32

24,35

7,65

58,5225

2,40

 

5

 

5

7,29

2,29

5,2441

0,72

 

6

 

1

1,81

0,81

0,6561

0,36

 

7

 

1

0,41

0,59

0,3481

0,85

 

Сумма

 

517

516,90

-

-

4.73

 

в данном случае число классов равно 8, а С=4,73. Под·

'тавляя эти величины в формулу (106), находим

J= 14,73-81 =

3,27

= 3,27

=0 76.

У2·8· '~.'

J/ 18,4

4,29

'

"ак как J<3, расхождения между эмпирическими и вычислен­

IЫМИ по формуле Пуассона частотами данного ряда можно :читать случайными.

Прu.мер 9. Применим критерий согласия Ястремскс:о к оцен­

~e расхождения между эмпирическими и вычисленными по

Dормуле Шарлье (50) частотами распределения 200 хвоинок :осны обыкновенной. Необходимые данные содержатся в табл. ~3,34. Расчет величины С приведен в табл. 53.

В данном случае с= 15,04, число классов равно 13. Отсюда

J =.115,04 - 131 _

2,04

2.04

=047.

УI8+2,4

У20,4

4.32

'

147

Таблица 53

Класс

х, мм

Частоты

~

d"

 

d-f-f' d2

f

l'

"

 

125

2

0,6

1,4

1,96

3,27

175

2

2,4

0,4

0,16

0,07

225

4

3,9

0,1

O,QI

0,00

275

5

7,6

2,6

6,76

0,89

325

7

13,3

6,3

39,69

2,98

375

25

22,1

2,9

8,41

0,38

425

39

32,8

6,2

38,44

1,17

475

46

39,6

6,4

40,96

1,03

525

31

37,4

6,4

40,96

1,1 О

575

23

25,4

2.4

6,76

0,23

625

13

12,0

1,0

1,00

0,08

675

2

3,5

1,5

2,25

0,64

725

1

0,2

0,8

0,64

3,20

Сумма

200

200,8

-

-

15,04

Так как J<3, можно считать, что формула (50) выбрана пра­

вильно и что между эмпирическими и вычисленными по этой

формуле частотами существует полное согласие.

VI.4. ПРИЧИНЫ АСИММЕТРИИ ЭМПИРИЧЕСКИХ

РАСПРЕДЕЛЕНИЙ

А. Кетле и Ф. Гальтои считали, что биологические признаки

распределяются нормально. Вскоре, однако, К. Пирсон пока­

зал, что существует не один, а несколько типов распределений.

Возникла необходимость выяснить причины различных откло­ нений От нормальной кривой. Решение этого вопроса имеет

свою историю, останавливаться на которой не входит в задачу

данного пособия.

В настоящее время можно указать иа следующие причины

возникиовения асимметричных распределеииЙ. Одна из них­

чисто .механическая, связаиная с «неправильной» группировкой

выборочиых данных в вариационный ряд. Впервые на это ука­

зал В. Иогансен. Отобрав 1522 фасолины и измерив каждую в сантиграммах (сг), он распределил их в вариационный ряд:

ХЦ

8,75-9,75-10,75-11,75-12,75-13,75-14,75-15,75-16,75-

f

2

43

314

809

316

30

6

2

Характеристики этого симметричного ряда следующие: х=

= 12,25 сг; s:.:=0,82; As=0,17-1-0,063.

148

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]