Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

uchebnik10

.pdf
Скачиваний:
35
Добавлен:
21.03.2015
Размер:
8.26 Mб
Скачать

шем находилось десять мальчиков (n=10). Результаты наблю­ iений приведены в табл. 112.

Вэтой таблице наличие признака обозначено положительным,

,отсутствие - отрицательным знаком. Общее число совпадений юложительных знаков Р (ХУ) =4/10=0,4; частости для каждого

Iризнака в отдельности Р (Х) =6/10=0,6 и Р (У) =5/10=0,5; раз­

'юсти: 1-0,6=0,4 и 1-0,5=0,5. Подставляем известные значе­

шя в формулу (170):

 

-

 

0,4 - 0,6.0,5

-

0,10

 

0,100

 

~ 0,41.

Rху-

 

-

 

 

 

 

---'-- =0,408

 

 

JfO,6·0,5.0,4.0,5

уо,Об

 

0,245

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 112

 

 

 

 

 

Номера исследуемЫх

 

 

 

 

При-

 

 

 

 

I 5

 

 

 

 

 

 

Число

зиаки

1

2

3

4

 

6

7

8

9

10

+

 

 

 

 

 

 

 

 

Х

-

+

+

-

-

+

-

+

+ +

У

 

-

+

-

-

-

+

+

+

+

-

6

5

Прuмер 16. Выясняли зависимость между упрямством детей --: и строгостью требований родителей У. Под наблюдением на­

:одилось 15 учащихся и их родителей из разных семей. Резуль­

~aTЫ наблюдений приведены в табл. 113.

 

 

 

 

 

 

Таблица t 13

 

 

 

Номера испытуемых

 

 

При-

 

 

 

 

 

 

Число

знаки

2 3

4 5 6

7

8

9 10 11 12

14 15

+

1

 

Х +

-

-

+

+

-

-

-

+

-

у

+

-

-

-

+

-

-

-

+

-

 

 

 

 

 

 

 

 

 

 

+

+

+

-

-

+

-

+

+

-

7

6

3 данном

случае Р(ХУ) =5/15=0,33;

Р(Х) =7/15=0,47 и

'(У) =6/15=0,40. Отсюда

 

 

Яху

0,33 -0,47,0,40

0,142

0,142,=0,580.

~Jf~О=:,4=;;:7.=;<0=,4:=:::=0'=;;'0:=,5;:;;3~.0::=,";;:;60; =

-Jf:'::О=,0=-6

0,245

Если сравнивать первый результат со вторым, то можно ска·

:ать, что в первом случае сопряженность между признаками tесколько слабее, чем во втором.

Бисериальиый коэффициенl' корреляции. Для измерения тес­

юты связи между качественными признаками с двумя вариан-

249

тами и количественными признаками используют бисериалы."ы,,:

коэффициент корреляции

 

 

'

 

 

Г -

--Х=I----.Х:;2. V Щn2

 

(171

 

bs -

SX

N(N-I) ,

 

где Хl и Х2 -

средние арифметические

из

отдельных

значеНИl

альтернативных групп с их объемами n!

и nz; М= (nl+n2) -

общее число

наблюдений, или

объем

выборки; Sx -

cpeДHe~

квадратическое отклонение для всей выборки.

Бисериальный коэффициент корреляции изменяется от -

до + 1; при

ХI =Х2

он равен нулю. Знак для этого показателr

не имеет, однако, смыслового значения.

 

 

 

 

 

 

 

Таблица 11,_

 

Пол

подростков

 

 

 

Показания

 

 

 

'/%1

x

зстезиом етра

 

 

'1

 

 

'I/o

Х. мм

мужской

Жеиский

 

 

1,5

1

5

6

9,0

13,50

1,6

-

2

2

3,2

5,12

17,

-

2

2

3,4

5,78

1,8

1

1

2

3,6

6,48

1,9

1

1

2

3,8

7,22

2,0

2

2

4

8,0

16,00

2,1

-

1

1

2,1

4,41

2,2

1

-

1

2.2

4,84

2,3

2

-

2

4,6

10,58

2,4

3

-

3

7,2

17,28

2,5

2

1

3

7,5

18,75

Сумма

nl=13

n2=15

N=28

54,6

109,96

Значимость выборочного fbs

оценивают по величине t-крите­

рия Стьюдента с числом степеней свободы k = М-2 и ПРИНh

маемым уровнем значимости.

Пример 17. Изучали зависимость между полом ПОДРОСТКОf

16-17-летнего возраста и их тактильной чувствительностьк.

Единицей признака служило расстояние между ножками эс

тезиометра, при котором ощущение двух прикосновений к ко..

цу среднего пальца левой руки носпринималось как одно ПрЕ

косновение, т. е. сливалось. Результаты опыта и расчет вспu­

могательных величин приведены в табл. 114.

Вычислим коэффициент корреляции между этими ПРИЗН2-

ками; начнем с определения средних арифметических для жеь

Ской (ж) и мужской (м) групп: ХЖ= (1/15) (5·1,5+2·1,6+2)

Хl,7+ 1·1,8+ 1·1,9+2· 2,0+ 1· 2,1 + 1· 2,5) = 26,4/15 = 1,76

мм

хм=(1/13) (1,5+1,8+1,9+2·2,0+2,2+2·2,3+3·2,4 + 2.2,5)

-

250

=28,2/13=2,17 мм. Затем определяем среднее квадратическое

отклонение:

82=

1

[~fX~- (~fIXI)2]=_1_[10996_

- (54,6)2 J=

Х

N _

1

...о;;;..

I 1

N

27

'

 

3,49 =0,1292

и

8х=0,36.

 

 

 

 

 

28

27

 

 

 

 

 

 

 

 

 

Подставляем найденные величины в формулу (171):

 

 

T

2,17-1,761/

13·15

 

О,41.0,5З8

0,208=0578.

 

 

bS

0,36

~

28·27

 

0,36

0,36

'

 

 

 

 

 

 

 

Критерий достоверности t

0,578 У(28 -2)

2,947

=361. Э

та

 

 

 

 

 

 

 

 

 

 

 

0,816

'

 

VIII.Э. МНОЖЕСТВЕННАЯ И ЧАСТНАЯ КОРРЕЛЯЦИЯ

Множественная корреляция. Наряду с анализом двумерных

совокупностей в биологии широкое применение находит стати­

стический анализ многомерных корреляционных связей. Про­

стейшим случаем множественной корреляции является зависи­

мость между тремя признаками: Х, У и Z. Тесноту связи одно­

го ИЗ них (Х) с двумя другими признаками (У и Z) измеряют

с помощью коэффициента множественной корреляции:

 

, I

r;y + г;г- 2ГхуГхгГУг

(172)

 

Гх(уг) = V

2

'

 

 

l - ryz

 

 

где

Гху, fxz и fyz - коэффициенты линейной

корреляции между

парами признаков Х и У,

Х и Z, У и Z.

 

 

Коэффициент множественной корреляции принимает значе­

ния

от нуля до единицы

(O~г~ 1). Значимость этого совокуп­

ного показателя корреляции оценивают по величине t-критерия

Сгьюдента с числом степеней свободы k=n-3 и принятым

уровнем значимости.

Пример 18. Из снопа озимой ржи случайным способом было

отобрано 10 KO,1JOCьeB. Затем измерили длину каждого колоса

Х, подсчитали число колосков У и количеС'l'ВО зерен Z в каж­

дом колосе. Собранные данные и их первичная обработка при­

ведены в табл. 115.

Чтобы определить коэффициент множественной корреляции

между этими признаками, необходимо сначала рассчитать пар-

251

иые коэффициеиты корреляции. Используя иТОги табл. 115, Не

ходим суммы квадратов отклоиений вариаит от их средни:~

арифметических, т. е. девиаты:

 

~(XI-X)2=~ X7-(~ x l )2/n =34 4695752/10=

 

 

=34 469 -

33062,5= 1406,5;

 

 

!.(YI-y)2= ~ У;-

(~YI)2/n=28911652/10=28912722,5= 168,5

~ (ZI-Z)2= ~ Z7-(~zi)2/n=9456 - 2942/10=94568643,6=

 

 

 

 

=812,4.

 

 

 

 

 

 

 

 

 

 

 

 

Таблица 11;

х

у

z

ха

уа

ZI

ХУ

YZ

XZ

 

 

 

 

 

 

 

 

.

 

 

 

 

 

 

 

70

18

36

4900

324

1296

1260

648

2520

60

17

29

3600

289

841

1020

493

1740

70

22

40

4900

484

1600

1540

880

2800

46

10

12

2116

100

144

460

120

552

58

16

31

3364

256

961

928

496

1798

69

18

32

4761

324

1024

1242

576

2208

32

9

13

1024

81

169

288

117

416

62

18

35

3844

324

1225

1116

630

2170

46

15

30

2116

225

900

690

450

1380

62

22

36

3844

484

1296

1364

792

2232

575

165

294

34469

2891

9456

9908

5202

17816

Отсюда SX= УI406,5/1О= 11,86; Sy= YI68,5jl0=4, 10; sz=

= У812,4/10. Затем рассчитываем величииы сопряжеииой Bi'

риации:

~(YI-Y)(XI-X)=~YX-~Y ~xln=

.=9908575.165/10=420,5;

~{УI-У)(ZI-Z)=~Уz-~у ~zln=

=5202-165·294/10=351,0;

~ (x1-X)(ZI- z)=~xz- ~X ~z!n:=

.'

= 17816575·294/10=911,0.

252

Наконец, определяем парные коэффициенты корреляции:

ГХУ =

~(УI-У)(ХI-Х)

420,5

-

420,5

0,865;

 

nSxSy

10.11,86·4,10

 

486,3

 

 

~ (У/ - у) (Z/ - z)

351,0

 

351,0

 

ryz=-=~~~~~~-

10.4,10·9,01

 

--'-- = 0,950;

 

nsysZ

 

36!,4

 

r xz =

~(XI-X)(ZI-Z)

911

 

911,0

=0 853.

.

10·11,86·9,01

 

1068,6

'

 

nsxsz .

 

Подставляем известные величины в формулу (172):

г_" I O,8652+0,853~-2·0,865·0,853·0,950 ' _

x{yz)-v

 

1-(0,950)2

 

-

 

 

=_1/ O,0739=VO 758=0 871.

 

 

V

0,0975

'

,

 

 

 

 

О

871 УI0 - 3

=

2 304

2,304

=

Критерии достоверности t

ф

'

_

~ О, 241

= -

 

v

1 - ,871 )2

 

0,491

 

=4,69; tst =3,50 для k= 10-3=7 и а= 1% (см. табл. V Приложе­

ний) . Нулевая гипотеза отвергается на 1%-ном уровне значи­ мости (0,001 <Р<О,ОI).

Частная корреляция. Если известна связь между признаками Х, у и Z, можно определить частные или nарциальные коэффи­

циенты корреляции, показывающие корреляционную зависи­

мость между двумя варьирующими признакам и при постоянной

величине третьего признака. Для определения частного коэффи­

циента корреляции между признаками Х и У при постоянной

величине признака Z применяют формулу

гXy{z)

v(1

ГХу-ГхzГуz

(173)

-r;z)(I-r~z)

 

 

Заключение знака Z в скобки обозначает, что влияние призна­ ка Z на корреляцию между Х и У исключено.

Соответственно формула для определения частного коэффи­

циента корреляции между признаками Х и Z при исключении

влияния на эту связь признака У будет выглядеть так:

Гху{у) =

 

гхг -

гx'lJryZ

( 174)

r

2

2'

.

у (I-ГХу)(I-Гуz)

 

И наконец, частный коэффициент корреляции между признака­

ми у и Z при постоянной ве,тшчине признака Х опреде.'1яется

по формуле

(175)

253

Рассчитаем частные коэффициенты корреляции для выборки

из примера

18:

 

 

 

 

 

 

f),8б5 -

0,853·0,950

0,055

0,055

0,335;

 

Гху(г)= (1 -0,8532) (1-0,9502) =

УО,027

0,164

 

 

 

 

0,853 -

0,865· 0,950

0,032

0,031

=0200'

гхг(у)= (1 _ 0,8652)( 1 _ 0,9502)

УО,О24

0,155

'

,

Гуг(х)=

0,950 -

О ,865· О ,853

0,212

0,212 =0 809.

JI (1- 0,8652)(1 - 0,8532)

уо ,0686

0,262

'

 

Наиболее высоким оказался коэффициент корреляции между

числом колосков У и количеством зерен в колосьях Z при ис­ ключенном влиянии на эту связь признака Х, т. е. длины ко­

лосьев.

Крнтерий достоверности tф=0,809 ... /

10 -

2

=0,809 Х

V

1 - О

8092

- ,

Х V 23,15=0,809·4,81 =3,89. Эта величина прево~ходит крити~е--J

скую точку tst=3,36 для k= 10-2=8 н

0.= 1%

(см. табл. V

Приложений). Нулевая гипотеза отвергается на 1%-ном уров­ не значимости (Р<0,01).

Рассмотренные коэффициенты множественной и частной кор­

релящш применяют лишь для измерения линейных связей. Ана-

u u u

лиз множественных нелинеиных связеи описан в специальнои литературе.

ГЛАВА 'х

РЕГРЕССИОННЫЙ АНАЛИЗ

Попятие регрессии. Зависимость между переменными вели­

чинами Х и У может быть описана разными способами. В част­

ности, любую форму связи можно выразить уравиеиием обще­

го вида y=f(x), где у рассматривают в качестве зависимой

переменной, или функции от другой - независимой переменной

величины х, вазываемой аргументом. Соответствие между ар­

гументом и функцией может быть задано таблицей, формулой,

графиком и т. д. Изменение функции в зависимостн от измене­

ний одного или нескольких аргументов иазывается регрессией t,

1 Термин "регрессня» (от лат. regresslo - двнженне назад) ввел в бноло­

гню Ф. Гальтон, нзучавший наследованне колнчественных прнзнаков. Он об­

наружнл, что потомство высокорослых н низкорослых родителей возвращается

(регресснрует) на 1/з в сторону среднего уровня этого прнзнака в данной по­

пуляцнн. С развнтнем бнометрнн этот термин утратнл свое буквальное зиа­

ченне и стал прнменяться для обозиачення н корреляцнонной завнснмости

между переменнымн величннами У и Х.

254

Весь арсенал средств, применяемых для описания корреляцион­

ных связей, составляет содержание регрессионного анализа.

Как было показано в гл. VIII, отличие статистической связи

от функциональной заключается в том, что в последнем случае между аргументом и функцией существует однозначное соот­

ветствие, т. е. каждому определенному значению аргумента Х

соответствует определенное значение функции У=НХ). При

статистической связи разным значениям одной переменной со­ ответствуют различные распределения другой переменной, в

которых могут быть найдены частные средние ух. Поэтому

форма статистической связи может быть описана не как за­

висимость отдельных значений У от величин х, а как зависи­ мость частных средних ух от значений х.

Для выражения регрессии служат корреляционные уравне­

ния, или уравнения регрессии, эмпирические и теоретически вы­

численные ряды регрессии, их графики, называемые линиями

регрессии, а также коэффициенты линейной и нелинейной рег­

рессии.

Показатели регрессии выражают корреляционную связь дву­

сторонне, учитывая изменение усредненных значений ух призна­

ка У при изменении значений Xi признака Х, и, наоборот, по­

казывают изменение средних значений Ху признака Х по изме­

ненным, значениям Yi признака У. Исключение составляют вре-

менные ряды, или ряды динамики, показывающие изменение

признаков во времени. Регрессия таких рядов является одно­

сторонней.

Различных форм и видов корреляционных связей много. За­

дача сводится к тому, чтобы в каждом конкретном случае выя­

вить форму связи и выразить ее соответствующим корреляци­

онным уравнением, что позволяет предвидеть возможные из­

менения одного признака У на основании известных изменений

другого Х, связанного с первым корреляционно.

'Х.1. nИНЕЯНАЯ РЕrРЕССИЯ

Уравнение регрессии. Результаты наблюдений, проведенных

над тем или иным биологическнм объектом по корреляционно

связанным признакам У и Х, можно изобразить точками на плоскости, построив систему прямоугольных координат. В ре­

зультате получается некая диаграмма рассеяния, позволяющая

судить о форме и тесноте связи между варьирующимн призна­

ками. довольно часто эта связь выглядит в виде прямой или

может быть аппроксимирована прямой линией.

Линейная зависимость между переменными У и Х описыва­

ется уравнением общего вида ух=а + ЬХl + СХ2 + dхз + ..., где

а, Ь, С, d, ... - параметры уравнения, определяющие соотноше­

ния между аргументами Х!, Х2, Хз, ... , Хm И функций ух. В прак-

255

тике учитывают не все возможные а лишь некоторые аргумен­

ты, в простейшем случае - всего один:

(176)

в этом уравнении линейной регрессии а - свободный член,

апараметр Ь определяет наклон линии регрессии по отноше­

нию к осям прямоугольных координат. В аналитической гео­ метрии этот параметр называют угловым коэффициентом, в биометрии - коэффициентом регрессии. Наглядное представ-

ление об этом параметре и о

у

u

 

положении линии

регрессии

В

У по Х и Х по У

в системе

 

прямоугольных

координат

у ----

h-':......--~=O,.ctl} Ь

о

А

х

Рнс. 26. Лнннн регресснн У по Х н Х по

у в системе прямоугольных координат

дает рис. 26 .

Линии регрессии, как по-

казано на рис. 26, пересека­ ются в точке О (х, у), соот­

ветствующей средним ариф­

метическим значениям кор­

реляционно связанных друг

с другом признаков У и Х.

При построении графиков

регрессии по оси абсцисс от-

кладывают значения незави­

симой переменной Х, а по

оси ординат - значения за­

висимой переменной, или функции У. Линия АВ, проходящая че­

рез точку О (х, у) соответствует полной (функциональной) за­

висимости между переменными ве.'Iичинами У и Х, когда коэф­

фициент корреляции гху= 1. Чем сильнее связь между У и Х, тем

ближе линии регрессии к АВ, и, наоборот, чем слабее связь меж­

ду этими величинами, тем более удаленными оказываются ли­

нии регрессии от АВ. При отсутствии связи между признаками линии регрессии оказываются под прямым углом (900) по отно­

шению друг к другу и Гху=О.

Поскольку показатели регрессии выражают корреляционную

связь двусторонне, уравнение регрессии (176) следует записы­

вать так:

(177)

ПО первой формуле определяют усредненные значеиия ух при

изменении признака Х на единицу меры, по второй - усреднен­

ные значения ух при изменении иа единицу меры признака У.

Коэффициент регрессии. Коэффициент регрессии показыва­

ет, насколько в среднем величина одного признака у изменя­ ется при изменении на единицу меры другого, корреляционно

256

связанного с Упризнака Х. Этот показатель определяют по

формуле

Ьух=Гху - Sy

или Ьху=Гху Sx

( 178)

Sx

SjJ

 

Здесь значения 5 домножают на размеры

лов Л, если их находили по вариационным

ционным таблицам.

классовых интерва­

рядам или корреля-

Прuмер 1. В гл. VIII было показано, что корреляция меж­

ду годовым удоем У и массой тела Х коров горбатовской по­

роды характеризуется величиной 'ху=0,523. Установлено так­

же, что между этими признаками имеет место линейная связь.

I1мея в виду значения средних квадратических отклонений (5х=2,843 и 5у=3,272) и величины классовых интервалов (Лх= = 152 и Лу= 14), определим коэффициент регрессии годового

уровня по массе тела коров:

Ь

=0523 3,272·14 =

23,958

0,0554.

ух

, 2,843.152

432,136

 

Аналогичным способом находим коэффициент регрессии мас­

сы тела коров по их годовому удою:

Ь

=0523 2,843·152 =

226,007

4,934.

ху

, 3,272.14

45,808

 

Увеличение годового удоя коров этой группы на 1 кг связа­ но (при прочих равных условиях) с повышением их живой мас­

сы тела в среднем на 0,055 кг, тогда как увеличение массы те­

ла коров на 1 кг в тех же условиях сопряжено с повышением

годового удоя в среднем на 4,934 кг. Если же судить о соотно­

шении живой массы тела коров и их годового удоя по средним

арифметическим для стада, которые равны по удою х=

=2235,6 кг, а по массе тела коров у=349,6 кг, то получаются

следующие результаты: на 1 кг массы тела коров приходится

в среднем 2235,6/349,6=6,395 кг молока, а прибавка годового

удоя на 1 кг связана с увеличением массы тела коров в сред­

нем на 349,6/2235,6=0,156 кг.

При сравнении этих величин с коэффициентами регрессии

видно, что они оказываются более высокими, чем Ьух и Ьху

Причина заключается в том, что отношения средних х и g не

учитывают корреляцию между признаками, поэтому и не могут

служить точными показателями изменчивости одного признака

при изменении на единицу -меры другого. Этот пример показы­

вает, какое значение имеет коэффициент линейной регрессии в области анализа статистических связей.

Коэффициент регрессии можно вычислить минуя расчет

средних квадратических отклонений 5у и 5х по формуле

Ьух=Гху

~(YI-y)2

или

Ь

ху=Гху

V~(XI-X)2

(179)

V~

(

)2

 

(

-)2'

 

 

XI-X

 

 

 

~

YI-Y

 

9-1674

 

 

 

 

 

 

 

 

257

Если же коэффициент корреляции неизвестен, коэффициент рег­ рессии определяют следующим образом:

-

~(Y{-Y)(X{-X)

ь

_

~(y{-y)(X{-X)

(180)

Ьух-

~

(

 

-)2

или

ху-

~

(

-)2

 

 

Х{-Х

 

 

 

У{-У

 

Связь между

коэффициентами

регрессии И

корреляции.

Сравнивая формулы (180) и (144), видим: в нх числителе од­

на и та же величина ~ (Уi-!Л (Xi-X)' что указывает на нали­

чие связи между этими показателями. Эта связь выражается равенством ,2ху=ЬухЬху, или

Гху=V ЬухЬху

(181)

КоЭффициент корреляции равен средней геометрической из ко­ эффициентов Ьух и Ьху• Формула (181) позволяет, во-первых,

по известным значениям коэффициентов регрессии Ьух и Ьху оп­

ределять коэффициент корреляции 'ху, а во-вторых, проверять

правильность расчета этого показателя корреляционной связи

'ху между варьирующими признаками Х и У.

Так, ИСПОЛьзуя известные коэффициенты регрессии удоя ко­

ров У по массе их тела Х и массы тела коров по их удою (Ьух=

=0,0554 и Ьху =4,934), определяем коэффициент корреляции

между этими признаками: , ху = У4,934·0,0554 = V 0,273 =0,523.

Полученная величина совпадает с той, которая была вычисле­

на по формуле (152).

Как и коэффициент корреляции, коэффициент регрессии ха­

рактеризует только линейную связь и сопровождается знаком

плюс при положительной и знаком минус при отрицательной

связи.

Определение параметров линейной регрессии. Известно, что

сумма квадратов отклонений вариант Xl от их средней х есть

величина наименьшая, т. е. ~ (xi-i)2=min (см. гл. 111). Эта теорема составляет основу метода наименьших квадратов (см. ниже). В отношении лннейной регрессии [см. формулу (176)]

требованию этой теоремы удовлетворяет некоторая система

уравнений, называемых /i,ормаЛЬ/i,ыми:

an+b~x=~y; a~x+b ~x2=~xy.

Совместное решение этих уравнений относительно параметров

а и Ь приводит К следующим результатам:

п= n ~x =n~2_(~x)2; А= ~y ~x =~y~x2_

~x ~x2

~xy ~ х2

-~x~xy; в=\n

~y =n~xy-~y~x, откуда а=

~x

~xy

=A/D и b=B/D.

 

258

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]