Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

uchebnik10

.pdf
Скачиваний:
35
Добавлен:
21.03.2015
Размер:
8.26 Mб
Скачать

та. При p=q биномиальная крнвая строго симметрична и по ме­

ре увеличения числа испытаиий прнобретает все более плавный

ход, приближаясь к своему пределу - нормальной кривой (см. ниже). Если P=Fq, бииомиальиая кривая стаиовится асимметрич­ ной и тем сильнее, чем больше разиица между р и q. Когда веро­ ятность события очень мала и исчисляется сотыми и тысячными

долями единицы, распределение частот таких редких событий в n. независимых испытаний становится крайне асимметричным. Для описания такого рода распределений редких событий служит формула Пуассона

Рn(m)

(42)

где a~ пр - наивероятнейшая частота

ожидаемого события;

т - частота ожидаемого события в n независимых

испытаний;

е= 2,7183 - основание натуральных логарифмов; т -

факториал

или произведение натуральных чнсел 1· 2· 3· 4...т.

Формула Пуассона позволяет определять вероятность для лю­

бых значений а от О до n. Например, для а=2 вероятность того, что событие А в данных условиях не осуществится, будет равиа

р_2О

1

1

0,1353.

0 - Ole2 -(2,7183)2

7,389

 

Вероятность единичного осуществления ожидаемого события

при этих условиях выразится следующей величиной:

2

2

2

11 е2

-- = -- =0,2707 .

(2,7183)2

7,389

ДЛЯ трех случаев Рз= 23

8

0,1805 и т. д.

31 е2

44,334

 

(см. табл. 111 Приложений).

Чтобы формула Пуассона выражала не вероятности, а ожи­

даемые абсолютные частоты (' редкого события, ей придают

следующий вид:

f'=n

т

-

(43)

 

ml

е-.%'.

 

 

 

Здесь (' - теоретические ордииаты кривой

распределения

Пуассона, или ожидаемое число случаев редкого события в каж­

дом отдельно взятом классе испытания - О, 1, 2, 3, 4 и т. д.; n -

число испытаний; х - среднее число фактически наблюдаемых

случаев (взятое вместо а); объяснения остальных символов те

же, что в формуле (42).

Распределение Пуассона - частный случай биномиального

распределения. Оно, как и биномиальное распределение, прнбли-

19

 

 

 

 

 

жается

к

нормальной

кривой

 

 

 

 

 

(см. ниже) при

возрастании

 

 

 

 

 

числа a~np (рис. 9).

 

 

а=о,'

 

 

 

По

закону

Пуассона

рас­

 

 

 

пределяются редкие случайные

 

 

 

 

 

 

 

 

 

 

события, встречающиеся в ми­

 

 

 

 

 

кробиологии, радиобиологии и

 

 

 

 

 

других

разделах

современной

 

 

 

 

 

биологии. Например, установ­

 

 

 

 

 

лено,

что

численность

перези-

О

, ~

J 4

5 б 7

8 9 /о т

мовавших

клопов

вредной

че-

Рис.

9.

График

функции

Рn (т) =

репашки на пробных площад­

 

 

 

 

 

 

 

 

аm

 

 

 

 

ках распределяется по

закону

= -

е-а для разных значений а

Пуассона. По

этому же зако­

тl

 

 

 

 

ну

распределяются

частоты

 

 

 

 

 

спонтанных мутаций у кишечной палочки. Подобных примеров

можно привести много.

111.7. ПАРАМЕТРЫ ДИСКРЕТНЫХ РАСПРЕДЕЛЕНИЯ

Биномиальное распределение характеризуется двумя пара­

метрами: средним, или наивероятнейшим, числом!! ожидаемого

результата и дисперсией частоты Оm2 события А в n независимых

испытаний. Первый параметр приближенно равен произведению

числа испытаний n на вероятность р, которую событие А имеет в

каждом классе испытаний, т. е. !! = пр. Второй параметр равен

произведению числа испытаний n на вероятность рожидаемого

события А и вероятность q противоположного события А, т. е. (Jm 2 =npq. Корень квадратный из дисперсии называется стандарт­

ным отклонением.

В отличие от биномиального распределения распределение

редких событий, следующих закону Пуассона, характеризуется

одним параметром - средней величиной (nр=m=х), так как для этого распределения характерно равенство Оm2 = m. Кроме того,

распределение Пуассона, как и другие асимметричные распреде­ ления, характеризуется очень высоким коэффициентом вариации. Эти особенности распределения редких событий иллюстрирует опыт по облучению штамма бактерий а-частицами, результаты которого и их обработка приведены в табл. 26.

Характеристики этого распределения: m= 798/517= 1,54 и

sm 2 =790,3/516= 1,53. Отсюда Cv= 100У1,53/1,54=80,2%. Сов­

падение по абсолютной величине дисперсии и средней арифме­

тической указывает на то, что данное распределение следует

закону Пуассона.

Расчет теоретических частот (f') по закону Пуассона произ­

водят по формуле (43). Это показано на примере 4.

80

 

 

 

 

 

 

Таблица 26

Поражае-

 

 

 

 

 

 

масть

Число

fi

mf/

т/-т

(т-тР

f/ (тгтР

бактериаль-

случаев

НЫХ клеток

 

 

 

 

 

 

 

 

 

 

т

 

 

 

 

 

 

О

112

 

О

-1,54

2,3716

265,6192

1

168

 

168

-0,54

0,2916

48,9888

2

130

 

260

-0,46

0,2116

27,5080

3

68

 

204

+1,46

2,1316

144,9488

4

32

 

128

+2,46

6,0516

193,6512

5

5

 

25

+3,46

11,9716

59,8580

6

1

 

6

+4,46

19,8916

19,8916

7

1

 

7

+5,46

29,8116

29,8116

Сумма

517

798

-

-

790,2772

Пример 4.

Воспользуемся

данными

опыта по

облучению

амма бактерий а-частицами (см. табл. 26) и рассчитаем для

.. ого распределения теоретические

частоты. В

данном случае

l= 517; х=1,5; e-1,5= 0,2231'; классы испытаний т: О 1 234567,

1М соответствуют т!=О!=l; 1!=1;

2!=1·2=2;

31=2·3=6; ... ;

'1=720·7=5040, а также 1,52=2,25;

1,53=3,375;

1,54=5,063; ... ;

.57 = 17,086.

Подставляем известные величины в формулу (42):

'!'10'= 517 .0,2231 = 115,34 = 115 =517 ·1,5·0,2231 = 173,04= 173

/2

'

517·2,25·0,2231

9

------'-2--'-- = 12 ,77 = 130

Iз'

517·3,375' 0,2231

=64,88=65.

'{

6

 

24

 

 

 

517·5,063·0,2231

24,35=24

 

 

 

15'=

517·7,594· 0,2231

7,30=7

 

 

120

 

16'

517·11,391·0,2231

1,82=2

720

 

 

 

fr'=

517 ·17,086· 0,2231

=0,39=1

5040

 

 

 

Сумма

 

516,89"" 517

1 Значения показательно/i функцин е-О: см. в справочниках по математике,

81

& ""-Н'& н::uvетических частот можно упростить, применяя

табл. 111 Приложений, в которой содержатся значения вероятно­

стн Р(т) для каждого класса испытаний т и средней величины

а=Х. Чтобы получить теоретические частоты ", достаточно зна­

чения вероятности Р(т), прнведенные в табл. III Прнложеннй для т и Х (вместо а=nр), умножить на общее число наблюде­

ний n. Так, для х= 1,5 и т=О в табл. III Приложений находим

Р(т) =0,2231. Умножая эту величину на n, равное 517, получаем 10' = 115,34. Затем для т = 1 и х = 1,5 в той же таблице находнм

Р(т) =0,3347 и 11'=517·0,3347· 173,04 и так поступаем до конца

ряда, как это показано в табл. 27.

 

 

 

 

Таблица 27

 

 

 

Теоретические частоты'/

Кл:ассы т

Частоты '.

Р(m)

 

 

 

 

 

расчетные

с ·округл:еинем

О

112

0,2231

115,34

115

1

168

0,3347

173,04

173

2

130

0,2510

129,77

130

3

68

0,1255

64,88

65

4

32

0,0471

24,35

24

5

5

0,0141

7,29

7

6

1

0,0035

1,81

2

7

1

0,0008

0,41

1

Сумма

517

-

516,90

517

При сравнении (визуальном) эмпирических частот с частота­

ми, вычисленными по закону Пуассона, видно, что они согласу­

ются между собой.

111.8. НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ

Случайные величины. Как было показано выше, варьирую­

щие признаки в математнке рассматривают как переменные слу­

чайные величины, способные в одннх и тех же условиях испыта­

ния принимать различные числовые значения, которые заранее

невозможно предсказать. Случайные величины делят на дискрет­

ные и непрерывные. Случайная величина называется дискрет­

ной, если оиа может принимать только определенные фиксиро­ ванные значения, которые обычно выражаются целыми числами. Если же случайная величина способна принимать любые число­ вые значения, она называется непрерывной. Очевидно, что счет­

ные признаки относятся к дискретным .tлучаЙным величинам,

тогда как признаки мерные, варьируЮщие непрерывно, являются

величинами непрерывными.

82

Случайная величина Х в серии независимых повторных испы­

таний может принимать самые различные значения, но в каждом

отдельном испытании она принимает единственное из возможных

значений Xi.

Закон распределения случайных величин. Функция f (Х), свя­

зывающая значения Xi переменной случайной величины Х с их

вероятностями Pi, называется законом распределения этой вели­

чины. Закон распределения случайной величины можно задать

таблично, выразить графически в виде кривой вероятности и опи­ сать соответствующей формулой. Закон распределения дискрет­

ной случайной величины может, например, выражаться в виде биноми.альноЙ кривой и описываться формулой Бернулли, кото­

рая позволяет находить вероятные значения этой величины в

серии независимых испытаний. В отношении же непрерывной слу-

u u

чаинои величины речь может идти лишь о тех значениях, которые

она способна принять с той или иной вероятностью в интервале

от и до. Этот интервал может быть каким угодно: и большим, и

малым. Выдающиеся математики - А. Муавр (1733), И. Г. Лам­ берт (1765), П. Лаплас (1795) и К. Гаусс (1821) -установили,

что очень часто вероятность Р любого значения Xi непрерывно распределяющейся случайной величины Х находится в интервале от Х до x+dx и выражается формулой

 

1

_2.. (x-v.)'

(44)

Р(Х)

V

е:1 а dx,

 

а

2л:

 

где dx- малая величина, определяющая ширину интервала; n: и е - математические константы (n: - отношение длины окружно­

сти к ее диаметру, равное 3,1416... ; е=2,7183-0снование нату­ ральных логарифмов); (J - стандартное отклонение, характеризу­

ющее степень рассеяния значений Xi случайной величины Х во­

круг средней J.I., называемой математическим ожиданием.

В показатель степени числа е входит нормированное отклонение t = (Xi-J.l.) / (J - величина, играющая важную роль в исследова­

нии свойств нормального распределения, описываемого форму­

лой (44).

Как видно из этой формулы, закон нормального распределе­ ния (нормальный закон) выражает функциональную зависимость

между вероятностью Р (Х) и нормированным отклонением t. Он

утверждает, что вероятность отклонения любой варианты Xi от центра распределения J.I., где Xi-J.l.=О, определяется функцией нормированного отклонения t. Графически эта функция выра­ жается в вид.е кривой вероятности, называемой нормальной кривой. Форма и положение этой кривой определяются только

двумя параметрами: J.I. и (J. При изменении велнчины. J.I. форма

нормальной кривой не меняется, лишь график ее смещается

вправо или влево. Изменение же величины (J влечет за собой

83

изменение только ширины кривой: при уменьшении (1 кривая

делается более узкой за счет меньшего рассеяния вариант во­

круг средней, а при увеличении (1 кривая расширяется. Во всех

случаях, однако, нормальная кривая остается строго симмет­

ричной относительно центра распределения, сохраняя правиль­

ную колоколообразную форму (рис. 10).

с

Рис. 10. Нормальные крнвые (1,2,

8) прн разных значениях парамет­

ра а (аl<а2<аз)

/,m

О, I

 

--~

·t х=О

+i +?!

·н

-Jt - 2t

Рнс. 11.

Стандартнзованная

форма

нормальной крнвой (прн а= 1)

Нормальная кривая с параметрами J,t=0 и (1= 1 называется нормальной или стандартизованной кривой. Она описывается

формулой

(45)

Любую нормальную кривую можно привести к стандартной

(вычитанием J,t из Xj и делением на (1). Стандартная кривая (рис. 11) имеет площадь, равную единице. Ее вершина, т. е. макси­

мальная ордината Утах, соответствует началу прямоугольных

координат, перенесен'ному в центр распределения, где Xj-J,t=О. Вправо и влево от этого центра случайная величина Х может

принимать любые значения, и величина каждого отклонения

(Xj-J,t) определяется функцией его нормированного отклонения f (t). Вероятности Р таких отклонений, соответствующие разным

значениям t, приведены в табл. 1 Приложений.

для того чтобы ордината выражала не вероятности, а абсо­

лютные числовые значения случайной величины, т. е. выравнива­

ющие частоты вариант эмпирического распределения, нужно в

правую часть формулы (45) внести дополнительные множители:

в числитель - общее число наблюдений n, умноженное на вели­

чину классового иитервала Л, а в знаменатель - величину сред­

него квадратического отклонения эмпирического ряда распреде-

84

ления S;c. В результате можно записать формулу

f' = n). f (1).

(46)

S,x

 

Здесь f'- теоретические (выравнивающие) частоты вариаци­

онного ряда, а f - значения функции нормированного откло­

нения, рассчитанные по формуле (46). Эти значения содержатся

в табл. II Приложений. Прнменяя табл. 1 и II Прнложеннй, мож­

но по двум показателям (средней арифметической х и среднему квадратическому отклонению Sx) вычислить теоретические часто­

ты эмпнрнческого вариационного ряда, рассчитать ординаты и

построить график нормальной крнвой. Сравнивая частоты эмпи­

рического вариационного ряда с частотами, вычисленными по

формуле (46), можно проверить, следует лн эмпнрическое рас­

пределение нормальному закону.

Пример 5. По выборке, состоящей из 267 взрослых мужчнн,

для длины тела получен вариационный ряд (табл. 28).

 

 

 

 

 

Таблица 28

 

 

-

 

Теоретические

Центры

Эмпириче-

 

частоты ('

х,-х

ОрдииатЫ

 

 

иитерва,nов

ские частоты

t-

 

 

иорма.nьиоА

 

 

 

'

 

 

 

 

кривой f (1)

 

 

;с/, см

;

Sx

 

округ-

 

 

 

 

расчетные

.nениые

 

 

 

 

 

158

3

-2,77

0,0086

1,6

2

161

9

-2,03

0,0508

10,0

10

164

31

-1,29

0,1736

34,3

34

167

71

-0,55

0,3429

67,8

68

170

82

+0,19

0,3918

77,6

78

173

46

+0,93

0,2589

51,2

51

176

19

+1,67

0,0989

19,5

19

179

5

+2,41

0,0219

4,4

4

182

1

+3,15

0,0028

0,6

1

Сумма

267

-

-

267,0

267

Характеристики

этого распределения:

х= 169,22 см и sx=

=4,06 см (эти показатели читатель может вычислить). Из

табл. 28 видно, что расчет теоретических частот начинается с

нормнрования членов варнационного ряда, т. е. вычисления t.

Затем по табл. II Приложений находят значение функции f (t)

для каждого нормированного отклонення t эмпирического ряда.

Перемножая значения f(t) на величину nл/sх, равную в данном

случае 267· 3/4,06~ 198, находят теоретические (выравнивающие)

частоты данного распределения. Из рис. 12 видно, что представ­ ленные в виде линейного графика эмпирическне и вычисленные

85

по нормальному закону частоты этого распределения согласуют­

ся между собой.

Параметры нормального распределения. Как было показано,

нормальное распределение характеризуется двумя параметрами:

средней величиной, или математическим ожиданием Jl, и диспер­

сией (Jx2 случайной величины Х. Первый параметр равен сумме

произведений отдельных значений Xj случайной величины Х на

их вероятности Pi, т. е.

n

P-=ХIРl+Х2Р2+ХзРз+... +ХnРn=~ х,р,.

1-1

Второй параметр равен сумме квадратов отклонений отдельных значений Х/ случайной величины Х от ее математического ожида-

ния Jl, т. е. а~=I,[х,-р-(х)l.'l,

или С учетом повторяемости ff

a~= I, {[Х/ -

Р- (х)12 f,}·

Формально математическое ожидание соответствует средней

величине эмпирического

1

2

Длина тела, си

распределения, однако, по существу, эти показатели

отождествлять нельзя.

Среднюю величину опре­

деляют как сумму всех

членов ряда, отнесенную

к их общему числу, а ма­

тематическое ожидание

представляет собой сум­

му произведений членов

ряда на их вероятности.

Рнс. 12. Эмпнрнческая (1) н вычисленная

Эмпирическая

средняя

по нормальному закону (2) кривые рас·

стремится к математиче­

пределення длины тела у 267 мужчин

скому ожиданию случай­

 

ной величины

по мере

увеличения числа испытаний; при небольшом числе испытаний

средняя может значительно отклоняться от своего математи­

ческого ожидания.

Основные свойства нормального распределения. Для нормаль­

ного распределения характерно совпадение по абсолютной вели­

чине средней арифметической, медианы и моды. Равенство меж­

ду этими показателями указывает на нормальность данного рас­

пределения. Вероятность отклонения любой варианты в ту или

другую сторону от средней J.t на t, 2t и 3t, как это видно из

табл. 1 Приложений, следующая:

р {--! <- tJo\ < +t}=O,6827; р {-2! <- tJol < +2t}=O,9545; Р {-3t< Ix-p-I< +3t}=O,9973.

86

Это означает, что при распределении совокупности наблюде­

ний по нормальному закону из 10000 вариант в интервале от

J,t-t до J,t+t окажется 6827 вариант, или 68,3% от общего числа

вариант, составляющих данную совокупность. В интервале от

J,t-2t до J.t+2t будет находиться 9545 вариант, или 95,4% от чис­

ла всех вариант совокупности. И в интервале от J.t-3t до J.t+3t

окажется 9973, или 99,7% от общего объема совокупности. Следовательно, с вероятностью Р-О,6827 можно утверждать,

что наугад отобранная из нормально распределяющейся сово­

купиости варианта не выйдет за пределы от J.t-t до J.t+t, или в

компактной форме J,t+t. Вероятность того, что случайно отобран­

ная варианта не отклонится от средней J.t более

чем на J.t + 3t,

равна Р=О,9973. ЭТО озиачает, что 99,7% от всех

вариант нор­

мально распределяющейся

совокупности находится в пределах

J,t±3CJ. ЭТОТ важный вывод

известен в биометрии

как правило

nлюс-м.инус трех сигм..

111.9. РАСПРЕДЕnЕНИЕ МАКСВЕnnА

По нормальному закону распределяются многие биологиче­

ские признаки, но не все: нередко встречаются и асимметричные

распределеиия, которые, однако, не следуют закону Пуассона.

Одиим из трех распределений является распределение, описыва­

емое формулой Максвелла

Р(Х)= у2_ -t2е-'2'"

dx. (47)

2", а

В этой формуле а = 0,6267 х - параметр распределения, опре­

деляемый через среднюю арифметическую х варьирующего при­

знака; t=Xija, где Xj - числовые значения случайной величины Х; дхразность между двумя смежиыми значениями перемен­

ной величины Х.

Указанием на то, что эмпирическое распределение следует за­

кону Максвелла, служит равеиство между средним квадратиче­ ским отклонением и величиной 0,674 а, т. е. sx=0,674 а, тогда как для распределения Пуассона характерно равенство S%2 =Х.

Чтобы рассчитать по формуле (47) теоретические (выравни­ lJающие) частоты, нужно проделать следующее. 1. Определить

::реднюю арифметическую эмпирического вариационного ряда и

[IapaMeTp а. 2. Разделить каждую классовую варианту Xj на ве­

личииу а, что даст значения t. 3. Найти для каждого значения t=Xija по табл. 11 Приложений значение функции '(t). 4. Опре­

!{елить значения t2ja. 5. Умножить значения t2ja на удвоенную lJеличину t и на величину классового промежутка (л=dх), т. е. Jпределить р= (t2jа)2f(t)л. 6. Умножить значения р на общее

87

число наблюдений n, получить теоретические (выравнивающие

частоты данного вариационного ряда, т. е. f' =Рn.

ПРU'м'ер 6. При скрещивании мелкоплодной линии томатов ~

крупноплодной линией того же сорта в первом поколении плодь. получились не среднего, а несколько меньшего размера. Во втс·

ром поколении, т. е. при скрещивании представителей первогс

поколеиия между собой, масса отдельных плодов еще более пр}! близилась к массе плодов исходной мелкоплодной линии. Pat

пределение массы плодов семенных гнезд, взятых с 928 растеню_

расщепляющейся популяции томатов, показано в табл. 29.

Таблица 2~

 

Ча-

 

 

 

tt

 

К.nассы JC j

 

Х;

f (1)

/2

-

pn=f'

СТОТЬ!

/ --

-2j(t)'л=р

 

f (1)

а

 

 

а

а

 

 

 

 

 

 

 

10

28

0,33

0,3778

0,109

0,0035

0,0264

25

20

93

0,66

0,3209

0,430

0,0141

0,0905

84

30

186

0,98

0,2468

0,966

0,0316

0,1571

146

40

148

1,31

0,1691

1,716

0.0562

0,1900

176

50

176

1,61

0.1040

2.686

0,0880

0.1830

170

60

102

1,97

0,0573

3,869

0,1268

0.1450

134

70

74

2,30

0,0283

5,267

0,1727

0,0977

91

80

46

2,62

0,0129

6.880

0,2256

0.0582

54

90

28

2.95

0,0051

8,708

0,2855

0.0291

28

100

19

3.28

0.0018

10.745

0,3523

0,0127

12

110

14

3,61

0,0005

13,032

0,4273

0,0043

4

120

6

3,93

0,0002

15,476

0,5074

0,0020

2

130

5

4.25

0,0001

18,164

0,5955

0,0011

1

140

2

4,59

0,0000

21,068

0,6907

0.0001

1

150

1

4,92

0,0000

.

0,7930

0.0000

 

24,186

О

Сумма

928

-

-

-

-

0.9972

928

Характеристики этого распределения следующие: х=48,7:­

Sx = 23,8, откуда а = 0,6267 х= 30,5. Близость Sx = 23,8 к величин~ 0,674 а =20,6 позволяет предположить, что данное распределеНИt следует закону Максвелла. Расчет выравнивающих частот f' ПрF веден в табл. 29. Значения t=Xj/a получены так: t\ = 10/30,5=

=0,328=0,33; t2 =20/30,5=0,655=0,66 и т. д. Значения f(t) нах(·

дят в табл.

11 Приложений: f(t\=0,33) =0,3778;

j(t2=0,66)=-

= 0,3209 и т. д.

 

Величины предпоследней графы этой таблицы

рассчитаНh

следующим

образом: t\2= (0,33)2=0,109; tNa=0,109/30,5=

=0,0035; 2f(t) =2·0,3778=0,7556; (t\2/а)2f(t)Л=0,0035·0.7556 )

Х 10=0,0264. Умножая эту величину на n=928, получают иске· мое значение f'=Pn=0,0264·928=25 и так до конца ряда.

В результате получается ряд теоретически вычисленных (BIo' равнивающих) частот f'. Если эмпирические и вычисленные пl закону Максвелла частоты этого ряда представить графически f

88

Соседние файлы в предмете [НЕСОРТИРОВАННОЕ]