Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
современная генетика т3.doc
Скачиваний:
271
Добавлен:
21.02.2016
Размер:
8.04 Mб
Скачать

Айала ф., Кайгер Дж. Современная генетика: в 3-х т. Т. 3. Пер. С англ.: – м.: Мир, 1988. – 336 с.

Приложение 1. Вероятность и статистика 269

Таблица 6.П.1. Наблюдаемые и теоретически ожидаемые на основе распределения Пуассона результаты в эксперименте с бактериями

Число колоний на чашку

Число чашек

Число колоний

Ожидаемая частота чашек

Ожидаемое количество чашек

0

22

0

0,311

18,7

1

19

19

0,363

21,8

2

10

20

0,212

12,7

3

6

18

0,082

4,9

4

2

8

0,024

1,44

5

1

5

0,006

0,34

Всего

60

70

0,998

59,9

Когда вероятность отдельного события (в данном случае мутации) очень мала, а число испытаний (бактерий) очень велико, то частота событий подчиняется распределению Пуассона. (При этом предполагается также, что события независимы; в нашем примере это означает, что возникновение мутации у одной бактерии не влияет на вероятность ее возникновения у другой бактерии.) Другим примером пуассоновского распределения может служить число случаев ахондроплазии на каждые 10 000 новорожденных в браке нормальных родителей по всему населению земного шара.

Значения членов распределения Пуассона задаются следующей общей формулой:

где p (k) -вероятность того, что в данной выборке реализуется k интересующих нас исходов события, x -среднее число таких исходов в выборке данного размера, a k ! (k факториал) - произведение вида 1·2·3... ·k. Другими словами, в соответствии с распределением Пуассона частоты выборок с данным числом исходов составляют:

В рассмотренном примере среднее число интересующих нас исходов (мутантов) в выборке (на чашке Петри) равно χ = 1,17. Ожидаемую частоту чашек Петри без колоний и с одной, двумя, тремя и т. д. колониями можно рассчитать по приведенной формуле членов распределения Пуассона (четвертый столбец таблицы П.6). Ожидаемое число чашек с соответствующим числом колоний (пятый столбец таблицы) получается умножением частоты на 60 - общее число чашек Петри в эксперименте. Теперь мы можем, например, определить с помощью критерия χ2, соответствуют ли результаты эксперимента теоретически ожидаемым на основе распределения Пуассона.

Удобная особенность пуассоновского распределения состоит в том, что у него среднее значение совпадает с дисперсией. Дисперсия данных,

Айала ф., Кайгер Дж. Современная генетика: в 3-х т. Т. 3. Пер. С англ.: – м.: Мир, 1988. – 336 с.

270 Приложение 1. Вероятность и статистика

представленных в табл. П.6, равна 1,50, что довольно близко к среднему значению, равному 1,17.

Пуассоновское распределение часто встречается в генетике. В гл. 20 мы рассмотрели примеры использования распределения Пуассона при определении частоты мутаций и числа генов. Другим примером применения пуассоновского распределения к задачам генетики может служить формула для определения генетического расстояния по данным электрофореза (дополнение 26.1). Ясно, что белки с различными электрофоретическими свойствами различны, но заранее неизвестно, состоят ли эти различия в одной или нескольких аминокислотах. Если величина различий между белками, кодируемыми одним локусом, подчиняется распределению Пуассона (а это предположение представляется вполне разумным, поскольку в каждом белке много аминокислот, а среднее число аминокислотных различий между близкородственными видами невелико), то частота идентичных белков, между которыми какие бы то ни было аминокислотные различия отсутствуют, задает значение нулевого члена пуассоновского распределения. Таким образом, если частота тождественных белков равна I, а средняя частота различий -D, то I = = eD. Логарифмируя, получаем ln I= — D или D = — In I, т.е. формулу для генетического расстояния, приведенную в дополнении 26.1.