Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
_Л.А.-Генетическая_история_человечества.doc
Скачиваний:
2
Добавлен:
07.07.2019
Размер:
2.37 Mб
Скачать

Перевод (c изменениями) статьи:

Zhivotovsky et al. 2003. Features of evolution and expansion of modern humans inferred from genome-wide microsatellite markers. American Journal of Human Genetics 72: 1171-1186.

Л. А. Животовский

генетическая история человечества

ВВЕДЕНИЕ

При изучении генетической истории человечества первоочередная задача – это выявление глобальной демографической картины в истории человечества и датировка основных событий: распространения человека по планете, разделение на различные ветви (географические группы, или расы), и рост численности разных групп популяций.

Последние годы изучение эволюционной истории человечества проводили на основе анализа специфических участков генома человека: митохондриальной ДНК (мтДНК) и Y-хромосомных маркеров. Основное преимущество их в относительной простоте анализа, но принципиальная их важность – в том, что они позволяют исследовать раздельно материнскую и отцовскую линии, поскольку мтДНК передается потомкам только от матери, а Y-хромосома наследуется только по отцовской линии. Этот анализ позволил многое выявить в эволюционном прошлом человечества, однако ряд важных деталей выявленной с их помощью картины эволюции человечества находятся в противоречии друг с другом. Например, ретроспективный анализ изменчивости ДНК в мировых популяциях показал, что все ныне существующие типы мтДНК сводятся к т.н. «митохондриальной Еве», а типы Y-хромосомы – к «Y-Адаму», причем разного возраста. Несомненно, большая часть этих кажущихся противоречий заключается в том, что и мтДНК и Y-хромосома представляют лишь малые части генома человека, причем части, по-разному отражающие миграционные события и возможно подверженные отбору.

Поэтому сейчас встала важная проблема изучения, наряду с мтДНК и Y-хромосомой, большого числа аутосомных маркеров, представляющих все хромосомы человека. Кроме того, анализ аутосомных ДНК-маркеров позволил бы свести вместе комбинативное действие материнских и отцовских линий, поскольку такие маркеры наследуется и по материнской, и по отцовской линиям. Такой подход позволил бы получить гораздо более полную картину эволюции популяций человека. В данной работе описываются результаты такого подхода, впервые примененного для глобального анализа древней демографической истории популяций человека путем генетического исследования ныне существующих народов.

Наиболее перспективными генетическими маркерами для подобного эволюционного анализа являются микросателлитные локусы. Микросателлиты представляют собой фрагменты ДНК с повторяющимися «мотивами» – идентичными короткими последовательностями из нескольких нуклеотидов (например, тетрануклеотидный мотив GATA), откуда их другое название – STR-локусы (от англ. Short Tandem Repeats). Индивиды могут отличаться друг от друга по числу повторов в каждом STR-локусе. STR-локусы многочисленны: они распределены по всему геному, и сейчас картированы сотни локусов на каждой хромосоме человека (Weber and Broman 2001). Они отличаются высокой скоростью мутирования (Dib et al. 1996), порядка 0.1% и выше на локус на поколение, что позволяет эффективно исследовать эволюционные процессы на коротких промежутках времени.

Что чрезвычайно важно, данные по изменчивости STR-локусов хорошо описываются развитым математическим аппаратом современной популяционной генетики. Это привело к созданию математико-статистических методов анализа и моделированию эволюционного процесса. Среди математического инструментария – RST-статистики популяционной дифференциации (Slatkin 1995), генетическая дистанция (δμ)2 (Goldstein et al. 1995), TD-статистика для оценки времени дивергенции (разделения) популяций (Zhivotovsky 2001), высшие моменты вероятностных распределений по числу повторов (Zhivotovsky and Feldman 1995). Эти методы позволяют провести ретроспективную оценку роста численности древних популяций человека по данным о микросателлитах в современных популяциях (Kimmel et al. 1998, Reich and Goldstein 1998, Gonser et al. 2000, Jin et al. 2000, King et al. 2000, Zhivotovsky et al. 2000) и оценку интенсивности миграций между соседними популяциями (Slatkin 1995, Michalakis and Excoffier 1996, Rousset 1996, Feldman et al. 1999).

Материалы и методы

Для исследования глобальной картины генетической эволюции человечества были исследованы 1056 человек из 52 популяций, биологические образцы которых хранятся в виде клеточных культур (the HGDP-CEPH Human Genome Diversity Cell Line Panel, Cann et al. 2002). Эти образцы были генотипированы по 404 STR-локусам в The Mammalian Genotyping Service (см. http://research.marshfieldclinic.org/genetics/sets/combo. html, Marshfield Panel #10), охватывающим все хромосомы, включая половые хромосомы; из них мы выбрали 377 аутосомных STR: 45 с ди-, 58 с три- и 274 с тетра-нуклеотидными повторами. Эти данные сейчас доступны по адресу http://research.marshfieldclinic.org/genetics/Freq/FreqInfo.htm. (Данные по X- и Y-хромосоме еще не проанализированы нами полностью и потому в этом исследовании не рассматриваются).

Выборки индивидов охватывали популяции (этнические группы) всех населенных континентов (в этой статье названия этнических групп даны на английском – так, как они были обозначены в указанных выше Интернет-сайтах, # означает номер). А именно, Южная Африка: охотники-собиратели племени пигмеев Биака (Biaka, Центральная африканская республика, #47) и Мбути (Mbuti, Конго, #48) и племени Сан (San, Намибия, #50), а также оседлых народов – «фермеров», занимающихся сельским хозяйством, которые мы будем здесь иногда обозначать собирательным термином «Банту» – Bantu (Кения, #49), Yoruba (Нигерия, #51) и Mandenka (Сенегал, #52); Северная Африка: Mozabite (Алжир, #44); Ближний Восток: друзы (Druze, Израиль, Кармел, #41), палестинцы (Palestinian, Центральный Израиль, #42), бедуины (Bedouin, Израиль, Негев, #43); Центральная/Южная Азия: уйгуры (Uygur, Северо-Западный Китай, #20) и племена из Пакистана – Balochi (#24), Brahui (#25), Burusho (#26), Hazara (#27), Kalash (#28), Makrani (#29), Pathan (#30), Sindhi (#31); Европа: баски (Basques, Франция, #33), французы (Франция, #34), Bergamo (#35), Sardinian (#36), Tuscan (#37) – все из Италии, Orcadian (о-ва Оркни, #38), русские (Север Европейской части России, #39), адыги (Adygei, Северный Кавказ, #40); Восточная Азия: Cambodian (Камбоджа, #6), а также выборки Dai (#7), Daur (#8), Han из Северного Китая (#9) и из США (#10), Hezhen (#11), Lahu (#12), Miao (#13), монголы (Mongola, #14), Naxi (#15), Oroqen (#16), She (#17), Tu (#18), Tujia (#19), Xibo (#21), Yi (#22) – все из Китая, японцы (Япония, #23), якуты (Сибирь, #32); Океания: меланезийцы (Melanesian, Боганвил, #45), папуасы (Papuan, Новая Гвинея, #46); Америка: южно-американские племена бассейна Амазонки Karitiana (Бразилия, #1) и Surui (Бразилия, #2) и колумбийцы (Colombian, Колумбия, #3), Центрально-американские народности майя (Maya, Мексика, #4) и Pima (Мексика, #5). Объемы выборок были небольшие, средний размер был около 20; детальное описание дано в Rosenberg et al. (2002).

Было обнаружено, что изученные STR-локусы значительно отличаются друг от друга как по числу аллелей (рис. 1), так и по дисперсии числа повторов (рис. 2) – вне зависимости от типа локуса (с ди-, три- или тетрануклеотидными повторами). Это может быть связано как с различной скоростью мутирования в разных локусах (Zhivotovsky et al. 2001), так и с генетической «ошибкой» – стохастичностью траекторий эволюционного процесса (Weir 1996).

Мы определили 52 х 52-матрицу парных значений FST (точнее, θ, Weir 1996), используя компьютерную программу GDA (Lewis and Zaykin 2001), на основе которой определили главные координаты (PC) путем многомерного шкалирования с использованием компьютерной программы SPSS 8.0.0. Для оценки времени дивергенции популяции применили TD–статистику (Zhivotovsky 2001); необходимую для TD–статистики частоту мутаций по микросателлитным локусам определяли по Zhivotovsky et al. (2000) с модификацией Zhivotovsky et al. (2003). Для оценки времени начала роста популяций в численности применяли индекс дисбаланса ln (Kimmel et al. 1998; King et al. 2000) и индекс экспансии Sk (Zhivotovsky et al. 2000). Показатель Sk позволяет также оценить численность пра-популяции перед тем, как она стала расти в численности в предположении, что перед этим пра-популяция находилась в генетическом равновесии (уравнения 7, 8 из Zhivotovsky et al. 2000). Оценки Sk интерпретируются как минимальные границы времени экспансии (начала роста численности), реальное время экспансии более раннее, если численность растет медленно и/или темпы мутирования сильно варьируют от локуса к локусу. Для моделирования генетической динамики популяций мы использовали программу “Mathematica” (Wolfram 1996). Мы также исследовали распределение приватных (популяционно-специфических) аллелей, т.е. аллелей, которые встречаются только в этой выборке индивидов и больше ни в какой другой, которые могут дать полезную информацию о популяционно-генетической струтуре (см. Barton and Slatkin 1986). Были введены две статистики: S3 = S1/N и S4=100 S1 S2 / L (в процентах). Здесь S1 – это суммарное число в данной выборке различных приватных аллелей по всем локусам, S2 – это средняя частота приватных аллелей в выборке, а N – объем выборки.