Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Совр пробл биол Мод 1Теор мат 2012.doc
Скачиваний:
2235
Добавлен:
26.03.2016
Размер:
7.01 Mб
Скачать

Зачем учёным тысячи геномов?

Для понимания различий между популяциями. Сравнение тысяч геномов между собой позволяет найти действительно значимые различия, которые важны в медицине и других областях. В этом случае достаточно и «невысокой» точности прочтения: около 900 геномов, прочтённых к настоящему моменту в проекте «1000 геномов», имеют «уровень покрытия» около 3× (трехкратное прочтение одной и той же последовательности).

Для выявления генетической подоплёки заболеваний. Исследования по ассоциации конкретных мутаций с риском возникновения заболеваний требуют от генетической информации высокой точности — уровня покрытия 30× и выше. В частности, ведутся проекты по секвенированию геномов больных раком [4], диабетом, болезнью Крона и других. Разумеется, анализ полученных данных — сложнейшая проблема, но интерес подогревает то, что результаты найдут немедленное применение в медицине.

Одна из практических целей консорциума — исследовать пределы вариабельности человеческой ДНК, которая, как известно, не только более чем на 95% кодирует неизвестно что (так называемый «генетический мусор» [5]), но и идентична у всех человеческих особей более чем на 99%. Очевидно, что оставшийся процент и определяет различия — такие как склонность к определённым заболеваниям или даже личностные характеристики [6]. Однако каким образом это происходит — в большинстве случаев совершенно неизвестно: понятно лишь, что эффект этот крайне сложный и основан не на одном-двух, а на сотнях или даже тысячах признаков, действующих в совокупности.

Проект «1000 геномов» выполняется в примерно 80 исследовательских центрах по всему миру, а инициирован он британским Сенгеровским Институтом (одной из «колыбелей» проекта «Геном человека»), Национальным институтом геномики человека США (NHGRI) и Пекинским геномным институтом (BGI). Больше всего секвенаторов в США (более 300), во Франции и Китае – более 100, в России – 19. Одна из заявленных целей проекта — картировать вариабельные участки генома, встречающиеся в популяции с частотой минимум 1%. (Достижение предыдущего проекта по вариабельности генома человека — HapMap — это 10%-частота, соответствующая 3.5 млн. однонуклеотидных полиморфизмов («снипов», от английской аббревиатуры SNP), — однобуквенных замен в ДНК-тексте.)

Однонуклеотидные полиморфизмы (ОНП) в настоящее время активно используются для выявления генетической предрасположенности к различным заболеваниям (такие исследования с применением технологии высокоплотных олигонуклеотидных микрочипов получили название GWAS — genome wide association studies); правда, даже в самых лучших исследованиях найденные полиморфизмы зачастую не способны объяснить (или предсказать) заболевания с приемлемой для практической медицины точностью (см., например, «Загадочная генетика „загадочной болезни кожи“ — витилиго» [8]). У медицинских генетиков есть надежды, что, знай они не только самые распространённые полиморфизмы в геноме, но и более редкие «снипы» (например, встречающиеся в уже упомянутом 1% случаев), они смогли бы точнее определять риск развития заболевания. Однако, разумеется, не может быть полной уверенности в искренности этого утверждения, даже если предположить, что геном каждого человека будет записан, выражаясь фигурально, на персональной «флэшке».

Как бы то ни было, проект «1000 геномов» отчитывается на страницах Nature в завершении «пилотной» стадии выполнения проекта [9], состоящей из трёх частей:

  1. полного прочтения геномов 179 индивидуумов европейского, африканского и восточно-азиатского происхождения (тут секвенирование проведено с невысокой «точностью», которая прямо пропорциональна количеству повторных прочтений одной последовательности);

  2. секвенирования только экзонов (так называемых неполных «экзомов») генома (8140 белок-кодирующих фрагментов ДНК, составляющих 906 различных генов) для 697 людей и

  3. высокоточного (с большим «покрытием») установления полных генетических последовательностей двух «триад», состоящих из двух родителей и их ребёнка (что позволяет оценить скорость накопления мутаций между двумя поколениями).

Статья консорциума опубликована в открытом доступе (также как и сами последовательности), чтобы результаты смогли получить как можно более широкое распространение.

В результате пилотной фазы проекта «1000 геномов» обнаружилось, что в каждом поколении человек приобретает около 60 новых мутаций (которых не было у родителей), а среднее число «дефектных» аллелей у каждого из нас — 250–300, что соответствует болезнетворным мутациям в более чем 1% всех генов. К счастью, существование двух экземпляров ДНК (отцовской и материнской) позволяет реализоваться механизму активности доминантных генов: в большинстве случаев эти опасные мутации «молчат», хотя и продолжают передаваться по наследству.

Кроме того, было идентифицировано около 15 миллионов однонуклеотидных полиморфизмов, более половины из которых не были известны ранее (это те самые «редкие» аллели), около миллиона коротких вставок/делеций и в районе 20000 других структурных вариантов. Эта работа вскоре повлечёт за собой и практические выгоды: уже проектируют микрочипы для генотипирования по 5 миллионам «снипов», в то время как нынешнее поколение микрочипов позволяет определять примерно 1 миллион аллельных различий.

Параллельно с этим (в один день) в журнале Science опубликовали исследование другого аспекта генетической вариабельности — числа копий (дубликатов) одних и те же генов, содержащихся в геноме (а это издавна считается методологически сложной задачей) [10]. Число копий генов также считается очень важным моментом, определяющим черты организма и его эволюцию.

Авторы предложили оригинальную методику подсчёта числа копий генов, в результате чего открылись неожиданно большие различия по этому параметру между людьми различных рас. Кстати, сравнение участков ДНК с повторяющимися генами выявляет у людей (по сравнению с другими приматами) намного большее число экземпляров некоторых генов, участвующих в развитии мозга.

Технологически прочтение генома остаётся очень сложной задачей, в которой исследователям приходится виртуозно балансировать между стоимостью процедуры и точностью, с которой производится прочтение. С частотой раз в год появляется новое поколение приборов для высокопроизводительного секвенирования (о технологиях «нового поколения», пришедших на смену уже ставшим классикой [3], «биомолекула» как-нибудь обязательно расскажет). Результаты проходят через сложнейшую статистическую обработку, учитывающую уже известные последовательности ДНК, что позволяет повысить точность расшифровки до приемлемого уровня (иначе процент ошибок был бы всё-таки слишком высок). [Без подробностей — методика «коррекции ошибок» получила название imputation.]

В совокупности, эти результаты показывают, насколько же мы всё-таки различны [11] — и это при том, что разница в ДНК не превышает какого-то одного процента. Если считать, что первой фазой геномики человека стал «первый геном» [1], а во время второй исследователи со всего мира изучили вариабельность генома «с высоты птичьего полёта», то наступающая третья фаза обещает стать фазой действительно персональной геномики.