Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Совр пробл биол Мод 1Теор мат 2012.doc
Скачиваний:
2235
Добавлен:
26.03.2016
Размер:
7.01 Mб
Скачать

5. История прочтения генома человека

Понятие «геном» исторически возникло как обозначение совокупности всех генов биологического вида, содержащихся в гаплоидном наборе хромосом. В слове «геном»
корень «ген» был объединен с частицей «ом», взятой от слова «хромосома». Впоследствии частица «ом» стала играть роль суффикса,
с его помощью были образованы такие слова, как «транскриптом»,
«протеом» и даже «лигандом», обозначающие соответственно совокупность всех транскриптов, белков и лигандов в клетке. После того
как была открыта роль ДНК в передаче наследственной информации, под геномом стали понимать совокупность всех молекул ДНК в клетке (или всех РНК у РНК-содержащих вирусов).

Противники расшифровки генома считали поставленную задачу нереальной, ведь ДНК человека в десятки тысяч раз длиннее молекул ДНК вирусов или плазмид. Главный аргумент против был: «проект потребует миллиарды долларов, которых недосчитаются другие области науки, поэтому геномный проект затормозит развитие науки в целом. А если все-таки деньги найдутся и геном человека будет расшифрован, то полученная в результате информация не оправдает затрат...» Однако Джеймс Уотсон, один из первооткрывателей структуры ДНК и идеолог программы тотального прочтения генетической информации, остроумно парировал: «лучше не поймать большую рыбу, чем не поймать маленькую» [1, 2]. Аргумент учёного был услышан — проблему генома вынесли на обсуждение в конгресс США, и в итоге была принята национальная программа «Геном человека».

В американском городе Бетесда, что недалеко от Вашингтона, находится один из координационных центров HUGO (HUman Genome Organization). Центр координирует научную работу по теме «Геном человека» в шести странах — Германии, Англии, Франции, Японии, Китае и США. В работу включились учёные из многих стран мира, объединенные в три команды: две межгосударственные — американская “Human Genome Project” и британская из “Wellcome Trust Sanger Institute” — и частная корпорация из штата Мериленд, включившаяся в игру чуть позже, — “Celera Genomics”. Кстати, это, пожалуй, первый случай в биологии, когда на таком высоком уровне частная фирма соревновалась с межгосударственными организациями.

Борьба происходила с использованием колоссальных средств и возможностей. Как отмечали некоторое время назад российские эксперты, Celera стояла на плечах у программы «Геном Человека», то есть использовала то, что уже было сделано в рамках глобального проекта. Действительно, “Celera Genomics” подключилась к программе не сначала, а когда проект уже шёл полным ходом. Однако специалисты из Celera усовершенствовали алгоритм секвенирования. Кроме того, по их заказу был построен суперкомпьютер, который позволял складывать выявляемые «кирпичики» ДНК в результирующую последовательность быстрее и точнее. Конечно, все это не давало компании Celera безоговорочного преимущества, однако считаться с ней как с полноправным участником гонки заставило.

Появление “Celera Genomics” резко повысило напряженность — те, кто был занят в государственных программах, почувствовали жёсткую конкуренцию. Кроме того, после создания компании остро встал вопрос об эффективности использования государственных капиталовложений. Во главе Celera стал профессор Крейг Вентер [который имел огромный опыт научной работы по государственной программе «Геном человека». Именно он и заявил, что все публичные программы малоэффективны и что в его фирме геном секвенируют быстрее и дешевле. А тут появился ещё один фактор — спохватились крупные фармацевтические компании. Дело в том, что если вся информация о геноме окажется в открытом доступе, они лишатся интеллектуальной собственности, и нечего будет патентовать. Озабоченные этим, они вложили миллиарды долларов в “Celera Genomics” (с которой, вероятно, было проще договориться). Это еще более укрепило её позиции. В ответ на это коллективам межгосударственного консорциума срочно пришлось повышать эффективность работ по расшифровке генома. Сначала работа шла несогласованно, но потом были достигнуты определенные формы сосуществования — и гонка начала наращивать темп.

Финал был красивым — конкурирующие организации по взаимной договоренности одновременно объявили о завершении работ по расшифровке генома человека [4, 5]. Произошло это 26 июня 2000 года. Но разница во времени между Америкой и Англией вывела на первое место США. На совместной пресс-конференции с участием президента США и премьер-министра Великобритании представители двух исследовательских групп —International Human Genome Sequencing Consortium (IHGSC) (объединенные британская и американская группы) и частная компания “Celera Genomics” — объявили о том, что работы по расшифровке генома человека, начавшиеся ещё в 70-х годах, успешно завершены, и черновой его вариант составлен. Начался новый эпизод развития человечества — постгеномная эра.

Немало работы было проделано также генетиками из Германии, Франции, Японии, Китая и России. Важно отметить, что соавторами статьи,
описывающей результаты работы, выполненной международным консорциумом
по секвенированию человеческого генома (IHGSC) и опубликованной в журнале
«Nature», стали около 2800 человек, которые работали по всему миру.


В программе «Геном человека» участвовали также более 400 российских исследователей
из 30 научных учреждений, ими были опубликованы сотни научных работ, описывающих различные участки генома человека и модельных животных. В базах
данных российскими учеными были зарегистрированы более миллиона нуклеотидных пар фрагментов ДНК человека и многие сотни генетических маркеров,
имеющих большое значение для детального анализа генома человека. Российский академик А.Д. Мирзабеков (1937-2003 гг.) в
течение нескольких лет был вице-президентом Международной организации по
изучению генома человека (HUGO).

Исследования в сумме продлились 15 лет. Создание первого «чернового» варианта генома человека обошлось в 300 миллионов долларов. Однако на все исследования по этой теме, включая сравнительные анализы и решение ряда этических проблем, было выделено в сумме около трех миллиардов долларов. “Celera Genomics” вложила примерно столько же, правда, она истратила их всего за шесть лет. Цена колоссальная, но эта сумма ничтожна в сравнении с той выгодой, которую получит страна-разработчик от ожидаемой окончательной победы над десятками серьезных заболеваний.

Рисунок 3 - «Гонка за генóм», в которой участвовали межгосударственная и частная компании, формально завершилась «ничьей»: обе группы исследователей опубликовали свои достижения практически одновременно. Руководитель частной компании “Celera Genomics” Крейг Вентер опубликовал свою работу в журнале Science в соавторстве с ~270 учёными, работавшими под его началом [5]. Работа, выполненная международным консорциумом по секвенированию человеческого генома (IHGSC), опубликована в журнале Nature, и полный список авторов насчитывает около 2800 человек, работавших в почти трёх десятках центров по всему миру [4].

Уже к 2007 г. цена определения полной
нуклеотидной последовательности индивидуального генома снизилась в 300 раз, и одному из первооткрывателей структуры ДНК — доктору Джеймсу Уотсону —в 2007 году были подарены два DVD-диска с его полным геномом общей стоимостью 1 млн долларов.  В настоящее время цена секвенирования и сборки индивидуального генома составляет примерно 10000 долларов.

К началу 2001 года в геноме человека со стопроцентной достоверностью было идентифицировано более 20 тыс. генов. Эта цифра оказалось в три раза меньше, чем было предсказано всего за два года до этого.

По версии NCBI 35, датированной октябрём 2005 года, геном человека официально насчитывал только 21667 генов. Следует отметить, что пока большая часть информации всё-таки остаётся общедоступной. Сейчас существуют базы данных, в которых аккумулирована информация о структуре генома не только человека, но и геномов многих других организмов (например, EnsEMBL). Однако попытки получить исключительные права на использование каких-либо генов или последовательностей в коммерческих целях всегда были, есть и будут предприниматься впредь.

В настоящее
время структурная организация каждого из этих генов подробно
описана, однако функции многих из них остаются неизвестными.
 Тем не менее, Фрэнсис Коллинз, руководитель
американской программы «Геном человека», сравнил опубликованную последовательность генома человека с книгой, в которойкаждый читатель находит что-то интересное для себя. Историк
читает ее как отчет о длительном путешествии нашего вида по реке
времени. Инженер — как руководство по эксплуатации с подробными чертежами каждой клетки. А клиницист получает объяснение,
как предотвращать болезни и лечить их.

Результаты первого исследования индивидуального генома, выполненного в
рамках медицинского обследования, были опубликованы в мае 2010 г. в британском журнале «Lancet». У больного с наследственным заболеванием сосудов, в
семье которого встречались ранние смерти, было взято для анализа
всего 2 мл венозной крови, секвенирование было проведено с помощью платформы Heliscope (Hélicos BioSciences, Cambridge, MA). Ученые также провели дополнительную верификацию некоторых важных полиморфных участков с помощью
другой секвенирующей платформы Illumina Bead Array (San Diego, СA). В результате полного генетического анализа было выявлено несколько новых
мутаций и генных вариантов, ответственных за моногенные заболевания (во всех
случаях такие варианты присутствовали только в одной копии), а также целый ряд
однонуклеотидных полиморфизмов и генных вариантов, влияющих на особенности фармакокинетики и фармакодинамики лекарственных средств. Были сделаны
выводы о высокой степени генетической предрасположенности пациента к развитию ишемической болезни сердца и аневризмы аорты, а также о риске устойчивости к терапии клопидогрелом и опасности высоких доз варфарина в случае, если в
будущем будет принято решение о проведении соответствующего лечения еще не
развившихся заболеваний.

В ближайшем будущем стоимость секвенирования индивидуального генома человека должна упасть до 1000 долларов. Такая цена вполне доступна
для обычных людей, которые будут привлечены возможностями своевременного
выявления наследственной предрасположенности к тому или иному заболеванию
и индивидуального подхода к лечению. Доступность геномного секвенирования
приведет к прорыву в области персонализированной медицины.

Первый обнадеживающий пример
такого рода исследования — работа, выполненная в 2008 г., по изучению вызываемой статинами миопатии. Статины относятся к числу самых распространенных на сегодняшний день препаратов, понижающих уровень холестерина в крови, ингибиторы ГМГ-КоА-редуктазы. У этой группы препаратов имеется довольно редкий, но серьезный побочный эффект — миопатия (атрофия мышц). Из 6031 обследованных лиц после приема обычной дозы статина (80 мг) выявлено 85 пациентов с признаками миопатии. Полногеномное исследование ДНК этих пациентов и 90 пациентов из той же выборки, но не проявляющих признаков миопатии, позволило обнаружить один полиморфизм, связанный с появлением миопатии у 60% больных. Им оказался определенный однонуклеотидный полиморфизм в гене, кодирующем белок анионного транспорта и расположенном в хромосоме 12.

Таким образом, генотипирование по соответствующему SNP позволит дать высоковероятный прогноз наличия или отсутствия у данного пациента побочной реакции на терапию статинами.

На сегодня геном человека практически полностью прочитан. Первый, «черновой» вариант последовательности, опубликованный в начале 2001 года [4], был далек от совершенства. В нём отсутствовало приблизительно 30% последовательности генома в целом, из них около 10% последовательности так называемого эухроматина — богатых генами и активно экспрессирующихся участков хромосом. Согласно последним подсчётам, эухроматин составляет примерно 93.5% от всего генома [7]. Оставшиеся же 6.5% приходятся на гетерохроматин — эти участки хромосом бедны генами и содержат большое количество повторов, которые представляют серьезные трудности для ученых, пытающихся прочесть их последовательность [8]. Более того, считается, что ДНК в гетерохроматине находится в неактивном состоянии и не экспрессируется. (Этим можно объяснить такое «невнимание» ученых к оставшимся «малым» процентам человеческого генома.) Но даже имевшиеся на 2001 год «черновые» варианты эухроматиновых последовательностей содержали большое количество разрывов, ошибок и неверно соединенных и ориентированных фрагментов. Нисколько не умаляя значения для науки и ее приложений появление этого «черновика», стоит, однако, отметить, что использование этой предварительной информации в крупномасштабных экспериментах по анализу генома в целом (например, при исследовании эволюции генов или общей организации генома) выявило множество неточностей и артефактов. Поэтому дальнейшая и не менее кропотливая работа, «последние вершки», была абсолютно необходима.

Завершение расшифровки заняло еще несколько лет и привело почти что к удвоению стоимости всего проекта. Однако уже в 2004 г. было объявлено, что эухроматин прочитан на 99% с общей точностью одна ошибка на 100000 пар оснований. Количество разрывов уменьшилось в 400 раз. Аккуратность и полнота прочтения стала достаточной для эффективного поиска генов, отвечающих за то или иное наследственное заболевание (например, диабет или рак груди). Практически это означает, что исследователям больше не надо заниматься трудоемким подтверждением последовательностей генов, с которыми они работают, так как можно полностью положиться на определенную и доступную каждому последовательность всего генома.

Таким образом, изначальный план проекта был значительно перевыполнен. Помогло ли это нам в понимании того, как устроен и работает наш геном? Безусловно. Авторы статьи в Nature, в которой был опубликован «окончательный» (на 2004 год) вариант генома [7], провели с его использованием несколько анализов, которые были бы абсолютно бессмысленны, имей они на руках только «черновую» последовательность. Оказалось, что более тысячи генов «родились» совсем недавно (по эволюционным меркам, конечно) — в процессе удвоения исходного гена и последующего независимого развития дочернего гена и гена-родителя. А чуть меньше сорока генов недавно «умерли», накопив мутации, сделавшие их совершенно неактивными. Другая статья, вышедшая в том же номере журнала Nature, прямо указывает на недостатки метода, использованного учеными из Celera [9]. Следствием этих недостатков стали пропуски многочисленных повторов в прочитанных последовательностях ДНК и, как результат, недооценённая длина и сложность всего генома. Чтобы не повторять подобных ошибок в будущем, авторы статьи предложили использовать гибридную стратегию — комбинацию высокоэффективного подхода, использовавшегося учеными из Celera, и сравнительно медленного и трудоемкого, но и более надежного метода, применявшегося исследователями из IHGSC.

Куда дальше будет направлено беспрецедентное исследование «Геном человека»? Кое-что об этом можно сказать уже сейчас. Основанный в сентябре 2003 года международный консорциум ENCODE (ENCyclopaedia Of DNA Elements) поставил своей целью обнаружение и изучение «управляющих элементов» (последовательностей) в геноме человека. Действительно, ведь 3 млрд. пар оснований (а именно такова длина генома человека) содержат всего лишь 22 тыс. генов, разбросанных в этом океане ДНК непонятным для нас образом. Что управляет их экспрессией? Зачем нам такой избыток ДНК? Действительно ли он является балластом, или же все-таки проявляет себя, обладая какими-то неизвестными функциями [10]?

Для начала, в качестве пилотного проекта, ученые из ENCODE «пристально вгляделись» в последовательность, составляющую 1% от генома человека (30 млн. пар оснований), используя новейшее оборудование для исследований в молекулярной биологии. Результаты были опубликованы в апреле 2007 года в Nature [11]. Оказалось, что бóльшая часть генома человека (в том числе участки, считавшиеся ранее «молчащими») служит матрицей для производства различных РНК, многие из которых не являются информационными, поскольку не кодируют белков. Многие из этих «некодирующих» РНК перекрываются с «классическими» генами (участками ДНК, кодирующими белки). Неожиданным результатом было и то, как регуляторные участки ДНК были расположены относительно генов, экспрессией которых они управляли. Последовательности многих из этих участков мало изменялись в процессе эволюции, в то время как другие участки, считавшиеся важными для управления клеткой, мутировали и изменялись в процессе эволюции с неожиданно высокой скоростью [10]. Все эти находки поставили большое количество новых вопросов, ответы на которые можно получить лишь в дальнейших исследованиях.

Другая задача, решение которой станет делом недалекого будущего, — определение последовательности оставшихся «малых» процентов генома, составляющих гетерохроматин, т. е. бедных генами и богатых повторами участков ДНК, необходимых для удвоения хромосом в процессе деления клетки.

Конечно, сейчас в нашем распоряжении имеется лишь некий «усредненный» вариант человеческого генома. Образно говоря — мы сегодня имеем лишь самое общее описание конструкции автомобиля: мотор, ходовая часть, колёса, руль, сиденья, краска, обивка, бензин с маслом и т. д. Ближайшее рассмотрение полученного результата свидетельствует о том, что впереди — годы работ по уточнению наших знаний по каждому конкретному геному. Программа «Геном человека» не прекратила свое существование, она лишь меняет ориентацию: от структурной геномики осуществляется переход к геномике функциональной, предназначенной установить, как управляются и работают гены. Более того, все люди

Десять лет назад публике объявили о начале постгеномной эры: была прочтена полная (ну, почти полная) последовательность ДНК человека. Этот «эталонный» геном не принадлежал кому-то конкретно: в него вошли образцы ДНК множества разных людей, а в работу над проектом были вовлечены исследовательские группы из нескольких стран [1]. Вскоре после этого по формальным признакам настало время персональной геномики: два первых прочитанных и опубликованных «персональных» генома принадлежат суперзвёздам молекулярной биологии Джеймсу Уотсону [2] и Крейгу Вентеру. Позже (в 2008 году), когда прочтение очередного генома в связи с развитием технологий высокопроизводительного секвенирования ДНК [3] перестало быть новинкой [4], было объявлено о начале работы консорциума, чья цель следует из названия — «1000 геномов». До 2012 года (срок окончания работы консорциума) альянс ставит своей целью определить и сделать доступным для общественности минимум 1000 полных последовательностей ДНК людей из разных стран и разных национальностей (сейчас речь идёт уже о цифрах 2500 полных геномов из 27 разных популяций).