Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
лекции по геномике.doc
Скачиваний:
21
Добавлен:
13.09.2019
Размер:
1.19 Mб
Скачать

Лекция №3

КЛАССИЧЕСКИЕ ПОДХОДЫ К ОПРЕДЕЛЕНИЮ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ГЕНОМА

Конструирование геномных библиотек проводят, даже если сиквенс известен. На схеме представлены 2 альтернативных подхода к секвенированию генома.

Классический подход («клон за клоном»), когда сначала делается какая-то геномная карта, затем делается коротенькая библиотека со вставками определенной длины (энциклопедия генов) – от нескольких десятков до нескольких сот т.н.п., потом делается дробление на небольшие случайные фрагменты (Шотган), они секвенируются с двух концов, с каждого по 500-1000 н.п., из этих последовательностей собираются последовательности сначала одного кусочка, а потом такие куски стыкуются друг с другом. Есть несколько нюансов:

  1. Сначала может быть построена физическая карта, и клоны могут быть упорядочены относительно друг друга, потом их состыковывают.

  2. Сначала пытаются состыковать клоны между собой, потом то, что не стыкуется, стыкуют друг с другом при помощи методик физического картирования.

Альтернативный подход – шотган всего генома, когда геном сразу полностью дробится на случайные куски, из которых пытаются собрать какую-то последовательность, а потом собранные кусочки располагают на геномной карте. Стадия финиширования при этом получается достаточно длинной.

Таким образом, есть два подхода: шотган и «клон за клоном». Шотган быстрее, легче автоматизируется, но дает геномы худшего качества, с достаточно большим числом ошибок. При иерархическом подходе, когда секвенируется клон за клоном, затрачивается больше ручного труда и получается в целом медленнее, но качество сиквенса получается более высокое. Если посмотреть на последовательность фаз геномных проектов, то первая и последняя всегда одна и та же. Первая – конструирование геномных библиотек, последняя – аннотация генома, поскольку голые буквы ничего не значат, а промежуточные стадии немножко различаются.

В случае иерархического подхода одновременно идет физическое картирование и отбор клонов секвенирования, т.к. физические карты строятся на основе этих клонов, это 2 совмещенных стадии. Потом, когда карта уже есть, идет (шотган?) секвенирование уже небольших клонов. Выделенные жирным шифтом стадии наиболее продолжительны. В случае Шотган-подхода сначала идет массовое секвенирование случайных клонов, затем компьютерное конструирование геномных последовательностей, потом – закрывание пробелов, которых получается довольно много (финиширование). Как правило, здесь не обходится без создания геномных библиотек, в которые попадают клоны, отсутствующие в первичном Шотгане. Эта стадия наиболее трудоемкая. И то, и другое сводится к физическому картированию генома, но в первом случае (шотган) картируется небольшая часть генома, а во втором случае («клон за клоном») – весь. Первый вариант быстрее и дешевле, и хуже, второй – дороже, но качественнее.

1. Конструирование геномных библиотек.

Векторы, которые используются в геномных проектах. Используется большое количество плазмидных и фаговых векторов. У каждого носителя геномной ДНК есть свои плюсы и минусы. Поскольку библиотек всегда несколько, при их конструировании необходимо выбрать оптимальное сочетание векторов, которое обеспечит максимальную репрезентативность генома.

Плазмиды. рUC. 90% сиквенсов делается на этой плазмиде. В очень редких случаях берется какой-то другой вектор, но такого же типа – небольшая высококопийная бактериальная плазмида. Используется она, т.к. это высококопийная плазмида, присутствует в клетке до 1000 копий, ее легко выделить и концентрация ее в препарате высокая, поэтому легко очищать. Получается ДНК высокого качества,….. Технологически такой вектор обеспечивает наивысшее качество сиквенса, поэтому основная масса секвенирования делается на таких плазмидах. К тому же процесс с использованием высококопийной плазмиды легко роботизировать. Недостатки, связанные с высокой копийностью:

  1. Некоторые фрагменты геномной ДНК в принципе невозможно клонировать в таких плазмидах, т.к. даже нормальный клеточный ген, если число его копий многократно возрастает, может оказаться токсичным для клетки. Эукариотические гены тоже могут быть токсичными для бактериальной клетки. 5-10% генома в таком векторе клонировать нельзя из-за проблемы токсичности.

  2. В такие векторы нельзя клонировать протяженные фрагменты ДНК длиной больше нескольких т.н.п. Когда в pUC делаются вставки по 20-30 т.н.п., плазмиды становятся нестабильными, т.к. копийность у плазмиды та же самая, около 50% ДНК в клетке может оказаться плазмидной. Возникает мощное селективное давление, чтобы уменьшить количество ДНК. Постоянно идут процессы рекомбинации, достаточно легко может происходить реорганизация, в первую очередь делеции и инверсии. Любая перестройка плазмиды в сторону уменьшения будет подхвачена естественным отбором. Относительно стабильными оказываются вставки размером не более 1,5-2 т.н.п.

Фаговые векторы. У них всегда больше емкость: если инсерционный вектор, емкость около 10? т.н.п., если вектор замещения фага лямбда – 20? т.н.п. К тому же при размножении бактериофага не стоит вопрос токсичности, т.к. при размножении фага клетка погибает в любом случае, а фаг реплицировать и упаковать свою ДНК успеет. Это единственная причина, по которой фаговые векторы до сих пор используются в геномных проектах. За исключением очень экзотических ситуаций у клонированных в фаговом векторе генов не имеется шанса воспрепятствовать размножению фага, и если выбирать правильные штаммы фагов, то проблем с перестройками меньше. Считается, что фаговые векторы замещения достаточно стабильны, и их до сих пор используют в крупных геномных проектах, когда нужно закрыть пробелы, которые никак не клонируются в других библиотеках. Недостатки: ДНК фага выделять гораздо менее удобно (сложнее методика, гораздо более трудоемко, автоматизировать сложнее). Поэтому фаговые векторы обычно используются на стадии финиширования, когда нужно закрыть пробелы.

Следующий по емкости – космидный вектор. Это гибрид плазмиды и бактериофага. Картинка неправильная: должно быть 2 cos-сайта. До начала 90-х это были векторы с максимальной емкостью (увеличена по сравнению с бактериофагом в 2 раза). Размер космиды: 53 т.н.п. (максимум, который помещается в головку фага лямбда) минус размер самого вектора – это 45-51 т.н.п. емкости. Нормальная космида несет 2 cos-сайта, т.к. фаг нормально пакует в головку линейную ДНК между двумя cos-сайтами. Приготовление космидной библиотеки – гораздо более трудоемкая методика, но такие библиотеки считаются библиотеками хорошего качества, поскольку если получен высокий титр фаговых частиц, то ДНК не надо реамплифицировать, библиотека стабильна и долго хранится. В любой момент можно инфицировать такими космидами бактериальные клетки и получить соответствующие гены.

Следующие по времени разработки векторы – это дрожжевые искусственные хромосомы. Эти векторы специально разработаны под проект «Геном человека». Эта программа официально стартовала в конце 90-х. Первая стадия проекта заключалась в разработке векторов. Специально под проект разрабатывались векторы с максимальной емкостью, которую можно было представить, на основе механизма сегрегации и репликации дрожжевых хромосом. Они были разработаны, на них были построены библиотеки. Емкость стандартного дрожжевого вектора – порядка 600 т.н.п., а мега-YAC – 1.4 миллиарда. Т.е. можно получить 6-7 тыс. клонов, и это будет весь геном человека. Поработали с ними лет 5, получили библиотеки, и где-то в середине 90-х выяснилось, что эти дрожжевые клоны с крупными вставками очень нестабильны. ДНК плохо хранится, ее нужно поддерживать в дрожжах, а тогда возникает та же ситуация, что и с крупными вставками в плазмидах бактерий, только в гораздо более суровом варианте: множественные внутренние реорганизации, делеции, транслокации и т.д. С таким трудом прокартированнные библиотеки, привязанные к физическим картам, оказались ни на что не годными, поскольку это уже не та ДНК, которая была в исходном геноме человека.

Дрожжевые искусственные хромосомы используются до сих пор, но с учетом этих вещей. Они используются для многих специализированных методов исследования генома, поскольку они все равно имеют свое значение. Если нужен крупный фрагмент ДНК, его особо никуда не клонируешь. Дрожжевые искусственные хромосомы – линейный фрагмент ДНК, который должен нести 3 составных части. Как правило, такая дрожжевая хромосома имеет точку инициации репликации плазмид, для того чтобы нарабатывать ДНК в бактериях. Препарат сначала амплифицируется в бактериях, получают большое количество плазмидной ДНК, а потом приготавливаются плечи искусственной хромосомы. В обязательном порядке в вектор должны входить 3 селективных маркера (обозначены буквами X, Y и Z). Два из них должны быть в одном плече хромосомы, еще один – в другом. Плазмида линеаризуется: обычно какой-то фрагмент ДНК вставлен между теломерными участками, он вырезается одной рестриктазой, и получается линейная хромосома. Мини-хромосома – несколько т.н.п., реально такая структура могла бы реплицироваться в дрожжевых клетках, но есть какой-то минимальный размер, меньше которого они оказываются нестабильны. YAC меньше 100 т.н.п. не поддерживаются. Затем такая маленькая линейная хромосома режется рестриктазой, сайт для которой располагается в пределах одного из маркеров, в данном случае – маркера Z. В результате мы получаем 2 плеча хромосомы. На одном плече – теломера и 1 селективный маркер, на втором плече – центромера, второй селективный маркер и теломера. Затем геномная ДНК режется той же рестриктазой, это частичная рестрикция, фрагменты отбираются по размеру и лигируются с плечами хромосомы.

Продукты лигирования вводятся в дрожжевые сферопласты, это достаточно сложная и не очень эффективная методика. Затем эти дрожжи регенерируют клеточную стенку и высеваются на селективную среду. Селективная среда должна отбирать хромосомы, которые несут 2 маркера и, как правило, содержит индикатор на отсутствие разрезанного маркера. Это достаточно эффективная методика. Получается библиотека, достаточно высокий выход этих клонов. Плечи могут лигироваться друг с другом, но такие хромосомы без вставки ДНК нестабильны. Методика достаточно простая, космидную библиотеку сделать сложнее. Когда выяснилось, что эти искусственные хромосомы нестабильны, разрабатывались альтернативные векторы, и сейчас 2 типа таких векторов широко используются, на них делаются все библиотеки для геномных проектов.

Секвенируются бактериальные искусственные хромосомы. Это достаточно громко звучит, но фактически это мини-производные от плазмиды Е. coliF-фактора. От него остается точка инициации репликации и система распределения плазмиды по дочерним клеткам. F-плазмида нестабильна, число копий поддерживается в клетке на том же уровне, что и число копий бактериальных хромосом. В медленно растущих клетках будет всегда 1 копия F-плазмиды, в быстрорастущих – чуть больше. При такой низкой копийности должна быть система распределения по дочерним клеткам. Это относительно небольшая плазмида, векторов таких достаточно много, все они отличаются дополнительными сайтами, вставленными в плазмиду. Обычно сайт антибиотикорезистентности и обычно достаточно сложная система клонирования используется.

Должны быть сайты, в которые могут встраиваться интересующие фрагменты, и они стандартно находятся посреди lacZ-гена. BAC веткора стабильны со вставками до 300 т.н.п., а реально работа обычно идет со вставками 130-150 т.н.п. Не всегда имеет смысл до предела догонять емкость.

Еще один вектор такого же плана – это искусственные хромосомы на основе фага Р1. Это крупный фаг, более 100 т.н.п. В клетке он существует в виде плазмиды, не встраиваясь в хромосому. Может быть лизогенным. Это природная плазмида, рассчитанная на подержание достаточно крупного репликона.

На основе фага Р1 разработаны два типа векторов. Первый – эквивалент векторов на основе фага лямбда: есть векторы замещения, есть векторы типа космид, которые используют систему упаковки фага Р1. Объем этих векторов ограничен емкостью головки фага, порядка 125 т.н.п. Этот вектор сохраняет преимущества вектора на основе фага лямбда и имеет еще большую емкость. На основании этого фага разработан и второй вектор – Р1-искусственные хромосомы (PAC). Емкость такая же, как и у BAC, – стабильны со вставками до 300 т.н.п. Библиотеки, построенные на фаговых и бактериальных искусственных хромосомах, будут различаться по своим свойствам, поэтому в геномных проектах используют и те, и другие.