- •История развития геномных проектов. Геномная революция конца хх века
- •Геномные проекты. Иерархический и шотган-подход. Фазы геномного проекта
- •Библиотеки днк
- •11. Аннотация
- •15 Транскриптомные и протеомные подходы
- •16. Эволюция геномов
- •21.Хромосомы эу- и прокариот
- •22.Структура гена у различных организмов
- •23. Организация оперонов
- •24.Концепция минимального генома
- •25. Характерные черты геномов прокариот.
- •1.1.1.Геном вирусов
- •1.1.2.Нуклеоид бактериальной клетки
- •1.1.3.Геном архебактерий
- •1.1.4.Минимальный размер генома одноклеточных организмов
11. Аннотация
Аннотация.
Задачи – найти кодирующие последовательности, идентифицировать регуляторные последовательности.регуляция –промоторы энхансеры и опероны. Самое сложное идентификация функции гена.
Эта проблема имеет разную актуальность у прокариот и эукариот , для прокариот – это не проблема, для эукариот – колоссальная проблема. Необходимо найти стартовый кодон , однако если подвинуть на один нуклеотид, потом ещё на один, можно найти ещё рамки считывания , то есть каждая последовательность ДНК несёт шесть рамок считывания, из которых только одна реально является кодирующей, у прокариот выяснить это просто – графически рисуем все рамки, которые есть . На слайде верхние три рамки в одну сторону, нижние три в другую , сама длинная рамка считывания – и есть нужная. Для прокариот принцип поиска кодирующих последовательностей – самый простой , рисуем рамки , берём набор самых длинных рамок, не перекрывающихся с друг другом , это и будет с вероятностью 90-95% ген этого организма. Это связано с двумя фактами – во-первых, 90% ДНК у прокариот кодирующая, и кодирующие последовательности непрерывны.
Для эукариот существенно осложняется задача тем, что процент кодирующей ДНК гораздо ниже , кодирующая ДНК разбросана по геному как попало , так как экзоны разорваны интронами . Однако для растений поиск кодирующих последовательностей это меньшая проблема , так как у них гены компактные , интроны относительно короткие обычно не более пары сотен нуклеотидных пар, у человека размер интрона неограничен, может быть и сто тысяч н.п. Для генов позвоночных животных верхней границы для интрона нет в связи с тем, как работает аппарат сплайсинга , он достаточно надежно находит границы экзонов, даже если они на больших расстояниях друг от друга. Не было бы проблемы, если бы можно было легко определить кодирующую последовательность, однако подход применяемый в случае прокариот не подходит, так как возможные рамки считывания могут быть очень короткими , по техническим причинам велика вероятность, что такие рамки будут найдены в некодирующих областях. Стандарный размер экзона у позвоночных животных не превышает 120-150 н.п , то есть фрагмент кодирующей последовательности , то сеть эта цифра в два раза меньше того, что случайным образом находит компьютер. К счастью, кодирующая последовательность отличается по нуклеотидному составу от некодирующей последовательности , основная причина, по которой такое отличие есть, заключается в том, что каждый организм несёт определенный набор тРНК, есть три варианта амк, кодирующихся шестью кодонами, достаточно много тех амк, кодирующихся четырьмя кодонами , некторые тремя, двумя и только триптофан и метионин кодируются одни кодоном, а каждому из этих кодонов соответствует своя тРНК , генов тРНК у высших организмов много - от сотни до тысячи, то есть каждому из этих кодонов будет соответствовать разное количество тРНК и эффективность трансляции будет зависеть от того, с какой вероятностью тРНК попадает в сайт рибосом, если соответствующему кодону много соответствующих тРНК , то рибосомы быстро включат аминокислоту и двинуться дальше , если одна или две молекулы, то синтез белка будет идти значительно медленнее , то есть у каждого организма есть предпочтительные кодоны и есть нежелательные кодоны , в соответствии с тем, сколько тРНК соответствует каждому из них , те гены, которые экспрессируются интенсивно с течением времени ген будет приближаться к оптимальному для организма , то есть интенсивно экспрессирующиеся гены используют практически только оптимальные кодоны , но даже для слабо экспрессирующихся генов всё равно кодонный спектр будет приближаться к оптимальному спектру для этого организма . Помогает учёт сайта сплайсинга, но к сожалению здесь нет особой консервативности , абсолютно консервативны только два нуклеотида по концам интронов АГ и ГУ , есть также некотрая консервативность соседних нуклеотидов , но она недостаточна и есть ещё относительная консервативность участка вокруг точки ветвления 9адениловый остаток и пиримидиновый тракт) , эту информацию тоже можно использовать, но она тоже ненадёжная и её недостаточно для того, чтобы находить границы интронов . Есть другие факторы, которые также могут использоваться для поиска кодирующей последовательности -характерные промоторные элементы , ТАТА-бокс , однако она встречается и спонтанно с достаточно высокой частотой , для млекопитающих SPG-острова , они присутствуют не везде, но практически везде где есть такой островок – практически всегда это промоторная область гена. Большую помощь оказывает использование гомологии с уже известными кодирующими последовательностями , кодирующие последовательности по сравнению с некодирующими гораздо более консервативные , экзоны более консервативны, чем интроны . Даже если в новом геноме интроны находятся в других местах, используя гомологию можно найти гомологичные кодирующие последовательности и четко определить , где может быть интрон, экзон . То есть несколько показателей, которые характеризуют кодирующую последовательность эукариотического генома, но не один из этих показателей недостаточен сам по себе для того, чтобы надежно её идентифицировать.
№ 12 Молекулярная база данных-это коллекция данных ( последовательностей) , которые упорядочены, аннотированы, индексирован ( приспособлены к поиску), регулярно обновляются, имеют перекрестные ссылки
Они нужны для :
Обеспечивают взрывоопасный рост объема информации
Многие экспериментальные данные не публикуются в литературе, их можно найти только в базе данных
Позволяют использовать мощные инструменты в биологических исследованиях
GenBank – база данных, содержащие последовательности ДНК, расположение на севере Национального центра биотехнологической информация США.
Задачи:
создание автоматизированных систем для храненияи анализа данных по малекулярной биологии, биомедицине и генетики.
Компьютерная обработка данных полученных в исследованиях
Координирование усилий по накоплению биотехнологической информации по всему миру.
Содействия широкому использованию баз данных и програмного обеспечения для исследователей в облости биотехнологии и мед персонала.
DDBJ (DNA Data Bank of Japan)японская база Днк
- электронный ресурс с информацией о нуклеотидных последовательностях, относящихся к различным генам и организмам, Описание каждой последовательности включает в себя: номер в базе данных, видовую принадлежность, источник ДНК (линейный материал, клон, географическое происхождение взятой для анализа особи), фамилия и инициалы исследователей, которые получили эти последовательности и опубликовали по ним работы, описании последовательности, ее функциональной нагрузки и собственная нуклеотидная последовательность.
Исследователи Центра эволюционнойц функциональной геномики Аризонского института создали информационную базу «FlyExpress»,основанную на интернет –технологиях и использующую современные приемы обработки информации и изображений, которые позволяют ученым быстро анализировать экспрессию генов дрозофилы по изображению эмбрионов.
№13 функциональная геномика
Занимается такими вопросами как….
- какие функции выполняет ген
- как осуществляется его регеляция
- как его активность сказывается на других генах
Стремиться сначала предсказать фукцию тех или иных биополимеров с помощью компьютерного анализа, и только затем переходит к эксперементальной праверке в пробирке предсказанной функции.
Эволюционный анализ постепенно становится основным приемом. Малекулярные эволюционисты пользуются методами сравнительной геномики и биоинформатики для анализа количества мутаций, которые последовтельности нуклеотидов в ДНК претерпевают в процессе эволюции_ позволяют исследователям идентифицировать функционально важные области генов и создавать молекулярно временную шкалу видовой эволюции.
два типо методических подходов:
тотальный – одновременные количественные изменения всех транскриптов или белков или метаболитов организма
индивидуальный – инсерционная инактивация , сайленсинг или сверхэкспрессия отдельных генов с последующим исследованием фенотипа организма
методы индивидуального подхода
прямая генетика ( получение набора мутантов , анализ их фенотипов и идентификация мутироваашего гена)
основной подход – транспозоновый мутагенез:
транспозон несет селективный маркер
для многих транспозонов после мутагенеза в генома присутствует только 1 копия транспозона
б) обратная генетика ( получение мутации конкретного гена с последующим поиском фенотипа)
14. Возможности и ограничения компьютерного анализа проблему расшифровки можно решить с помощью высокоэфективных компьютерных програм. Эти програмы пригодны как структурных, так и биологических особеностей последовательностей.
Хранение информации о первичной структуре
Ввод данных чисто осуществляют путем определения последовательности в компьютере после прочтения и регистрации данных секвенирующего геля. Имеются также програмы для прямого ввода данных. Такие програмы позволяют свести к минимуму ошибки , допускаемые при неправильном считываний гелей или неточной регистрации данных.
Структурный анализ
-сложно вычислить нуклеотидный состав, выявить участки багиты пуринами, пиримидинами или определеными сочетаниями оснований
-предсказание тех продуктов, которые будут получены при совместном действии двуз или нескольких эндуклиаз => для подверждения данных секвенирования путем сравнительного анализа ожидаемого и реального результатов действия эндонуклиз.
- данные о гомологии или частичной гомологии различных последовательностей (эволюции на молекулярном уровне).
-предсказание стабильной внутремолекулярной вторичной структуры одноточечных РНК и ДНК.
Билогическое значение: можно перевести ин-ю с языка нуклеотидов на язык аминакислот в соответствии с правилами генетического кода.