Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Документ Microsoft Word (13).doc
Скачиваний:
11
Добавлен:
26.09.2019
Размер:
500.22 Кб
Скачать

11. Аннотация

Аннотация.

Задачи – найти кодирующие последовательности, идентифицировать регуляторные последовательности.регуляция –промоторы энхансеры и опероны. Самое сложное идентификация функции гена.

Эта проблема имеет разную актуальность у прокариот и эукариот , для прокариот – это не проблема, для эукариот – колоссальная проблема. Необходимо найти стартовый кодон , однако если подвинуть на один нуклеотид, потом ещё на один, можно найти ещё рамки считывания , то есть каждая последовательность ДНК несёт шесть рамок считывания, из которых только одна реально является кодирующей, у прокариот выяснить это просто – графически рисуем все рамки, которые есть . На слайде верхние три рамки в одну сторону, нижние три в другую , сама длинная рамка считывания – и есть нужная. Для прокариот принцип поиска кодирующих последовательностей – самый простой , рисуем рамки , берём набор самых длинных рамок, не перекрывающихся с друг другом , это и будет с вероятностью 90-95% ген этого организма. Это связано с двумя фактами – во-первых, 90% ДНК у прокариот кодирующая, и кодирующие последовательности непрерывны.

Для эукариот существенно осложняется задача тем, что процент кодирующей ДНК гораздо ниже , кодирующая ДНК разбросана по геному как попало , так как экзоны разорваны интронами . Однако для растений поиск кодирующих последовательностей это меньшая проблема , так как у них гены компактные , интроны относительно короткие обычно не более пары сотен нуклеотидных пар, у человека размер интрона неограничен, может быть и сто тысяч н.п. Для генов позвоночных животных верхней границы для интрона нет в связи с тем, как работает аппарат сплайсинга , он достаточно надежно находит границы экзонов, даже если они на больших расстояниях друг от друга. Не было бы проблемы, если бы можно было легко определить кодирующую последовательность, однако подход применяемый в случае прокариот не подходит, так как возможные рамки считывания могут быть очень короткими , по техническим причинам велика вероятность, что такие рамки будут найдены в некодирующих областях. Стандарный размер экзона у позвоночных животных не превышает 120-150 н.п , то есть фрагмент кодирующей последовательности , то сеть эта цифра в два раза меньше того, что случайным образом находит компьютер. К счастью, кодирующая последовательность отличается по нуклеотидному составу от некодирующей последовательности , основная причина, по которой такое отличие есть, заключается в том, что каждый организм несёт определенный набор тРНК, есть три варианта амк, кодирующихся шестью кодонами, достаточно много тех амк, кодирующихся четырьмя кодонами , некторые тремя, двумя и только триптофан и метионин кодируются одни кодоном, а каждому из этих кодонов соответствует своя тРНК , генов тРНК у высших организмов много - от сотни до тысячи, то есть каждому из этих кодонов будет соответствовать разное количество тРНК и эффективность трансляции будет зависеть от того, с какой вероятностью тРНК попадает в сайт рибосом, если соответствующему кодону много соответствующих тРНК , то рибосомы быстро включат аминокислоту и двинуться дальше , если одна или две молекулы, то синтез белка будет идти значительно медленнее , то есть у каждого организма есть предпочтительные кодоны и есть нежелательные кодоны , в соответствии с тем, сколько тРНК соответствует каждому из них , те гены, которые экспрессируются интенсивно с течением времени ген будет приближаться к оптимальному для организма , то есть интенсивно экспрессирующиеся гены используют практически только оптимальные кодоны , но даже для слабо экспрессирующихся генов всё равно кодонный спектр будет приближаться к оптимальному спектру для этого организма . Помогает учёт сайта сплайсинга, но к сожалению здесь нет особой консервативности , абсолютно консервативны только два нуклеотида по концам интронов АГ и ГУ , есть также некотрая консервативность соседних нуклеотидов , но она недостаточна и есть ещё относительная консервативность участка вокруг точки ветвления 9адениловый остаток и пиримидиновый тракт) , эту информацию тоже можно использовать, но она тоже ненадёжная и её недостаточно для того, чтобы находить границы интронов . Есть другие факторы, которые также могут использоваться для поиска кодирующей последовательности -характерные промоторные элементы , ТАТА-бокс , однако она встречается и спонтанно с достаточно высокой частотой , для млекопитающих SPG-острова , они присутствуют не везде, но практически везде где есть такой островок – практически всегда это промоторная область гена. Большую помощь оказывает использование гомологии с уже известными кодирующими последовательностями , кодирующие последовательности по сравнению с некодирующими гораздо более консервативные , экзоны более консервативны, чем интроны . Даже если в новом геноме интроны находятся в других местах, используя гомологию можно найти гомологичные кодирующие последовательности и четко определить , где может быть интрон, экзон . То есть несколько показателей, которые характеризуют кодирующую последовательность эукариотического генома, но не один из этих показателей недостаточен сам по себе для того, чтобы надежно её идентифицировать.

12 Молекулярная база данных-это коллекция данных ( последовательностей) , которые упорядочены, аннотированы, индексирован ( приспособлены к поиску), регулярно обновляются, имеют перекрестные ссылки

Они нужны для :

Обеспечивают взрывоопасный рост объема информации

Многие экспериментальные данные не публикуются в литературе, их можно найти только в базе данных

Позволяют использовать мощные инструменты в биологических исследованиях

GenBank база данных, содержащие последовательности ДНК, расположение на севере Национального центра биотехнологической информация США.

Задачи:

  1. создание автоматизированных систем для храненияи анализа данных по малекулярной биологии, биомедицине и генетики.

  2. Компьютерная обработка данных полученных в исследованиях

  3. Координирование усилий по накоплению биотехнологической информации по всему миру.

  4. Содействия широкому использованию баз данных и програмного обеспечения для исследователей в облости биотехнологии и мед персонала.

DDBJ (DNA Data Bank of Japan)японская база Днк

- электронный ресурс с информацией о нуклеотидных последовательностях, относящихся к различным генам и организмам, Описание каждой последовательности включает в себя: номер в базе данных, видовую принадлежность, источник ДНК (линейный материал, клон, географическое происхождение взятой для анализа особи), фамилия и инициалы исследователей, которые получили эти последовательности и опубликовали по ним работы, описании последовательности, ее функциональной нагрузки и собственная нуклеотидная последовательность.

Исследователи Центра эволюционнойц функциональной геномики Аризонского института создали информационную базу «FlyExpress»,основанную на интернет –технологиях и использующую современные приемы обработки информации и изображений, которые позволяют ученым быстро анализировать экспрессию генов дрозофилы по изображению эмбрионов.

13 функциональная геномика

Занимается такими вопросами как….

- какие функции выполняет ген

- как осуществляется его регеляция

- как его активность сказывается на других генах

Стремиться сначала предсказать фукцию тех или иных биополимеров с помощью компьютерного анализа, и только затем переходит к эксперементальной праверке в пробирке предсказанной функции.

Эволюционный анализ постепенно становится основным приемом. Малекулярные эволюционисты пользуются методами сравнительной геномики и биоинформатики для анализа количества мутаций, которые последовтельности нуклеотидов в ДНК претерпевают в процессе эволюции_ позволяют исследователям идентифицировать функционально важные области генов и создавать молекулярно временную шкалу видовой эволюции.

два типо методических подходов:

  • тотальный – одновременные количественные изменения всех транскриптов или белков или метаболитов организма

  • индивидуальный – инсерционная инактивация , сайленсинг или сверхэкспрессия отдельных генов с последующим исследованием фенотипа организма

методы индивидуального подхода

  1. прямая генетика ( получение набора мутантов , анализ их фенотипов и идентификация мутироваашего гена)

основной подход – транспозоновый мутагенез:

  • транспозон несет селективный маркер

  • для многих транспозонов после мутагенеза в генома присутствует только 1 копия транспозона

б) обратная генетика ( получение мутации конкретного гена с последующим поиском фенотипа)

14. Возможности и ограничения компьютерного анализа проблему расшифровки можно решить с помощью высокоэфективных компьютерных програм. Эти програмы пригодны как структурных, так и биологических особеностей последовательностей.

Хранение информации о первичной структуре

Ввод данных чисто осуществляют путем определения последовательности в компьютере после прочтения и регистрации данных секвенирующего геля. Имеются также програмы для прямого ввода данных. Такие програмы позволяют свести к минимуму ошибки , допускаемые при неправильном считываний гелей или неточной регистрации данных.

Структурный анализ

-сложно вычислить нуклеотидный состав, выявить участки багиты пуринами, пиримидинами или определеными сочетаниями оснований

-предсказание тех продуктов, которые будут получены при совместном действии двуз или нескольких эндуклиаз => для подверждения данных секвенирования путем сравнительного анализа ожидаемого и реального результатов действия эндонуклиз.

- данные о гомологии или частичной гомологии различных последовательностей (эволюции на молекулярном уровне).

-предсказание стабильной внутремолекулярной вторичной структуры одноточечных РНК и ДНК.

Билогическое значение: можно перевести ин-ю с языка нуклеотидов на язык аминакислот в соответствии с правилами генетического кода.