Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:

Лекция_4_БИ_М_2014

.pdf
Скачиваний:
11
Добавлен:
08.03.2016
Размер:
2.02 Mб
Скачать

Более общая зависимость штрафа за делецию от величины делеции

Простейшая модель делеции: элементарное событие – удаление одного символа. Протяженная делеция – несколько независимых событий удаления одного символа. Работает плохо.

По-видимому более реалистичная модель делеция нескольких символов происходит за одно элементарное событие, а размер делеции является некоторой случайной величиной.

Теперь надо просматривать все возможные варианты делеций.

Парное выравнивание – вставка промежутков

AKWTNLK----WAKV-ADVAGH-G

½½ ½½ ½ ½ ½½ ½ ½½½ ½

AK-TNVKAKLPWGKVGAHVAGEYG

-вставка\удаление промежутка

-продление промежутка

Парное выравнивание - подсчёт

Финальная оценка выравнивания – это сумма положительных очков и штрафных очков:

+Количество идентичных

+Количество похожих

-Количество вставленных промежутков

-Количество удлиненных промежутков Оценка выравнивания

Парное выравнивание

Алгоритмы парного выравнивания пробуют все возможные варианты выравнивания.

Результат – выравнивание с наивысшей оценкой.

Различные системы оценки дают разные лучшие выравнивания!!!

Локальное выравнивание

Локальным оптимальным выравниванием называется такое оптимальное выравнивание фрагментов последовательностей, при котором любое удлинение или укорочение фрагментов приводит только к худшему результату выравнивания.

Локальному оптимальному выравниванию отвечает путь с наибольшей оценкой выравнивания, независимо от того, где он начинается и где кончается.

Система оценки - белки

Category

Amino Acid

Кислоты\амиды

Asp (D) Glu(E) Asn (N) Gln (Q)

Основания

His (H) Lys (K) Arg (R)

Ароматические

Phe (F) Tyr (Y) Trp (W)

Гидрофильные

Ala (A) Cys (C) Gly (G) Pro (P) Ser (S) Thr (T)

Гидрофобные

Ile (I) Leu (L) Met (M) Val (V)

Система оценки - белки

Похожесть: Положительная оценка для выравниваемых аминокислот из одной и той же группы.

Откуда берутся параметры для выравнивания?

Матрица замен: s (α, β) = log (pα β /pα pβ)

С одинаковой ли вероятностью

фиксируются замены различных

аминокислот?

GAT, Asp (D)

Негативно

Asp (D)

Негативно

Asp (D)

GAT,

заряженная

GAC

GAC

 

 

заряженная

 

 

кислота,

 

 

 

 

 

 

кислота,

 

 

 

 

5,3%

 

 

 

 

 

 

5,3%

 

 

 

 

 

 

 

 

?

3

 

?

-2

? 0

 

Glu (E)

GAA,

Val (V)

GTT,

Lys (K)

AAA,

GAG

GTC,

AAG

Негативно

Гидрофобная

Позитивно

заряженная

 

GTA

 

 

кислота,

GTG

заряженная кислота,

кислота, 6,3%

 

 

6,6%

 

5,9%

 

 

 

 

 

 

 

 

 

 

lys found at 58% of arg sites

Emile Zuckerkandl and Linus Pauling (1965) considered substitution frequencies in 18 globins

(myoglobins and hemoglobins from human to lamprey).

Black: identity

Gray: very conservative substitutions (>40% occurrence) White: fairly conservative substitutions (>21% occurrence) Red: no substitutions observed