Лекция_4_БИ_М_2014
.pdfБолее общая зависимость штрафа за делецию от величины делеции
•Простейшая модель делеции: элементарное событие – удаление одного символа. Протяженная делеция – несколько независимых событий удаления одного символа. Работает плохо.
•По-видимому более реалистичная модель делеция нескольких символов происходит за одно элементарное событие, а размер делеции является некоторой случайной величиной.
•Теперь надо просматривать все возможные варианты делеций.
Парное выравнивание – вставка промежутков
AKWTNLK----WAKV-ADVAGH-G
½½ ½½ ½ ½ ½½ ½ ½½½ ½
AK-TNVKAKLPWGKVGAHVAGEYG
-вставка\удаление промежутка
-продление промежутка
Парное выравнивание - подсчёт
Финальная оценка выравнивания – это сумма положительных очков и штрафных очков:
+Количество идентичных
+Количество похожих
-Количество вставленных промежутков
-Количество удлиненных промежутков Оценка выравнивания
Парное выравнивание
•Алгоритмы парного выравнивания пробуют все возможные варианты выравнивания.
•Результат – выравнивание с наивысшей оценкой.
•Различные системы оценки дают разные лучшие выравнивания!!!
Локальное выравнивание
•Локальным оптимальным выравниванием называется такое оптимальное выравнивание фрагментов последовательностей, при котором любое удлинение или укорочение фрагментов приводит только к худшему результату выравнивания.
•Локальному оптимальному выравниванию отвечает путь с наибольшей оценкой выравнивания, независимо от того, где он начинается и где кончается.
Система оценки - белки
Category |
Amino Acid |
Кислоты\амиды |
Asp (D) Glu(E) Asn (N) Gln (Q) |
Основания |
His (H) Lys (K) Arg (R) |
Ароматические |
Phe (F) Tyr (Y) Trp (W) |
Гидрофильные |
Ala (A) Cys (C) Gly (G) Pro (P) Ser (S) Thr (T) |
Гидрофобные |
Ile (I) Leu (L) Met (M) Val (V) |
Система оценки - белки
Похожесть: Положительная оценка для выравниваемых аминокислот из одной и той же группы.
Откуда берутся параметры для выравнивания?
Матрица замен: s (α, β) = log (pα β /pα pβ)
С одинаковой ли вероятностью
фиксируются замены различных
аминокислот?
GAT, Asp (D) |
Негативно |
Asp (D) |
Негативно |
Asp (D) |
GAT, |
||
заряженная |
GAC |
||||||
GAC |
|
|
заряженная |
|
|||
|
кислота, |
|
|
|
|||
|
|
|
кислота, |
|
|
||
|
|
5,3% |
|
|
|
||
|
|
|
5,3% |
|
|
||
|
|
|
|
|
|
||
? |
3 |
|
? |
-2 |
? 0 |
|
Glu (E) |
GAA, |
Val (V) |
GTT, |
Lys (K) |
AAA, |
|
GAG |
GTC, |
AAG |
||||
Негативно |
Гидрофобная |
Позитивно |
||||
заряженная |
|
GTA |
|
|||
|
кислота, |
GTG |
заряженная кислота, |
|||
кислота, 6,3% |
|
|||||
|
6,6% |
|
5,9% |
|
||
|
|
|
|
|||
|
|
|
|
|
lys found at 58% of arg sites
Emile Zuckerkandl and Linus Pauling (1965) considered substitution frequencies in 18 globins
(myoglobins and hemoglobins from human to lamprey).
Black: identity
Gray: very conservative substitutions (>40% occurrence) White: fairly conservative substitutions (>21% occurrence) Red: no substitutions observed