Лекция_4_БИ_М_2014
.pdfПопарное
выравнивание
последовательностей
www.oddee.com/
Парное выравнивание – методы сравнения
•Глобальное выравнивание – находит лучшее решение для целых последовательностей.
•Локальное выравнивание – находит похожие районы в двух последовательностях.
Глобальное |
Локальное |
|
_____ _______ |
__ |
____ |
__ ____ ____ |
__ |
____ |
Сколько существует выравниваний для одной последовательности по отношению к другой последовательности?
Парное выравнивание
Человеческий гемоглобин (HH):
VLSPADKTNVKAAWGKVGAHAGYEG
Миоглобин кашалота (SWM):
VLSEGEWQLVLHVWAKVEADVAGHG
Парное выравнивание - идентичность
(HH)VLSPADKTNVKAAWGKVGAHAGYEG
||| |
| | || | |
| |
(SWM) VLSEGEWQLVLHVWAKVEADVAGHG
Процент идентичности: 36.000 (| only) (9 букв из 25 идентичны)
Парное выравнивание - похожесть
(HH)VLSPADKTNVKAAWGKVGAHAGYEG
||| . |
| | || | |
| |
(SWM) VLSEGEWQLVLHVWAKVEADVAGHG
Процент похожести: 40.000 (| и .) (9 букв идентичны и 1 сходная замена, и того 10 из 25 сходно)
Процент идентичности: 36.000 ( только |)
•Идентичность: подсчитывается количество совпадений и делится на длину выравниваемого региона
•Similarity (похожесть) : Менее формализованная величина
Как рассчитывают похожесть?
Система оценки - белки
Category |
Amino Acid |
Кислоты\амиды |
Asp (D) Glu(E) Asn (N) Gln (Q) |
Основания |
His (H) Lys (K) Arg (R) |
Ароматические |
Phe (F) Tyr (Y) Trp (W) |
Гидрофильные |
Ala (A) Cys (C) Gly (G) Pro (P) Ser (S) Thr (T) |
Гидрофобные |
Ile (I) Leu (L) Met (M) Val (V) |
Система оценки - белки
Похожесть: Положительная оценка для выравниваемых аминокислот из одной и той же группы.
Подмена задачи и обобщение
•Новая задача: написать одну последовательность под другой так, чтобы максимизировать сходство
Парное выравнивание – вставка промежутков (gaps)
(HH)VLSPADKTNVKAAWGKVGAH-AGYEG
½½½ . |
½ |
½ ½½ ½ ½½ ½ |
(SWM) VLSEGEWQLVLHVWAKVEADVAGH-G
• |
Gap Weight: |
4 |
• |
Gaps: |
2 |
•Процент похожести: 54.167 (11 букв идентичны и 1 сходная замена, итого 12 из 25)
•Процент идентичности: 45.833 (11 букв из 25 идентичны)