Добавил:
Upload Опубликованный материал нарушает ваши авторские права? Сообщите нам.
Вуз: Предмет: Файл:
Биоинформатика методичка.doc
Скачиваний:
326
Добавлен:
20.05.2015
Размер:
13.79 Mб
Скачать
  1. Визуализация сконструированного объекта в виде филогенетического дерева с помощью функции рlot Синтаксис

plot(Tree)

H = plot(...)

plot(..., 'Orientation', OrientationValue, ...)

Описание

plot(Tree) преобразует объект в фигуру типа филограма или кладограма. Значимые значения узлов филогенетического дерева, отображены в горизонтальном направлении. Вертикальные расстояния являются произвольными и не имеют никакого значения.

plot(..., 'Type', TypeValue, ...) определяет метод для визуализации филогенетического дерева. TypeValue - строка, определяющая способ для рисования филогенетического дерева. Варианты топологии филогенетических деревьев представлены на рисунке 38.

Доступные методы:

Метод

Внешний вид

'square' (default)

'angular'

'radial'

'equalangle'

'equaldaylight’

Рис. 38. Топология филогенетических деревьев, выполненных в программе Matlab c использованием опции TypeValue

plot(..., 'Orientation', OrientationValue, ...) определяет ориентацию корневого узла, и, следовательно, ориентация филограмы или кладограммы на рисунке, когда выбран тип построение 'square' или 'angular'. Доступные атрибуты:

'left' (default) - ориентация слева на право;

'right' – ориентация справа налево;

'top' - ориентация сверху вниз;

'bottom' – ориентация снизу вверх.

Варианты написания полной программы

Программа 1.

seqs = fastaread('pf01.fa')

distances = seqpdist(seqs,'Method','Jukes-Cantor','Alpha','DNA');

tree = seqlinkage(distances,'UPGMA',seqs);

h = plot(tree,'orient','left');

title('Neighbor-Joining Distance Tree of pyridoxine kinase using Jukes-Cantor model');

xlabel('Evolutionary distance')

Результат представлен на рисунке 39

Рис. 39. Филогенетическое дерево изученных последовательностей, по результатам выполнения программы 1

Программа 2

seqs = fastaread('pf01.fa')

distances = seqpdist(seqs,'method','jukes-cantor','indels','pairwise-delete','squareform',true);

NJtree = seqneighjoin(distances,'equivar',seqs);

h = plot(NJtree,'orient','left');

title('Neighbor-Joining Distance Tree of pyridoxine kinase using Jukes-Cantor model');

xlabel('Evolutionary distance')

Результат представлен на рисунке 40

Рис. 40 Филогенетическое дерево изученных последовательностей, по результатам выполнения программы 2

Программа 3

seqs = fastaread('pf01.fa')

dist = seqpdist(seqs,'Method','jukes-cantor', 'Indels', 'score','PairwiseAlignment', true );

tree = seqlinkage(dist,'UPGMA',seqs);

h = plot(tree,'orient','left');

title('Neighbor-Joining Distance Tree of pyridoxine kinase using Jukes-Cantor model');

xlabel('Evolutionary distance')

Результат представлен на рисунке 41

Рис. 41 Филогенетическое дерево изученных последовательностей, по результатам выполнения программы 3

Контрольные вопросы

  1. Что такое биоинформатика?

  2. Какую дату можно считать датой выделения биоинформатики в

  3. отдельную научную область?

  4. Где хранятся биоинформационные данные?

  5. Каковы цели биоинформатики?

  6. Какие задачи стоят перед биоинформатикой?

  7. Какие биологические последовательности называются гомологичными?

  8. Какую роль играет анализ гомологических последовательностей в расшифровке биологической информации?

  9. Какие типы выравнивания существуют?

Что называется выравниванием биологических последовательностей?

  1. Что такое глобальное выравнивание последовательностей?

  2. Что такое локальное выравнивание последовательностей?

Что такое множественное выравнивание?

Что такое оптимальное выравнивание?

  1. Для какого типа биологических последовательностей используются матрицы РАМ, BLOSUM и Gonnet?

  2. С какой целью проводится выравнивание?

  3. Какие программы используются для множественного выравнивания?

  4. Дайте характеристику формату FASTA? Для чего он используется?

  5. Какая команда Matlab используется для множественного выравнивания?

  6. Какая команда Matlab используется для чтения FASTA формата?

  7. На основании какой процедуры строится множественное выравнивание?

  8. Почему с точки зрения биолога локальное выравнивание может дать более значимые и точные результаты, чем глобальное выравнивания?

  9. Какими символами в окне результатов программы ClustalW2 обозначаются: одинаковая аминокислота; сходные аминокислоты; вставки; отсутствие сходства в последовательностях?

Что такое матрица РАМ?

Что такое филогения?

Что называется кластеризацией?

В чём суть метода наибольшей экономии?

  1. В чём суть метода наибольшего правдоподобия?

  2. Какая команда Matlab расчитывает попарное расстояние между последовательностями?

  3. Какая команда Matlab конструирует филогенетическое дерево?

  4. На основе какого принципа конструируется филогенетическое дерево в Matlab?