Выровняйте несколько последовательностей с помощью прогрессивного метода
SeqsMultiAligned = multialign(Seqs)
SeqsMultiAligned = multialign(Seqs, Tree)
multialign(..., 'PropertyName', PropertyValue,...)
multialign(..., 'Weights', WeightsValue)
multialign(..., 'ScoringMatrix', ScoringMatrixValue)
multialign(..., 'SMInterp', SMInterpValue)
multialign(..., 'GapOpen', GapOpenValue)
multialign(..., 'ExtendGap', ExtendGapValue)
multialign(..., 'DelayCutoff', DelayCutoffValue)
multialign(..., 'UseParallel', UseParallelValue)
multialign(..., 'Verbose', VerboseValue)
multialign(..., 'ExistingGapAdjust', ExistingGapAdjustValue)
multialign(..., 'TerminalGapAdjust', TerminalGapAdjustValue)
Seqs | Вектор структур с полями
|
Tree | Филогенетическое дерево вычисляется с функцией seqneighjoin или seqlinkage. |
WeightsValue | Свойство выбрать метод взвешивания последовательности. Введите 'THG' (значение по умолчанию) или 'equal'. |
ScoringMatrixValue | Любое из следующего:
ПримечаниеЕсли необходимо скомпилировать |
SMInterpValue | Свойство задать, ли включена линейная интерполяция матриц выигрыша или прочь. Когда false, матрица выигрыша присвоена фиксированной области значений в зависимости от расстояний между двумя профилями (или последовательности) быть выровненным. Значением по умолчанию является true. |
GapOpenValue | Скаляр или функция, заданная с помощью @. Если вы вводите функцию, multialign передает четыре значения функции: средняя оценка для двух совпадающих остатков (sm), средняя оценка для двух несовпадающих остатков (sx), и, длина обоих профилей или последовательностей (len1, len2). Значением по умолчанию является @(sm,sx,len1,len2) 5*sm. |
ExtendGapValue | Скаляр или функция, заданная с помощью @. Если вы вводите функцию, multiialign передает четыре значения функции: средняя оценка для двух совпадающих остатков (sm), средняя оценка для двух несовпадающих остатков (sx) и длина обоих профилей или последовательностей (len1, len2). Значением по умолчанию является @(sm,sx,len1,len2) sm/4. |
DelayCutoffValue | Свойство задать пороговую задержку расходящихся последовательностей. Значением по умолчанию является единица, где последовательности с самой близкой последовательностью дальше, чем среднее расстояние задерживаются. |
UseParallelValue | Управляет вычислением попарных выравниваний с помощью parfor - циклы. Когда true и Parallel Computing Toolbox™ установлены, и parpool открыт, вычисление происходит параллельно. Если не будет никакого открытого parpool, но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и вычисление происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool, и автоматическое создание отключено, то вычисление использует parfor - циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то вычисление использует parfor - циклы в последовательном режиме. Значением по умолчанию является false, который использует циклы for в последовательном режиме. |
VerboseValue | Свойство управлять отображением последовательностей с информацией о последовательности. Значением по умолчанию является false. |
ExistingGapAdjustValue | Свойство управлять автоматической настройкой на основе существующих разрывов. Значением по умолчанию является true. |
TerminalGapAdjustValue | Свойство настроить штраф за открытие разрыва в концах последовательности. Значением по умолчанию является false. |
| Вектор структур (то же самое как Когда |
выполняет прогрессивное несколько выравнивание для набора последовательностей (SeqsMultiAligned = multialign(Seqs)Seqs). Попарные расстояния между последовательностями вычисляются после попарного выравнивания с Gonnet, выигрывая матрицу и затем путем подсчета пропорции сайтов, на которых каждая пара последовательностей отличаются (игнорирующие разрывы). Дерево руководства вычисляется соединяющим соседа методом, принимающим равное отклонение и независимость эволюционных оценок расстояния.
использует дерево (SeqsMultiAligned = multialign(Seqs, Tree)Tree) в качестве руководства для прогрессивного выравнивания. Последовательности (Seqs) должны иметь тот же порядок как листы в дереве (Tree) или использовать поле ('Header' или 'Name'), чтобы идентифицировать последовательности.
multialign(..., ' вводит дополнительные аргументы как имя свойства / пары значения свойства. Задайте одно или несколько свойств в любом порядке. Заключите каждый PropertyName', PropertyValue,...)PropertyName в одинарные кавычки. Каждый PropertyName является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:
multialign(..., 'Weights', выбирает метод взвешивания последовательности. Веса подчеркивают очень расходящиеся последовательности путем масштабирования матрицы выигрыша и разрывают штрафы. Более близкие последовательности получают меньшие веса. WeightsValue)
Значения свойства Weights:
'THG' (значение по умолчанию) — Метод Томпсона-Хиггинса-Гибсона с помощью филогенетических древовидных расстояний ответвления взвешивается их толщиной.
'equal' — Присваивает тот же вес каждой последовательности.
multialign(..., 'ScoringMatrix', выбирает выигрывающую матрицу (ScoringMatrixValue)ScoringMatrixValue) для прогрессивного выравнивания. Соответствуйте и не сочетайтесь, очки интерполированы от ряда выигрыша матриц путем считания расстояний между двумя профилями или последовательностями выровненными. Первая матрица соответствует наименьшему расстоянию и последней матрице к самому большому расстоянию. Промежуточные расстояния вычисляются с помощью линейной интерполяции.
multialign(..., 'SMInterp', , то, когда SMInterpValue)SMInterpValue является false, выключает линейную интерполяцию матриц выигрыша. Вместо этого каждый предоставленная матрица выигрыша присвоен фиксированной области значений в зависимости от расстояний между двумя профилями или выравниваемыми последовательностями.
multialign(..., 'GapOpen', задает начальный штраф за открытие разрыва. GapOpenValue)
multialign(..., 'ExtendGap', задает начальный штраф за расширение разрыва. ExtendGapValue)
multialign(..., 'DelayCutoff', задает порог, чтобы задержать выравнивание расходящихся последовательностей, самый близкий сосед которых более далек, чем DelayCutoffValue)
(DelayCutoffValue) * (median patristic distance between sequences)
multialign(..., 'UseParallel', задает, использовать ли UseParallelValue)parfor - циклы при вычислении попарных выравниваний. Когда true и Parallel Computing Toolbox установлены, и parpool открыт, вычисление происходит параллельно. Если не будет никакого открытого parpool, но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и вычисление происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool, и автоматическое создание отключено, то вычисление использует parfor - циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то вычисление использует parfor - циклы в последовательном режиме. Значением по умолчанию является false, который использует циклы for в последовательном режиме.
multialign(..., 'Verbose', , то, когда VerboseValue)VerboseValue является true, включает многословие.
Остающиеся входные дополнительные аргументы походят на функциональный profalign и используются через каждый шаг прогрессивного выравнивания профилей.
multialign(..., 'ExistingGapAdjust', , то, когда ExistingGapAdjustValue)ExistingGapAdjustValue является false, выключает автоматическую настройку на основе существующих разрывов специфичных для положения штрафов за открытие разрыва.
Когда ExistingGapAdjustValue является true для каждого положения профиля, profalign пропорционально понижает штраф за открытие разрыва к штрафу расширения разрыва на основе пропорции разрывов, найденных в непрерывных символах и на весе входного профиля.
multialign(..., 'TerminalGapAdjust', , то, когда TerminalGapAdjustValue)TerminalGapAdjustValue является true, настраивает штраф за открытие разрыва в концах последовательности, чтобы быть равным штрафу за расширение разрыва.
Этот пример показывает, как выровнять несколько последовательностей белка.
Используйте функцию fastaread, чтобы считать p53samples.txt, FASTA-отформатированный файл, включенный с Bioinformatics Toolbox™, который содержит p53 последовательности белка семи разновидностей.
p53 = fastaread('p53samples.txt')p53 = 7x1 struct array with fields:
Header
Sequence
Вычислите попарные расстояния между каждой парой последовательностей с помощью 'GONNET' выигрыш матрицы.
dist = seqpdist(p53,'ScoringMatrix','GONNET');
Создайте филогенетическое дерево с помощью невзвешенного среднего расстояния (UPGMA) метод. Это дерево будет использоваться в качестве направляющего дерева на следующем шаге прогрессивного выравнивания.
tree = seqlinkage(dist,'average',p53)Phylogenetic tree object with 7 leaves (6 branches)
Выполните прогрессивное выравнивание с помощью семейства PAM, выигрывающего матрицы.
ma = multialign(p53,tree,'ScoringMatrix',... {'pam150','pam200','pam250'})
ma = 7x1 struct array with fields:
Header
Sequence
showalignment(ma)

Введите массив последовательностей.
seqs = {'CACGTAACATCTC','ACGACGTAACATCTTCT','AAACGTAACATCTCGC'};
Способствуйте завершениям с разрывами в выравнивании.
multialign(seqs,'terminalGapAdjust',true) ans = --CACGTAACATCTC-- ACGACGTAACATCTTCT -AAACGTAACATCTCGC
Сравните выравнивание без корректировки разрыва завершения.
multialign(seqs) ans = CA--CGTAACATCT--C ACGACGTAACATCTTCT AA-ACGTAACATCTCGC
align2cigar | hmmprofalign | multialignread | multialignwrite | nwalign | profalign | seqconsensus | seqneighjoin | seqprofile | showalignment