Выровняйте несколько последовательностей с помощью прогрессивного метода
SeqsMultiAligned = multialign(Seqs)
SeqsMultiAligned = multialign(Seqs, Tree)
multialign(..., 'PropertyName', PropertyValue,...)
multialign(..., 'Weights', WeightsValue)
multialign(..., 'ScoringMatrix', ScoringMatrixValue)
multialign(..., 'SMInterp', SMInterpValue)
multialign(..., 'GapOpen', GapOpenValue)
multialign(..., 'ExtendGap', ExtendGapValue)
multialign(..., 'DelayCutoff', DelayCutoffValue)
multialign(..., 'UseParallel', UseParallelValue)
multialign(..., 'Verbose', VerboseValue)
multialign(..., 'ExistingGapAdjust', ExistingGapAdjustValue)
multialign(..., 'TerminalGapAdjust', TerminalGapAdjustValue)
Seqs | Вектор из структур с полями
|
Tree | Филогенетическое дерево вычисляется с seqlinkage или seqneighjoin функция. |
WeightsValue | Свойство выбрать метод взвешивания последовательности. Введите 'THG' (значение по умолчанию) или 'equal'. |
ScoringMatrixValue | Любое из следующего:
Примечание Если необходимо скомпилировать |
SMInterpValue | Свойство задать, ли включена линейная интерполяция матриц выигрыша или прочь. Когда false, матрица выигрыша присвоена фиксированной области значений в зависимости от расстояний между двумя профилями (или последовательности) быть выровненным. Значением по умолчанию является true. |
GapOpenValue | Скаляр или функция, заданная с помощью @. Если вы вводите функцию, multialign передачи четыре значения к функции: средняя оценка для двух совпадающих остатков (sm), средняя оценка для двух несовпадающих остатков (sx), и, длина обоих профилей или последовательностей (len1, len2). Значением по умолчанию является @(sm,sx,len1,len2) 5*sm. |
ExtendGapValue | Скаляр или функция, заданная с помощью @. Если вы вводите функцию, multiialign передачи четыре значения к функции: средняя оценка для двух совпадающих остатков (sm), средняя оценка для двух несовпадающих остатков (sx), и длина обоих профилей или последовательностей (len1, len2). Значением по умолчанию является @(sm,sx,len1,len2) sm/4. |
DelayCutoffValue | Свойство задать пороговую задержку расходящихся последовательностей. Значением по умолчанию является единица, где последовательности с самой близкой последовательностью дальше, чем среднее расстояние задерживаются. |
UseParallelValue | Управляет расчетом попарного использования выравниваний parfor- циклы. Когда true, и Parallel Computing Toolbox™ установлен и parpool открыто, расчет происходит параллельно. Если нет никакого открытого parpool, но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и расчет происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool и автоматическое создание отключено, затем расчет использует parfor- циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то расчет использует parfor- циклы в последовательном режиме. Значением по умолчанию является false, который использует циклы for в последовательном режиме. |
VerboseValue | Свойство управлять отображением последовательностей с информацией о последовательности. Значением по умолчанию является false. |
ExistingGapAdjustValue | Свойство управлять автоматической настройкой на основе существующих разрывов. Значением по умолчанию является true. |
TerminalGapAdjustValue | Свойство настроить штраф за открытие разрыва в концах последовательности. Значением по умолчанию является false. |
| Вектор из структур (то же самое как Когда |
выполняет прогрессивное несколько выравнивание для набора последовательностей (SeqsMultiAligned = multialign(Seqs)Seqs). Попарные расстояния между последовательностями вычисляются после попарного выравнивания с Gonnet, выигрывая матрицу и затем путем подсчета пропорции сайтов, на которых каждая пара последовательностей отличаются (игнорирующие разрывы). Дерево руководства вычисляется соединяющим соседа методом, принимающим равное отклонение и независимость эволюционных оценок расстояния.
использует дерево (SeqsMultiAligned = multialign(Seqs, Tree)Tree) как руководство для прогрессивного выравнивания. Последовательности (Seqs) должен иметь тот же порядок как листы в дереве (Tree) или используйте поле ('Header' или 'Name') идентифицировать последовательности.
multialign(..., ' вводит дополнительные аргументы как имя свойства / пары значения свойства. Задайте одно или несколько свойств в любом порядке. Заключите каждый PropertyName', PropertyValue,...)PropertyName в одинарных кавычках. Каждый PropertyName является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:
multialign(..., 'Weights', выбирает метод взвешивания последовательности. Веса подчеркивают очень расходящиеся последовательности путем масштабирования матрицы выигрыша и разрывают штрафы. Более близкие последовательности получают меньшие веса. WeightsValue)
Значения свойства Weights :
'THG' (значение по умолчанию) — Метод Томпсона-Хиггинса-Гибсона с помощью филогенетических древовидных расстояний ветви взвешивается их толщиной.
'equal' — Присваивает тот же вес каждой последовательности.
multialign(..., 'ScoringMatrix', выбирает матрицу выигрыша (ScoringMatrixValue)ScoringMatrixValue) для прогрессивного выравнивания. Соответствуйте и не сочетайтесь, баллы интерполированы от ряда выигрыша матриц путем считания расстояний между двумя профилями или последовательностями выровненными. Первая матрица соответствует наименьшему расстоянию и последней матрице к самому большому расстоянию. Промежуточные расстояния вычисляются с помощью линейной интерполяции.
multialign(..., 'SMInterp', , когда SMInterpValue)SMInterpValue false, выключает линейную интерполяцию матриц выигрыша. Вместо этого каждый предоставленная матрица выигрыша присвоен фиксированной области значений в зависимости от расстояний между двумя профилями или выравниваемыми последовательностями.
multialign(..., 'GapOpen', задает начальный штраф за открытие разрыва. GapOpenValue)
multialign(..., 'ExtendGap', задает начальный штраф за расширение разрыва. ExtendGapValue)
multialign(..., 'DelayCutoff', задает порог, чтобы задержать выравнивание расходящихся последовательностей, самый близкий сосед которых более далек, чем DelayCutoffValue)
(DelayCutoffValue) * (median patristic distance between sequences)
multialign(..., 'UseParallel', задает, использовать ли UseParallelValue)parfor- циклы при вычислении попарных выравниваний. Когда true, и Parallel Computing Toolbox установлен и parpool открыто, расчет происходит параллельно. Если нет никакого открытого parpool, но автоматическое создание включено в Параллельных Настройках, пул по умолчанию будет автоматически открыт, и расчет происходит параллельно. Если Parallel Computing Toolbox установлен, но нет никакого открытого parpool и автоматическое создание отключено, затем расчет использует parfor- циклы в последовательном режиме. Если Parallel Computing Toolbox не установлен, то расчет использует parfor- циклы в последовательном режиме. Значением по умолчанию является false, который использует циклы for в последовательном режиме.
multialign(..., 'Verbose', , когда VerboseValue)VerboseValue true, включает многословие.
Остающиеся входные дополнительные аргументы походят на функциональный profalign и используются через каждый шаг прогрессивного выравнивания профилей.
multialign(..., 'ExistingGapAdjust', , когда ExistingGapAdjustValue)ExistingGapAdjustValue false, выключает автоматическую настройку на основе существующих разрывов специфичных для положения штрафов за открытие разрыва.
Когда ExistingGapAdjustValue true, для каждого положения профиля, profalign пропорционально понижает штраф за открытие разрыва к штрафу расширения разрыва на основе пропорции разрывов, найденных в непрерывных символах и на весе входного профиля.
multialign(..., 'TerminalGapAdjust', , когда TerminalGapAdjustValue)TerminalGapAdjustValue true, настраивает штраф за открытие разрыва в концах последовательности, чтобы быть равным штрафу за расширение разрыва.
В этом примере показано, как выровнять несколько последовательностей белка.
Используйте fastaread функционируйте, чтобы считать p53samples.txt, FASTA-отформатированный файл, включенный с Bioinformatics Toolbox™, который содержит p53 последовательности белка семи разновидностей.
p53 = fastaread('p53samples.txt')p53=7×1 struct array with fields:
Header
Sequence
Вычислите попарные расстояния между каждой парой последовательностей с помощью 'GONNET' выигрыш матрицы.
dist = seqpdist(p53,'ScoringMatrix','GONNET');
Создайте филогенетическое дерево с помощью невзвешенного среднего расстояния (UPGMA) метод. Это дерево будет использоваться в качестве направляющего дерева на следующем шаге прогрессивного выравнивания.
tree = seqlinkage(dist,'average',p53)Phylogenetic tree object with 7 leaves (6 branches)
Выполните прогрессивное выравнивание с помощью семейства PAM, выигрывающего матрицы.
ma = multialign(p53,tree,'ScoringMatrix',... {'pam150','pam200','pam250'})
ma=7×1 struct array with fields:
Header
Sequence
Введите массив последовательностей.
seqs = {'CACGTAACATCTC','ACGACGTAACATCTTCT','AAACGTAACATCTCGC'};
Способствуйте завершениям с разрывами в выравнивании.
multialign(seqs,'terminalGapAdjust',true) ans = --CACGTAACATCTC-- ACGACGTAACATCTTCT -AAACGTAACATCTCGC
Сравните выравнивание без корректировки разрыва завершения.
multialign(seqs) ans = CA--CGTAACATCT--C ACGACGTAACATCTTCT AA-ACGTAACATCTCGC
align2cigar | hmmprofalign | multialignread | multialignwrite | nwalign | profalign | seqconsensus | seqneighjoin | seqprofile