nwalign

Глобально выровняйте две последовательности с помощью алгоритма Needleman-Wunsch

Синтаксис

Score = nwalign(Seq1,Seq2) [Score, Alignment] = nwalign(Seq1,Seq2) [Score, Alignment, Start] = nwalign(Seq1,Seq2) ... = nwalign(Seq1,Seq2, ...'Alphabet', AlphabetValue, ...) ... = nwalign(Seq1,Seq2, ...'ScoringMatrix', ScoringMatrixValue, ...) ... = nwalign(Seq1,Seq2, ...'Scale', ScaleValue, ...) ... = nwalign(Seq1,Seq2, ...'GapOpen', GapOpenValue, ...) ... = nwalign(Seq1,Seq2, ...'ExtendGap', ExtendGapValue, ...) ... = nwalign(Seq1,Seq2, ...'Glocal', GlocalValue, ...) ... = nwalign(Seq1,Seq2, ...'Showscore', ShowscoreValue, ...)

Входные параметры

`Seq1`, `Seq2`	Аминокислота или последовательности нуклеотида. Введите любое следующее: Вектор символов или строка букв, представляющих аминокислоты или нуклеотиды, такой, как возвращено `int2aa` или `int2nt` Вектор из целых чисел, представляющих аминокислоты или нуклеотиды, такой, как возвращено `aa2int` или `nt2int` Структура, содержащая `Sequence` поле Совет Для справки с буквой и целочисленными представлениями аминокислот и нуклеотидов, смотрите Поиск Поиска или Нуклеотида Аминокислоты.
`AlphabetValue`	Вектор символов или строка, задающая тип последовательности. Выбором является `'AA'` (значение по умолчанию) или `'NT'`.
`ScoringMatrixValue`	Любое из следующего: Вектор символов или строка, задающая матрицу выигрыша, чтобы использовать для глобального выравнивания. Выбор для последовательностей аминокислот: `'BLOSUM62'` `'BLOSUM30'` увеличение на `5` до `'BLOSUM90'` `'BLOSUM100'` `'PAM10'` увеличение на `10` до `'PAM500'` `'DAYHOFF'` `'GONNET'` Значение по умолчанию: `'BLOSUM50'` — Когда `AlphabetValue` равняется `'AA'` `'NUC44'` — Когда `AlphabetValue` равняется `'NT'` Примечание Вышеупомянутые матрицы выигрыша, которым предоставляют программное обеспечение, также включают структуру, содержащую масштабный коэффициент, который преобразовывает единицы выходного счета вдребезги. Можно также использовать `'Scale'` свойство задать дополнительный масштабный коэффициент, чтобы преобразовать выходной счет от битов до другого модуля. Матрица, представляющая матрицу выигрыша, чтобы использовать для глобального выравнивания, такой, как возвращено `blosum`, `pam`, `dayhoff`, `gonnet`, или `nuc44` функция. Примечание Если вы используете матрицу выигрыша, которую вы создали или были созданы одной из вышеупомянутых функций, матрица не включает масштабный коэффициент. Выходной счет будет возвращен в тех же модулях как матрица выигрыша. Можно использовать `'Scale'` свойство задать масштабный коэффициент, чтобы преобразовать выходной счет в другой модуль. Примечание Если необходимо скомпилировать `nwalign` в автономное приложение или компонент программного обеспечения с помощью MATLAB^® Compiler™, используйте матрицу вместо вектора символов или строки для `ScoringMatrixValue`.
`ScaleValue`	Положительное значение, которое задает масштабный коэффициент, который применяется к выходному счету. Например, если выходной счет первоначально определяется в битах, и вы вводите `log(2)` для `ScaleValue`, затем `nwalign` возвращает `Score` в nats. Значением по умолчанию является `1`, который не изменяет модули выходного счета. Примечание Если `'ScoringMatrix'` свойство также задает масштабный коэффициент, затем `nwalign` использование это сначала, чтобы масштабировать выходной счет, затем применяет масштабный коэффициент, заданный `ScaleValue` перемасштабировать выходной счет. Совет Прежде, чем сравнить баллы выравнивания от нескольких выравниваний, гарантируйте, что баллы находятся в тех же модулях. Можно использовать `'Scale'` свойство управлять модулями выходных баллов.
`GapOpenValue`	Положительное значение, задающее штраф за открытие разрыва в выравнивании. Значением по умолчанию является `8`.
`ExtendGapValue`	Положительное значение, задающее штраф за расширение разрыва с помощью аффинной схемы штрафа разрыва. Примечание Если вы задаете это значение, `nwalign` использует аффинную схему штрафа разрыва, то есть, это баллы первый разрыв с помощью `GapOpenValue` и баллы последующие разрывы с помощью `ExtendGapValue`. Если вы не задаете это значение, `nwalign` баллы все разрывы одинаково, с помощью `GapOpenValue` штраф.
`GlocalValue`	Управляет возвратом полуглобальной переменной или “glocal” выравниванием. В полуглобальном выравнивании штрафы разрыва в конце последовательностей являются пустыми. Выбором является `true` или `false` (значение по умолчанию).
`ShowscoreValue`	Управляет отображением пробела выигрыша и путем к победе выравнивания. Выбором является `true` или `false` (значение по умолчанию).

Выходные аргументы

`Score`	Оптимальное глобальное выравнивание выигрывает в битах.
`Alignment`	3 N символьным массивом, показывающим эти две последовательности, `Seq1` и `Seq2`, в первых и третьих строках и символах, представляющих оптимальное глобальное выравнивание для них во второй строке.
`Start`	2 1 вектор из индексов, указывающих на начальную точку в каждой последовательности для выравнивания. Поскольку это - глобальное выравнивание, `Start` `всегда [1;1]`.

Описание

Score = nwalign(Seq1,Seq2) возвращает оптимальный глобальный счет выравнивания в битах. Масштабный коэффициент, используемый, чтобы вычислить счет, обеспечивается матрицей выигрыша.

[Score, Alignment] = nwalign(Seq1,Seq2) возвращает 3 N символьным массивом, показывающим эти две последовательности, Seq1 и Seq2, в первых и третьих строках и символах, представляющих оптимальное глобальное выравнивание для них во второй строке. Символ | указывает на аминокислоты или нуклеотиды то соответствие точно. Символ : указывает на аминокислоты или нуклеотиды, которые связаны, как задано матрицей выигрыша (несовпадения с нулем или положительным выигрывающим матричным значением).

[Score, Alignment, Start] = nwalign(Seq1,Seq2) возвращается 2 1 вектор из индексов, указывающих на начальную точку в каждой последовательности для выравнивания. Поскольку это - глобальное выравнивание, Start всегда [1;1].

... = nwalign (Seq1, Seq2PropertyName ', PropertyValue, ...) вызовы nwalign с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

... = nwalign(Seq1,Seq2, ...'Alphabet', AlphabetValue, ...) задает тип последовательностей. Выбором является 'AA' (значение по умолчанию) или 'NT'.

... = nwalign(Seq1,Seq2, ...'ScoringMatrix', ScoringMatrixValue, ...) задает матрицу выигрыша, чтобы использовать для глобального выравнивания. Значение по умолчанию:

'BLOSUM50' — Когда AlphabetValue равняется 'AA'
'NUC44' — Когда AlphabetValue равняется 'NT'

... = nwalign(Seq1,Seq2, ...'Scale', ScaleValue, ...) задает масштабный коэффициент, который применяется к выходному счету, таким образом, управляя модулями выходного счета. Выбором является любое положительное значение.

... = nwalign(Seq1,Seq2, ...'GapOpen', GapOpenValue, ...) задает штраф за открытие разрыва в выравнивании. Выбором является любое положительное значение. Значением по умолчанию является 8.

... = nwalign(Seq1,Seq2, ...'ExtendGap', ExtendGapValue, ...) задает штраф за расширение разрыва с помощью аффинной схемы штрафа разрыва. Выбором является любое положительное значение.

... = nwalign(Seq1,Seq2, ...'Glocal', GlocalValue, ...) управляет возвратом полуглобальной переменной или “glocal” выравниванием. В полуглобальном выравнивании штрафы разрыва в конце последовательностей являются пустыми. Выбором является true или false (значение по умолчанию).

... = nwalign(Seq1,Seq2, ...'Showscore', ShowscoreValue, ...) управляет отображением пробела выигрыша и завоевания пути выравнивания. Выбором является true или false (значение по умолчанию).

Пробел выигрыша является картой тепла, отображающей лучшую музыку ко всем частичным выравниваниям двух последовательностей. Цвет каждого (n1,n2) координата на пробеле выигрыша представляет лучший счет к соединению подпоследовательностей Seq1(1:n1) и Seq2(1:n2), где n1 положение в Seq1 и n2 положение в Seq2. Лучший счет к соединению определенных подпоследовательностей определяется путем выигрыша всех возможных выравниваний подпоследовательностей путем подведения итогов штрафов разрыва и соответствий.

Путь к победе представлен черными точками на пробеле выигрыша, и это иллюстрирует соединение положений в оптимальном глобальном выравнивании. Цвет последней точки (нижний правый угол) пути к победе представляет оптимальный глобальный счет выравнивания к этим двум последовательностям и является Score выведите возвращенный nwalign.

Примечание

Пробел выигрыша визуально указывает, существуют ли потенциальные альтернативные пути к победе, который полезен при выравнивании последовательностей с большими разрывами. Визуальные шаблоны на пробеле выигрыша могут также указать на возможную перестановку последовательности.

Примеры

Глобально выровняйте две последовательности аминокислот с помощью BLOSUM50 (значение по умолчанию) матрица выигрыша и значения по умолчанию для GapOpen и ExtendGap свойства. Возвратите оптимальный глобальный счет выравнивания в битах и символьном массиве выравнивания.
```
[Score, Alignment] = nwalign('VSPAGMASGYD','IPGKASYD')
Score =

    7.3333

Alignment =

VSPAGMASGYD
: | | || ||
I-P-GKAS-YD
```

Глобально выровняйте две последовательности аминокислот, задающие PAM250 выигрыш матрицы и разрыва открывает штраф 5.

[Score, Alignment] = nwalign('IGRHRYHIGG','SRYIGRG',...
                             'scoringmatrix','pam250',...
                             'gapopen',5)
Score =

    2.3333

Alignment =

IGRHRYHIG-G
 :  || || |
-S--RY-IGRG

Глобально выровняйте две последовательности аминокислот, возвращающие Score в туземных модулях (nats) путем определения масштабного коэффициента log(2).
```
[Score, Alignment] = nwalign('HEAGAWGHEE','PAWHEAE','Scale',log(2))
                             
Score =

    0.2310

Alignment =

HEAGAWGHE-E
    || || |
--P-AW-HEAE
```

Ссылки

[1] Durbin, R., вихрь, S., Krogh, A. и Мичисон, G. (1998). Биологический анализ последовательности (издательство Кембриджского университета).

Представлено до R2006a

Документация