nwalign

Глобально выровняйте две последовательности с помощью алгоритма Needleman-Wunsch

Синтаксис

Score = nwalign(Seq1,Seq2)
[Score, Alignment] = nwalign(Seq1,Seq2)
[Score, Alignment, Start] = nwalign(Seq1,Seq2)
... = nwalign(Seq1,Seq2, ...'Alphabet', AlphabetValue, ...)
... = nwalign(Seq1,Seq2, ...'ScoringMatrix', ScoringMatrixValue, ...)
... = nwalign(Seq1,Seq2, ...'Scale', ScaleValue, ...)
... = nwalign(Seq1,Seq2, ...'GapOpen', GapOpenValue, ...)
... = nwalign(Seq1,Seq2, ...'ExtendGap', ExtendGapValue, ...)
... = nwalign(Seq1,Seq2, ...'Glocal', GlocalValue, ...)
... = nwalign(Seq1,Seq2, ...'Showscore', ShowscoreValue, ...)

Входные параметры

Seq1, Seq2

Аминокислота или последовательности нуклеотида. Введите любое следующее:

  • Вектор символов или строка букв, представляющих аминокислоты или нуклеотиды, такой, как возвращено int2aa или int2nt

  • Вектор из целых чисел, представляющих аминокислоты или нуклеотиды, такой, как возвращено aa2int или nt2int

  • Структура, содержащая Sequence поле

Совет

Для справки с буквой и целочисленными представлениями аминокислот и нуклеотидов, смотрите Поиск Поиска или Нуклеотида Аминокислоты.

AlphabetValueВектор символов или строка, задающая тип последовательности. Выбором является 'AA' (значение по умолчанию) или 'NT'.
ScoringMatrixValue

Любое из следующего:

  • Вектор символов или строка, задающая матрицу выигрыша, чтобы использовать для глобального выравнивания. Выбор для последовательностей аминокислот:

    • 'BLOSUM62'

    • 'BLOSUM30' увеличение на 5 до 'BLOSUM90'

    • 'BLOSUM100'

    • 'PAM10' увеличение на 10 до 'PAM500'

    • 'DAYHOFF'

    • 'GONNET'

    Значение по умолчанию:

    • 'BLOSUM50' — Когда AlphabetValue равняется 'AA'

    • 'NUC44' — Когда AlphabetValue равняется 'NT'

    Примечание

    Вышеупомянутые матрицы выигрыша, которым предоставляют программное обеспечение, также включают структуру, содержащую масштабный коэффициент, который преобразовывает единицы выходного счета вдребезги. Можно также использовать 'Scale' свойство задать дополнительный масштабный коэффициент, чтобы преобразовать выходной счет от битов до другого модуля.

  • Матрица, представляющая матрицу выигрыша, чтобы использовать для глобального выравнивания, такой, как возвращено blosum, pam, dayhoff, gonnet, или nuc44 функция.

    Примечание

    Если вы используете матрицу выигрыша, которую вы создали или были созданы одной из вышеупомянутых функций, матрица не включает масштабный коэффициент. Выходной счет будет возвращен в тех же модулях как матрица выигрыша. Можно использовать 'Scale' свойство задать масштабный коэффициент, чтобы преобразовать выходной счет в другой модуль.

Примечание

Если необходимо скомпилировать nwalign в автономное приложение или компонент программного обеспечения с помощью MATLAB® Compiler™, используйте матрицу вместо вектора символов или строки для ScoringMatrixValue.

ScaleValue

Положительное значение, которое задает масштабный коэффициент, который применяется к выходному счету.

Например, если выходной счет первоначально определяется в битах, и вы вводите log(2) для ScaleValue, затем nwalign возвращает Score в nats.

Значением по умолчанию является 1, который не изменяет модули выходного счета.

Примечание

Если 'ScoringMatrix' свойство также задает масштабный коэффициент, затем nwalign использование это сначала, чтобы масштабировать выходной счет, затем применяет масштабный коэффициент, заданный ScaleValue перемасштабировать выходной счет.

Совет

Прежде, чем сравнить баллы выравнивания от нескольких выравниваний, гарантируйте, что баллы находятся в тех же модулях. Можно использовать 'Scale' свойство управлять модулями выходных баллов.

GapOpenValueПоложительное значение, задающее штраф за открытие разрыва в выравнивании. Значением по умолчанию является 8.
ExtendGapValue

Положительное значение, задающее штраф за расширение разрыва с помощью аффинной схемы штрафа разрыва.

Примечание

Если вы задаете это значение, nwalign использует аффинную схему штрафа разрыва, то есть, это баллы первый разрыв с помощью GapOpenValue и баллы последующие разрывы с помощью ExtendGapValue. Если вы не задаете это значение, nwalign баллы все разрывы одинаково, с помощью GapOpenValue штраф.

GlocalValueУправляет возвратом полуглобальной переменной или “glocal” выравниванием. В полуглобальном выравнивании штрафы разрыва в конце последовательностей являются пустыми. Выбором является true или false (значение по умолчанию).
ShowscoreValueУправляет отображением пробела выигрыша и путем к победе выравнивания. Выбором является true или false (значение по умолчанию).

Выходные аргументы

ScoreОптимальное глобальное выравнивание выигрывает в битах.
Alignment3 N символьным массивом, показывающим эти две последовательности, Seq1 и Seq2, в первых и третьих строках и символах, представляющих оптимальное глобальное выравнивание для них во второй строке.
Start2 1 вектор из индексов, указывающих на начальную точку в каждой последовательности для выравнивания. Поскольку это - глобальное выравнивание, Start всегда [1;1].

Описание

Score = nwalign(Seq1,Seq2) возвращает оптимальный глобальный счет выравнивания в битах. Масштабный коэффициент, используемый, чтобы вычислить счет, обеспечивается матрицей выигрыша.

[Score, Alignment] = nwalign(Seq1,Seq2) возвращает 3 N символьным массивом, показывающим эти две последовательности, Seq1 и Seq2, в первых и третьих строках и символах, представляющих оптимальное глобальное выравнивание для них во второй строке. Символ | указывает на аминокислоты или нуклеотиды то соответствие точно. Символ : указывает на аминокислоты или нуклеотиды, которые связаны, как задано матрицей выигрыша (несовпадения с нулем или положительным выигрывающим матричным значением).

[Score, Alignment, Start] = nwalign(Seq1,Seq2) возвращается 2 1 вектор из индексов, указывающих на начальную точку в каждой последовательности для выравнивания. Поскольку это - глобальное выравнивание, Start всегда [1;1].

... = nwalign (Seq1, Seq2PropertyName ', PropertyValue, ...) вызовы nwalign с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

... = nwalign(Seq1,Seq2, ...'Alphabet', AlphabetValue, ...) задает тип последовательностей. Выбором является 'AA' (значение по умолчанию) или 'NT'.

... = nwalign(Seq1,Seq2, ...'ScoringMatrix', ScoringMatrixValue, ...) задает матрицу выигрыша, чтобы использовать для глобального выравнивания. Значение по умолчанию:

  • 'BLOSUM50' — Когда AlphabetValue равняется 'AA'

  • 'NUC44' — Когда AlphabetValue равняется 'NT'

... = nwalign(Seq1,Seq2, ...'Scale', ScaleValue, ...) задает масштабный коэффициент, который применяется к выходному счету, таким образом, управляя модулями выходного счета. Выбором является любое положительное значение.

... = nwalign(Seq1,Seq2, ...'GapOpen', GapOpenValue, ...) задает штраф за открытие разрыва в выравнивании. Выбором является любое положительное значение. Значением по умолчанию является 8.

... = nwalign(Seq1,Seq2, ...'ExtendGap', ExtendGapValue, ...) задает штраф за расширение разрыва с помощью аффинной схемы штрафа разрыва. Выбором является любое положительное значение.

... = nwalign(Seq1,Seq2, ...'Glocal', GlocalValue, ...) управляет возвратом полуглобальной переменной или “glocal” выравниванием. В полуглобальном выравнивании штрафы разрыва в конце последовательностей являются пустыми. Выбором является true или false (значение по умолчанию).

... = nwalign(Seq1,Seq2, ...'Showscore', ShowscoreValue, ...) управляет отображением пробела выигрыша и завоевания пути выравнивания. Выбором является true или false (значение по умолчанию).

Пробел выигрыша является картой тепла, отображающей лучшую музыку ко всем частичным выравниваниям двух последовательностей. Цвет каждого (n1,n2) координата на пробеле выигрыша представляет лучший счет к соединению подпоследовательностей Seq1(1:n1) и Seq2(1:n2), где n1 положение в Seq1 и n2 положение в Seq2. Лучший счет к соединению определенных подпоследовательностей определяется путем выигрыша всех возможных выравниваний подпоследовательностей путем подведения итогов штрафов разрыва и соответствий.

Путь к победе представлен черными точками на пробеле выигрыша, и это иллюстрирует соединение положений в оптимальном глобальном выравнивании. Цвет последней точки (нижний правый угол) пути к победе представляет оптимальный глобальный счет выравнивания к этим двум последовательностям и является Score выведите возвращенный nwalign.

Примечание

Пробел выигрыша визуально указывает, существуют ли потенциальные альтернативные пути к победе, который полезен при выравнивании последовательностей с большими разрывами. Визуальные шаблоны на пробеле выигрыша могут также указать на возможную перестановку последовательности.

Примеры

  1. Глобально выровняйте две последовательности аминокислот с помощью BLOSUM50 (значение по умолчанию) матрица выигрыша и значения по умолчанию для GapOpen и ExtendGap свойства. Возвратите оптимальный глобальный счет выравнивания в битах и символьном массиве выравнивания.

    [Score, Alignment] = nwalign('VSPAGMASGYD','IPGKASYD')
    Score =
    
        7.3333
    
    Alignment =
    
    VSPAGMASGYD
    : | | || ||
    I-P-GKAS-YD
  2. Глобально выровняйте две последовательности аминокислот, задающие PAM250 выигрыш матрицы и разрыва открывает штраф 5.

    [Score, Alignment] = nwalign('IGRHRYHIGG','SRYIGRG',...
                                 'scoringmatrix','pam250',...
                                 'gapopen',5)
    Score =
    
        2.3333
    
    Alignment =
    
    IGRHRYHIG-G
     :  || || |
    -S--RY-IGRG
    
  3. Глобально выровняйте две последовательности аминокислот, возвращающие Score в туземных модулях (nats) путем определения масштабного коэффициента log(2).

    [Score, Alignment] = nwalign('HEAGAWGHEE','PAWHEAE','Scale',log(2))
                                 
    Score =
    
        0.2310
    
    Alignment =
    
    HEAGAWGHE-E
        || || |
    --P-AW-HEAE

Ссылки

[1] Durbin, R., вихрь, S., Krogh, A. и Мичисон, G. (1998). Биологический анализ последовательности (издательство Кембриджского университета).

Представлено до R2006a