nwalign

Глобально выровнять две последовательности с помощью алгоритма Нидлемана-Вунша

Синтаксис

Score = nwalign(Seq1,Seq2)
[Score, Alignment] = nwalign(Seq1,Seq2)
[Score, Alignment, Start] = nwalign(Seq1,Seq2)
... = nwalign(Seq1,Seq2, ...'Alphabet', AlphabetValue, ...)
... = nwalign(Seq1,Seq2, ...'ScoringMatrix', ScoringMatrixValue, ...)
... = nwalign(Seq1,Seq2, ...'Scale', ScaleValue, ...)
... = nwalign(Seq1,Seq2, ...'GapOpen', GapOpenValue, ...)
... = nwalign(Seq1,Seq2, ...'ExtendGap', ExtendGapValue, ...)
... = nwalign(Seq1,Seq2, ...'Glocal', GlocalValue, ...)
... = nwalign(Seq1,Seq2, ...'Showscore', ShowscoreValue, ...)

Входные параметры

Seq1, Seq2

Аминокислотные или нуклеотидные последовательности. Введите любое из следующих значений:

  • Вектор символов или строка букв, представляющих аминокислоты или нуклеотиды, такие как возвращенные int2aa или int2nt

  • Вектор целых чисел, представляющих аминокислоты или нуклеотиды, таких как возвращенные aa2int или nt2int

  • Структура, содержащая Sequence область

Совет

Для помощи с буквенными и целочисленными представлениями аминокислот и нуклеотидов, смотрите Amino Acid Lookup или Nucleotide Lookup.

AlphabetValueВектор символов или строка, задающая тип последовательности. Варианты 'AA' (по умолчанию) или 'NT'.
ScoringMatrixValue

Одно из следующих:

  • Вектор символов или строка, задающая матрицу скоринга для глобального выравнивания. Варианты для аминокислотных последовательностей:

    • 'BLOSUM62'

    • 'BLOSUM30' увеличение на 5 до 'BLOSUM90'

    • 'BLOSUM100'

    • 'PAM10' увеличение на 10 до 'PAM500'

    • 'DAYHOFF'

    • 'GONNET'

    По умолчанию это:

    • 'BLOSUM50' - Когда AlphabetValue равен 'AA'

    • 'NUC44' - Когда AlphabetValue равен 'NT'

    Примечание

    Вышеупомянутые матрицы оценки, снабженные программным обеспечением, также включают структуру, содержащую коэффициент шкалы, который преобразует модули выхода счета в биты. Можно также использовать 'Scale' свойство, задающее дополнительный коэффициент шкалы для преобразования выхода счета из бит в другой модуль.

  • Матрица, представляющая скоринговую матрицу для использования в глобальном выравнивании, например, возвращенная blosum, pam, dayhoff, gonnet, или nuc44 функция.

    Примечание

    Если вы используете матрицу скоринга, которую вы создали или создали с помощью одной из вышеописанных функций, матрица не включает коэффициент шкалы. Итоговый счет будет возвращаем в тех же модулях измерения, что и матрица оценки. Можно использовать 'Scale' свойство, задающее коэффициент шкалы для преобразования выхода счета в другой модуль.

Примечание

Если вам нужно скомпилироваться nwalign в самостоятельное приложение или программный компонент с использованием MATLAB® Compiler™ используйте матрицу вместо вектора символов или строки для ScoringMatrixValue.

ScaleValue

Положительное значение, которое задает коэффициент шкалы, который применяется к выходу счета.

Например, если выходной счет первоначально определен в битах, и вы вводите log(2) для ScaleValue, затем nwalign возвращает Score в нац.

По умолчанию это 1, который не изменяет модулей выхода счета.

Примечание

Если на 'ScoringMatrix' свойство также задает коэффициент шкалы, затем nwalign использует его сначала для масштабирования выхода счета, затем применяет коэффициент шкалы, заданный ScaleValue чтобы переформулировать выход счета.

Совет

Перед сравнением счетов выравнивания из нескольких трасс убедитесь, что счета указаны в тех же модулях. Можно использовать 'Scale' свойство для управления модулями выхода счетов.

GapOpenValueПоложительное значение, определяющее штраф за открытие зазора в выравнивании. По умолчанию это 8.
ExtendGapValue

Положительное значение, определяющее штраф за расширение разрыва с помощью схемы штрафа за аффинную разрыв.

Примечание

Если вы задаете это значение, nwalign использует схему штрафов за аффинную погрешность, то есть забивает первую погрешность используя GapOpenValue и оценивает последующие погрешности, используя ExtendGapValue. Если вы не задаете это значение, nwalign оценивает все погрешности одинаково, используя GapOpenValue штраф.

GlocalValueУправляет возвратом полуглобального или «глокального» выравнивания. В полуглобальном выравнивании штрафы за разрыв в конце последовательностей являются нулевыми. Варианты true или false (по умолчанию).
ShowscoreValueУправление отображением пространства подсчета очков и выигрышного пути выравнивания. Варианты true или false (по умолчанию).

Выходные аргументы

ScoreОптимальный глобальный счет выравнивания в битах.
Alignment3-by-N символьный массив, показывающий две последовательности, Seq1 и Seq2, в первой и третьей строках и символы, представляющие для них оптимальное глобальное выравнивание во второй строке.
StartВектор 2 на 1 индексов, указывающих начальную точку в каждой последовательности для выравнивания. Потому что это глобальное выравнивание, Start всегда [1;1].

Описание

Score = nwalign(Seq1,Seq2) возвращает оптимальный глобальный счет выравнивания в битах. Коэффициент шкалы, используемый для вычисления счета, обеспечивается оценочной матрицей.

[Score, Alignment] = nwalign(Seq1,Seq2) возвращает 3-by-N символьный массив, показывающий две последовательности, Seq1 и Seq2, в первой и третьей строках и символы, представляющие для них оптимальное глобальное выравнивание во второй строке. Символ | указывает аминокислоты или нуклеотиды, которые точно совпадают. Символ : указывает аминокислоты или нуклеотиды, которые связаны, как определено матрицей оценки (несовпадения с нулевым или положительным значением матрицы оценки).

[Score, Alignment, Start] = nwalign(Seq1,Seq2) возвращает вектор 2 на 1 индексов, указывающих начальную точку в каждой последовательности для выравнивания. Потому что это глобальное выравнивание, Start всегда [1;1].

... = nwalign (Seq1, Seq2... 'PropertyName', PropertyValue, ...) вызывает nwalign с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

... = nwalign(Seq1,Seq2, ...'Alphabet', AlphabetValue, ...) задает тип последовательностей. Варианты 'AA' (по умолчанию) или 'NT'.

... = nwalign(Seq1,Seq2, ...'ScoringMatrix', ScoringMatrixValue, ...) задает матрицу скоринга, которая будет использоваться для глобального выравнивания. По умолчанию это:

  • 'BLOSUM50' - Когда AlphabetValue равен 'AA'

  • 'NUC44' - Когда AlphabetValue равен 'NT'

... = nwalign(Seq1,Seq2, ...'Scale', ScaleValue, ...) задает масштабный коэффициент, который применяется к выходному баллу, таким образом управляя единицами измерения выходного балла. Выбор является любым положительным значением.

... = nwalign(Seq1,Seq2, ...'GapOpen', GapOpenValue, ...) определяет штраф за открытие зазора в выравнивании. Выбор является любым положительным значением. По умолчанию это 8.

... = nwalign(Seq1,Seq2, ...'ExtendGap', ExtendGapValue, ...) определяет штраф за расширение промежутка с помощью схемы аффинного штрафа за разрыв. Выбор является любым положительным значением.

... = nwalign(Seq1,Seq2, ...'Glocal', GlocalValue, ...) управляет возвратом полуглобального или «глокального» выравнивания. В полуглобальном выравнивании штрафы за разрыв в конце последовательностей являются нулевыми. Варианты true или false (по умолчанию).

... = nwalign(Seq1,Seq2, ...'Showscore', ShowscoreValue, ...) управляет отображением оценочного пространства и выигрышного пути выравнивания. Варианты true или false (по умолчанию).

Пространство оценки является тепловой картой, отображающей лучшие счета для всех частичных выравниваний двух последовательностей. Цвет каждого (n1,n2) координата в пространстве подсчета представляет собой лучший счет для сопряжения подпоследовательностей Seq1(1:n1) и Seq2(1:n2), где n1 - положение в Seq1 и n2 - положение в Seq2. Лучший счет для сопряжения определенных подпоследовательностей определяется путем оценки всех возможных выравниваний подпоследовательностей путем суммирования совпадений и штрафов за разрыв.

Выигрышный путь представлен черными точками в скоринговом пространстве, и он иллюстрирует сопряжение позиций в оптимальном глобальном выравнивании. Цвет последней точки (нижняя правая) выигрышного пути представляет оптимальный глобальный счет выравнивания для двух последовательностей и является Score выход возвращен nwalign.

Примечание

Пространство оценки визуально указывает, существуют ли потенциальные альтернативные пути выигрыша, что полезно при выравнивании последовательностей с большими погрешностями. Визуальные шаблоны в пространстве оценки могут также указывать на возможную перестройку последовательности.

Примеры

  1. Глобально выровнять две аминокислотные последовательности с помощью BLOSUM50 (по умолчанию) матрица оценки и значения по умолчанию для GapOpen и ExtendGap свойства. Верните оптимальный счет глобального выравнивания в битах и символьном массиве выравнивания.

    [Score, Alignment] = nwalign('VSPAGMASGYD','IPGKASYD')
    Score =
    
        7.3333
    
    Alignment =
    
    VSPAGMASGYD
    : | | || ||
    I-P-GKAS-YD
  2. Глобально выровняйте две аминокислотные последовательности, определяющие PAM250 матрица скоринга и разрыв открытый штраф 5.

    [Score, Alignment] = nwalign('IGRHRYHIGG','SRYIGRG',...
                                 'scoringmatrix','pam250',...
                                 'gapopen',5)
    Score =
    
        2.3333
    
    Alignment =
    
    IGRHRYHIG-G
     :  || || |
    -S--RY-IGRG
    
  3. Глобально выравнивает две аминокислотные последовательности, возвращая Score в единицах nat (nats) путем определения масштабного коэффициента log(2).

    [Score, Alignment] = nwalign('HEAGAWGHEE','PAWHEAE','Scale',log(2))
                                 
    Score =
    
        0.2310
    
    Alignment =
    
    HEAGAWGHE-E
        || || |
    --P-AW-HEAE

Ссылки

[1] Durbin, R., Eddy, S., Krogh, A. and Mitchison, G. (1998). Анализ биологической последовательности (Cambridge University Press).

Представлено до R2006a