exponenta event banner

swalign

Локальное выравнивание двух последовательностей с использованием алгоритма Смита-Уотермана

Синтаксис

Score = swalign(Seq1, Seq2)
[Score, Alignment] = swalign(Seq1, Seq2)
[Score, Alignment, Start] = swalign(Seq1, Seq2)
... = swalign(Seq1,Seq2, ...'Alphabet', AlphabetValue)
... = swalign(Seq1,Seq2, ...'ScoringMatrix', ScoringMatrixValue, ...)
... = swalign(Seq1,Seq2, ...'Scale', ScaleValue, ...)
... = swalign(Seq1,Seq2, ...'GapOpen', GapOpenValue, ...)
... = swalign(Seq1,Seq2, ...'ExtendGap', ExtendGapValue, ...)
... = swalign(Seq1,Seq2, ...'Showscore', ShowscoreValue, ...)

Входные аргументы

Seq1, Seq2

Аминокислотные или нуклеотидные последовательности. Введите любое из следующих значений:

  • Символьный вектор или строка букв, представляющих аминокислоты или нуклеотиды, такие как возвращенные int2aa или int2nt

  • Вектор целых чисел, представляющих аминокислоты или нуклеотиды, такие как возвращенные aa2int или nt2int

  • Структура, содержащая Sequence область

Совет

Для получения справки по буквенным и целочисленным представлениям аминокислот и нуклеотидов см. Аминокислотный или нуклеотидный поиск.

AlphabetValueСимвольный вектор или строка, указывающая тип последовательности. Варианты: 'AA' (по умолчанию) или 'NT'.
ScoringMatrixValue

Одно из следующих действий:

  • Символьный вектор или строка, задающая матрицу оценки, которая будет использоваться для локального выравнивания. Варианты аминокислотных последовательностей:

    • 'BLOSUM62'

    • 'BLOSUM30' увеличение на 5 до 'BLOSUM90'

    • 'BLOSUM100'

    • 'PAM10' увеличение на 10 до 'PAM500'

    • 'DAYHOFF'

    • 'GONNET'

    Значение по умолчанию:

    • 'BLOSUM50' - Когда AlphabetValue равняется 'AA'

    • 'NUC44' - Когда AlphabetValue равняется 'NT'

    Примечание

    Вышеупомянутые матрицы оценки, снабженные программным обеспечением, также включают в себя структуру, содержащую масштабный коэффициент, который преобразует единицы выходной оценки в биты. Вы также можете использовать 'Scale' свойство для указания дополнительного масштабного коэффициента для преобразования выходной оценки из битов в другую единицу.

  • Матрица, представляющая матрицу оценки, используемую для локального выравнивания, например, возвращаемая blosum, pam, dayhoff, gonnet, или nuc44 функция.

    Примечание

    При использовании матрицы оценки, созданной или созданной одной из вышеперечисленных функций, матрица не включает масштабный коэффициент. Выходной балл будет возвращен в тех же единицах, что и матрица оценки. Вы можете использовать 'Scale' свойство, указывающее масштабный коэффициент для преобразования выходной оценки в другую единицу измерения.

Примечание

Если нужно скомпилировать swalign в автономном приложении или программном компоненте, использующем MATLAB ® Compiler™, используйте матрицу вместо символьного вектора или строки дляScoringMatrixValue.

ScaleValue

Положительное значение, указывающее масштабный коэффициент, применяемый к выходной шкале.

Например, если исходная оценка первоначально определяется в битах, и вводится значение log(2) для ScaleValue, то swalign прибыль Score в натс.

По умолчанию: 1, что не изменяет единицы выходного балла.

Примечание

Если 'ScoringMatrix' свойство также задает масштабный коэффициент, затем swalign использует его сначала для масштабирования выходного балла, затем применяет масштабный коэффициент, указанный ScaleValue для масштабирования выходного балла.

Совет

Прежде чем сравнивать оценки выравнивания из нескольких трасс, убедитесь, что оценки находятся в одних и тех же единицах. Вы можете использовать 'Scale' для управления единицами выходных баллов.

GapOpenValue

Положительное значение, определяющее штраф за открытие зазора в трассе. По умолчанию: 8.

ExtendGapValue

Положительное значение, определяющее штраф за расширение разрыва с использованием аффинной схемы штрафов за разрыв.

Примечание

Если указано это значение, swalign использует аффинную схему штрафов за разрыв, то есть набирает первый разрыв, используя GapOpenValue и оценивает последующие пробелы, используя ExtendGapValue. Если это значение не указано, swalign одинаково оценивает все пробелы, используя GapOpenValue пенальти.

ShowscoreValueУправление отображением пространства оценки и траектории выигрыша трассы. Варианты: true или false (по умолчанию).

Выходные аргументы

ScoreОптимальная оценка локального выравнивания в битах.
Alignment3-by-N символьный массив, показывающий две последовательности, Seq1 и Seq2в первой и третьей строках и символы, представляющие оптимальное локальное выравнивание между ними во второй строке.
Start2-на-1 вектор индексов, указывающий начальную точку в каждой последовательности для выравнивания.

Описание

Score = swalign(Seq1, Seq2) возвращает оптимальную оценку локального выравнивания в битах. Масштабный коэффициент, используемый для вычисления балла, определяется матрицей оценки.

[Score, Alignment] = swalign(Seq1, Seq2) возвращает 3-by-N символьный массив, показывающий две последовательности, Seq1 и Seq2в первой и третьей строках и символы, представляющие оптимальное локальное выравнивание между ними во второй строке. Символ | указывает аминокислоты или нуклеотиды, которые точно совпадают. Символ : обозначает аминокислоты или нуклеотиды, которые являются родственными, как определено матрицей оценки (несопоставленные с нулевым или положительным значением матрицы оценки).

[Score, Alignment, Start] = swalign(Seq1, Seq2) возвращает вектор индексов 2 на 1, указывающий начальную точку в каждой последовательности для выравнивания.

... = swalign(Seq1,Seq2, ...'PropertyName', PropertyValue, ...) требования swalign с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

... = swalign(Seq1,Seq2, ...'Alphabet', AlphabetValue) указывает тип последовательностей. Варианты: 'AA' (по умолчанию) или 'NT'.

... = swalign(Seq1,Seq2, ...'ScoringMatrix', ScoringMatrixValue, ...) определяет матрицу оценки, используемую для локальной трассы. Значение по умолчанию:

  • 'BLOSUM50' - Когда AlphabetValue равняется 'AA'

  • 'NUC44' - Когда AlphabetValue равняется 'NT'

... = swalign(Seq1,Seq2, ...'Scale', ScaleValue, ...) задает масштабный коэффициент, применяемый к выходному баллу, тем самым управляя единицами выходного балла. Выбор - это любое положительное значение.

... = swalign(Seq1,Seq2, ...'GapOpen', GapOpenValue, ...) определяет штраф за открытие промежутка на трассе. Выбор - это любое положительное значение. По умолчанию: 8.

... = swalign(Seq1,Seq2, ...'ExtendGap', ExtendGapValue, ...) определяет штраф за расширение зазора с использованием аффинной схемы штрафов за разрыв. Выбор - это любое положительное значение.

... = swalign(Seq1,Seq2, ...'Showscore', ShowscoreValue, ...) управляет отображением пространства оценки и траектории выигрыша трассы. Варианты: true или false (по умолчанию).

Пространство оценки представляет собой тепловую карту, отображающую наилучшие оценки для всех частичных выравниваний двух последовательностей. Цвет каждого (n1,n2) координата в пространстве оценки представляет наилучшую оценку для спаривания подпоследовательностей Seq1(s1:n1) и Seq2(s2:n2), где n1 является позицией в Seq1, n2 является позицией в Seq2, s1 является любой позицией в Seq1 между 1:n1, и s2 является любой позицией в Seq2 между 1:n2. Наилучший балл для спаривания конкретных подпоследовательностей определяется путем оценки всех возможных выравниваний подпоследовательностей путем суммирования совпадений и штрафов за разрыв.

Выигрышный путь представлен черными точками в скоринговом пространстве и иллюстрирует спаривание позиций в оптимальном локальном выравнивании. Цвет последней точки (справа внизу) победного пути представляет оптимальную оценку локального выравнивания для двух последовательностей и представляет собой Score вывод, возвращенный swalign.

Примечание

Пространство оценки визуально показывает тандемные повторы, небольшие сегменты, которые потенциально выравниваются, и частичные выравнивания доменов из переупорядоченных последовательностей.

Примеры

  1. Локально выровнять две аминокислотные последовательности, используя BLOSUM50 (по умолчанию) матрица оценки и значения по умолчанию для GapOpen и ExtendGap свойства. Возвращает оптимальную оценку локального выравнивания в битах и массив символов выравнивания.

    [Score, Alignment] = swalign('VSPAGMASGYD','IPGKASYD')
    
    Score =
    
         8.6667
    
    Alignment =
    
    PAGMASGYD
    | | || ||
    P-GKAS-YD
    
  2. Локально выровнять две аминокислотные последовательности, определяющие PAM250 матрица оценки и открытый штраф за разрыв 5.

    [Score, Alignment] = swalign('HEAGAWGHEE','PAWHEAE',...
                                 'ScoringMatrix', 'pam250',...
                                 'GapOpen',5)
    
    Score =
    
         8
    Alignment =
    
    GAWGHE
    :|| ||
    PAW-HE
    

  3. Локально выровнять две аминокислотные последовательности, возвращающие Score в единицах nat (nats) путем задания масштабного коэффициента log(2).

    [Score, Alignment] = swalign('HEAGAWGHEE','PAWHEAE','Scale',log(2))
                                 
    Score =
    
        6.4694
    
    Alignment =
    
    AWGHE
    || ||
    AW-HE

Ссылки

[1] Дурбин, Р., Эдди, С., Крог, А. и Митчисон, Г. (1998). Анализ биологических последовательностей (Cambridge University Press).

Смит, Т. и Уотерман, М. (1981). Идентификация общих молекулярных подпоследовательностей. Журнал молекулярной биологии 147, 195-197.

Представлен до R2006a