exponenta event banner

localalign

Возврат локальных оптимальных и неоптимальных выравниваний между двумя последовательностями

Синтаксис

AlignStruct = localalign(Seq1, Seq2)
AlignStruct = localalign(Seq1, Seq2, ...'NumAln', NumAlnValue, ...)
AlignStruct = localalign(Seq1, Seq2, ...'MinScore', MinScoreValue, ...)
AlignStruct = localalign(Seq1, Seq2, ...'Percent', PercentValue, ...)
AlignStruct = localalign(Seq1, Seq2, ...'DoAlignment', DoAlignmentValue, ...)
AlignStruct = localalign(Seq1, Seq2, ...'Alphabet', AlphabetValue, ...)
AlignStruct = localalign(Seq1, Seq2, ...'ScoringMatrix', ScoringMatrixValue, ...)
AlignStruct = localalign(Seq1, Seq2, ...'Scale', ScaleValue, ...)
AlignStruct = localalign(Seq1, Seq2, ...'GapOpen', GapOpenValue, ...)

Описание

AlignStruct = localalign(Seq1, Seq2) возвращает информацию о первом оптимальном (наивысшем балле) локальном выравнивании между двумя последовательностями в структуре MATLAB ® .

AlignStruct = localalign(Seq1, Seq2, ...'PropertyName', PropertyValue, ...) требования localalign с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Заключить каждый PropertyName в одинарных кавычках. Каждый PropertyName нечувствителен к регистру. Эти пары имя/значение свойства следующие:

AlignStruct = localalign(Seq1, Seq2, ...'NumAln', NumAlnValue, ...) возвращает информацию об одной или нескольких непересекающихся локальных трассах (оптимальных и неоптимальных). Он ограничивает количество возвращаемых трасс, указывая количество возвращаемых локальных трасс. Она возвращает трассы в порядке убывания в соответствии с их оценкой.

AlignStruct = localalign(Seq1, Seq2, ...'MinScore', MinScoreValue, ...) возвращает информацию о непересекающихся локальных трассах (оптимальных и неоптимальных), оценка которых больше MinScoreValue.

AlignStruct = localalign(Seq1, Seq2, ...'Percent', PercentValue, ...) возвращает информацию об одной или нескольких непересекающихся локальных трассах (оптимальных и неоптимальных), баллы которых находятся в пределах PercentValue процентов от высшего балла. Она возвращает трассы в порядке убывания в соответствии с их оценкой.

AlignStruct = localalign(Seq1, Seq2, ...'DoAlignment', DoAlignmentValue, ...) указывает, следует ли включать попарные трассы в Alignment поле структуры вывода. Варианты: true (по умолчанию) или false.

AlignStruct = localalign(Seq1, Seq2, ...'Alphabet', AlphabetValue, ...) указывает тип последовательностей. Варианты: 'AA' (по умолчанию) или 'NT'.

AlignStruct = localalign(Seq1, Seq2, ...'ScoringMatrix', ScoringMatrixValue, ...) определяет матрицу оценки, используемую для локальной трассы.

AlignStruct = localalign(Seq1, Seq2, ...'Scale', ScaleValue, ...) задает масштабный коэффициент, применяемый к выходным баллам, тем самым управляя единицами выходных баллов. Выбор - это любое положительное значение. По умолчанию: 1, что не изменяет единицы выходного балла.

AlignStruct = localalign(Seq1, Seq2, ...'GapOpen', GapOpenValue, ...) определяет штраф за открытие промежутка на трассе. Выбор - это любое положительное значение. По умолчанию: 8.

Входные аргументы

Seq1

Первая аминокислотная или нуклеотидная последовательность, указанная любым из следующих:

  • Символьный вектор или строка букв, представляющих аминокислоты или нуклеотиды, такие как возвращенные int2aa или int2nt

  • Вектор целых чисел, представляющих аминокислоты или нуклеотиды, такие как возвращенные aa2int или nt2int

  • Структура MATLAB, содержащая Sequence поле, например, возвращенное fastaread, fastqread, emblread, getembl, genbankread, getgenbank, getgenpept, genpeptread, getpdb, pdbread, или sffread

Совет

Для получения справки по буквенным и целочисленным представлениям аминокислот и нуклеотидов см. Аминокислотный или нуклеотидный поиск.

Seq2

Вторая аминокислотная или нуклеотидная последовательность, которая localalign выравнивает с Seq1.

NumAlnValue

Положительный скаляр (< или = 2^12), указывая количество трасс для возврата. localalign возвращает верхнюю часть NumAlnValue локальные, непересекающиеся трассы (оптимальные и неоптимальные). Если количество оптимальных трасс больше NumAlnValue, то localalign возвращает первое NumAlnValue выравнивания на основе их порядка в матрице обратной трассировки.

Примечание

Если указать NumAlnValue, нельзя указать MinScoreValue или PercentValue.

Совет

Использовать NumAlnValue для возврата нескольких трасс при выравнивании последовательностей низкой сложности с учетом нескольких локальных трасс.

По умолчанию: 1

MinScoreValue

Положительный скаляр, задающий минимальный балл локальных, непересекающихся трасс (оптимальных и неоптимальных) для возврата.

Примечание

Если указать MinScoreValue, нельзя указать NumAlnValue или PercentValue.

Совет

Использовать MinScoreValue для возврата неоптимальных выравниваний, например, когда вы заинтересованы в учете ошибок последовательности или несовершенных матриц оценки.

PercentValue

Положительный скаляр между 0 и 100 это ограничивает возврат локальных, непересекающихся трасс (оптимальных и неоптимальных) к этим трассам с оценкой в пределах PercentValue процентов от высшего балла. Например, если наивысший балл 10.5 и вы указываете 5 для PercentValue, то localalign определяет минимальный балл 10.5 – (10.5 * 0.05) = 9.975. Он возвращает все трассы с результатом 9.975 или выше.

Примечание

Если указать PercentValue, нельзя указать NumAlnValue или MinScoreValue.

Совет

Использовать PercentValue чтобы вернуть оптимальные и неоптимальные выравнивания, когда вы не знаете, насколько похожи две последовательности или насколько хорошо они оцениваются по данной матрице оценки.

DoAlignmentValue

Управляет включением попарных трасс в Alignment поле структуры вывода. Варианты: true (по умолчанию) или false.

AlphabetValue

Символьный вектор или строка, указывающая тип последовательностей. Варианты: 'AA' (по умолчанию) или 'NT'.

ScoringMatrixValue

Одно из следующих действий:

  • Символьный вектор или строка, задающая матрицу оценки, которая будет использоваться для локального выравнивания. Варианты аминокислотных последовательностей:

    • 'BLOSUM62'

    • 'BLOSUM30' увеличение на 5 до 'BLOSUM90'

    • 'BLOSUM100'

    • 'PAM10' увеличение на 10 до 'PAM500'

    • 'DAYHOFF'

    • 'GONNET'

    Значение по умолчанию:

    • 'BLOSUM50' - Когда AlphabetValue равняется 'AA'

    • 'NUC44' - Когда AlphabetValue равняется 'NT'

    Примечание

    Предыдущие матрицы оценки, снабженные программным обеспечением, также включают в себя структуру, содержащую масштабный коэффициент, который преобразует единицы выходной оценки в биты. Вы также можете использовать 'Scale' свойство для указания дополнительного масштабного коэффициента для преобразования выходной оценки из битов в другую единицу.

  • Матрица, представляющая матрицу оценки, используемую для локального выравнивания, например, возвращаемая blosum, pam, dayhoff, gonnet, или nuc44 функция.

    Примечание

    При использовании матрицы оценки, созданной или созданной одной из предыдущих функций, матрица не включает масштабный коэффициент. Выходной балл возвращается в тех же единицах, что и матрица оценки. Вы можете использовать 'Scale' свойство, указывающее масштабный коэффициент для преобразования выходной оценки в другую единицу измерения.

Примечание

Если нужно скомпилировать localalign в автономном приложении или программном компоненте, использующем MATLAB Compiler™, используйте матрицу вместо символьного вектора или строки для ScoringMatrixValue.

ScaleValue

Положительное значение, указывающее масштабный коэффициент, который применяется к выходным баллам, тем самым управляя единицами выходных баллов.

Например, если исходная оценка первоначально определяется в битах, и вводится значение log(2) для ScaleValue, то localalign прибыль Score в натс.

По умолчанию: 1, что не изменяет единицы выходного балла.

Примечание

Если 'ScoringMatrix' свойство также задает масштабный коэффициент, затем localalign сначала использует его для масштабирования выходного балла. Затем применяется масштабный коэффициент, заданный ScaleValue для масштабирования выходного балла.

Совет

Прежде чем сравнивать оценки выравнивания из нескольких трасс, убедитесь, что оценки находятся в одних и тех же единицах. Используйте 'Scale' для управления единицами выходных баллов.

GapOpenValue

Положительное значение, определяющее штраф за открытие зазора в трассе.

По умолчанию: 8

Выходные аргументы

AlignStruct

Структура MATLAB или массив структур, содержащих информацию о локальных оптимальных и неоптимальных выравниваниях между двумя последовательностями. Каждая структура представляет оптимальное или неоптимальное выравнивание и содержит следующие поля.

ОбластьОписание
Score

Оценка для локального оптимального или неоптимального выравнивания.

Start

Вектор 1 на 2 индексов, указывающий начальную точку в каждой последовательности для выравнивания.

Stop

Вектор 1 на 2 индексов, указывающих точку остановки в каждой последовательности для трассы.

Alignment

3-by-N символьный массив, показывающий две последовательности, Seq1 и Seq2, в первом и третьем рядах. Он также показывает символы, представляющие оптимальное или неоптимальное локальное выравнивание между двумя последовательностями во второй строке.

Примеры

Ограничьте количество трасс, возвращаемых между двумя последовательностями, задав количество трасс:

% Create variables containing two amino acid sequences.
Seq1 = 'VSPAGMASGYDPGKA';
Seq2 = 'IPGKATREYDVSPAG';

% Use the NumAln property to return information about the
% top three local alignments.
struct1 = localalign(Seq1, Seq2, 'numaln', 3)

struct1 = 

        Score: [3x1 double]
        Start: [3x2 double]
         Stop: [3x2 double]
    Alignment: {3x1 cell}

% View the scores of the first and second alignments.
struct1.Score(1:2)

ans =

   11.0000
    9.6667

% View the first alignment.
struct1.Alignment{1}

ans =

VSPAG
|||||
VSPAG

Ограничьте количество трасс, возвращаемых между двумя последовательностями, указав минимальный балл:

% Create variables containing two amino acid sequences.
Seq1 = 'VSPAGMASGYDPGKA';
Seq2 = 'IPGKATREYDVSPAG';

% Use the MinScore property to return information about
% only local alignments with a score greater than 8.
% Use the DoAlignment property to exclude the actual alignments.
struct2 = localalign(Seq1,Seq2,'minscore',8,'doalignment',false)

struct2 = 

    Score: [2x1 double]
    Start: [2x2 double]
     Stop: [2x2 double]

Ограничьте количество трасс, возвращаемых между двумя последовательностями, указав процент от максимального балла:

% Create variables containing two amino acid sequences.
Seq1 = 'VSPAGMASGYDPGKA';
Seq2 = 'IPGKATREYDVSPAG';

% Use the Percent property to return information about only
% local alignments with a score within 15% of the maximum score.
struct3 = localalign(Seq1, Seq2, 'percent', 15) 

struct3 = 

        Score: [2x1 double]
        Start: [2x2 double]
         Stop: [2x2 double]
    Alignment: {2x1 cell}

Укажите матрицу оценки и штраф за открытие промежутка при выравнивании двух последовательностей:

% Create variables containing two nucleotide sequences.
Seq1 = 'CCAATCTACTACTGCTTGCAGTAC';
Seq2 = 'AGTCCGAGGGCTACTCTACTGAAC';

% Create a scoring matrix with a match score of 10 and a mismatch
% score of -9
sm = [10 -9 -9 -9;
      -9 10 -9 -9;
      -9 -9 10 -9;
      -9 -9 -9 10];

% Use the ScoringMatrix and GapOpen properties when returning
% information about the top three local alignments.
struct4 = localalign(Seq1, Seq2, 'alpha', 'nt', ...
         'scoringmatrix', sm, 'gapopen', 20, 'numaln', 3)

struct4 = 

        Score: [3x1 double]
        Start: [3x2 double]
         Stop: [3x2 double]
    Alignment: {3x1 cell} 

Подробнее

свернуть все

Непересекающиеся трассы

Трассы, не имеющие совпадений или несоответствий.

Оптимальное выравнивание

Расклад с наивысшим баллом.

Неоптимальное выравнивание

Расклад со счетом меньше высшего балла.

Ссылки

[1] Бартон, Г. (1993). Эффективный алгоритм для определения местоположения всех локальных оптимальных выравниваний между двумя последовательностями, допускающий промежутки. CABIOS 9, 729-734.

Представлен в R2009b