Преобразование неориентированных последовательностей в выровненные последовательности с использованием сигнатур в формате CIGAR
Alignment = cigar2align(Seqs,Cigars)
[GapSeq, Indices] = cigar2align(Seqs,Cigars)
... = cigar2align(Seqs,Cigars,Name,Value)
преобразует неориентированные последовательности в Alignment = cigar2align(Seqs,Cigars)Seqs, массив ячеек символьных векторов или строкового вектора, в Alignmentматрица выровненных последовательностей, использующая информацию, сохраненную в Cigarsмассив ячеек векторов символов в формате CIGAR или строкового вектора.
[ преобразует неориентированные последовательности в GapSeq, Indices] = cigar2align(Seqs,Cigars)Seqs, массив ячеек символьных векторов или строкового вектора, в GapSeq, клеточный массив символьных векторов выровненных последовательностей, а также возвращает Indices, вектор числовых индексов, использующий информацию, хранящуюся в Cigarsмассив ячеек векторов символов в формате CIGAR или строкового вектора. Когда трасса имеет много столбцов, этот синтаксис использует меньше памяти и быстрее.
... = cigar2align( преобразует неориентированные последовательности в Seqs,Cigars,Name,Value)Seqs, массив ячеек символьных векторов или строкового вектора, в Alignmentматрица выровненных последовательностей, использующая информацию, сохраненную в Cigars, массив ячеек векторов символов в формате CIGAR или строкового вектора с дополнительными опциями, заданными одним или несколькими Name,Value аргументы пары.
|
Массив ячеек символьных векторов или строковых векторов, содержащих неориентированные последовательности. |
|
Массив ячеек допустимых векторов символов в формате CIGAR или строкового вектора. |
Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.
|
Вектор положительных целых чисел, задающий положение опорной последовательности, с которого начинается каждая выровненная последовательность. По умолчанию каждая выровненная последовательность начинается с позиции 1 ссылочной последовательности. |
|
Логическое задание отображения позиций в выровненных последовательностях, соответствующих промежуткам в ссылочной последовательности. Варианты: По умолчанию: |
|
Логическое определение необходимости включения символов в выровненные последовательности чтения, соответствующие окончаниям мягкого отсечения. Варианты: По умолчанию: |
|
Логическое указание, следует ли добавлять пробелы заполнения слева от каждой выровненной последовательности считывания для представления смещения начальной позиции от первой позиции ссылочной последовательности. Варианты: По умолчанию: |
|
Матрица выровненных последовательностей, в которой число строк равно числу символьных векторов в |
|
Массив ячеек символьных векторов выровненных последовательностей, в котором числовые символьные векторы равны количеству символьных векторов в |
|
Вектор числовых индексов, указывающий начальный столбец для каждой выровненной последовательности в
|
Создание массива ячеек из символьных векторов, содержащих неориентированные последовательности, создание массива ячеек из соответствующих символьных векторов в формате CIGAR, связанных с ссылочной последовательностью ACGTATGC, а затем реконструируйте трассу:
r = {'ACGACTGC', 'ACGTTGC', 'AGGTATC'}; % unaligned sequences
c = {'3M1D1M1I3M', '4M1D1P3M', '5M1P1M1D1M'}; % cigar-formatted
aln1 = cigar2align(r, c)aln1 = ACG-ATGC ACGT-TGC AGGTAT-C
Выполните реконструкцию той же трассы для отображения позиций в выровненных последовательностях, соответствующих промежуткам в ссылочной последовательности:
aln2 = cigar2align(r, c,'GapsInRef',true)
aln2 = ACG-ACTGC ACGT--TGC AGGTA-T-C
Восстановить трассу, добавив смещение заполнения 5:
aln3 = cigar2align(r, c, 'start', [5 5 5], 'OffsetPad', true)
aln3 =
ACG-ATGC
ACGT-TGC
AGGTAT-CКогда cigar2align восстанавливает выравнивание, оно не отображает жестко отсеченные положения (H) или мягкие отсеченные положения (S). Кроме того, оно не рассматривает мягкие отсеченные положения как начальные положения для выровненных последовательностей.
Если информация CIGAR записана в Signature свойство BioMap объект, вы можете использовать getAlignment метод построения трассы.
align2cigar | BioMap | getAlignment | getBaseCoverage | getCompactAlignment | seqalignviewer