align2cigar

Преобразуйте выровненные последовательности в соответствующие сигнатуры в формате CIGAR

Синтаксис

[Cigars,Starts] = align2cigar(Alignment,Ref)

Описание

[Cigars,Starts] = align2cigar(Alignment,Ref) преобразует выровненные последовательности, представленные в Alignment, массив ячеек из выровненных векторов символов, вектора строк или символьного массива в Cigars, массив ячеек из соответствующих CIGAR-форматированных векторов символов или строкового вектора, с использованием ссылочной последовательности, заданной Ref, вектор символов или строка. Также возвращается Startsвектор из целых чисел, указывающий начальное положение каждой выровненной последовательности относительно неотключенной опорной последовательности.

Входные параметры

Alignment

Массив ячеек из вектора символов, вектора строк или символьного массива, представляющего выровненные последовательности. Мягкие усечения приняты в виде строчных букв в выровненных последовательностях. Пропущенные позиции приняты представленными. в выровненных последовательностях.

Ref

Вектор символов или строка, задающая выровненную ссылочную последовательность. Длина Ref должно равняться количеству столбцов в Alignment.

Выходные аргументы

Cigars

Массив ячеек из CIGAR-форматированных ячеек из символьных векторов или строкового вектора, соответствующего каждой выровненной последовательности в Alignment.

Starts

Вектор целых чисел, указывающий начальное положение каждой выровненной последовательности относительно неотключенной опорной последовательности.

Примеры

свернуть все

В этом примере показано, как преобразовать выровненные строки в строки CIGAR

Создайте массив ячеек из выровненных строк, создайте строку, задающую ссылочную последовательность, а затем преобразуйте выравнивание в строки CIGAR:

aln = ['ACG-ATGC'; 'ACGT-TGC'; '  GTAT-C']
aln = 3x8 char array
    'ACG-ATGC'
    'ACGT-TGC'
    '  GTAT-C'

ref =  'ACGTATGC';
[cigar, start] = align2cigar(aln, ref)
cigar = 1x3 cell
    {'3=1D4='}    {'4=1D3='}    {'4=1D1='}

start = 1×3

     1     1     3

Введенный в R2010b