exponenta event banner

getCompactAlignment

Класс: BioMap

Построение компактной трассы, представленной в BioMap объект

Синтаксис

CompAlignment = getCompactAlignment(BioObj, StartPos, EndPos)
CompAlignment = getCompactAlignment(BioObj, StartPos, EndPos, R)
CompAlignment = getCompactAlignment(..., 'ParameterName', ParameterValue)
[CompAlignment, Indices] = getCompactAlignment(...)
[CompAlignment, Indices, Rows] = getCompactAlignment(...)

Описание

CompAlignment = getCompactAlignment(BioObj, StartPos, EndPos) прибыль CompAlignment, символьный массив, содержащий выровненные последовательности чтения из BioObj, a BioMap объект, в компактном формате. Считываемые последовательности должны быть выровнены в пределах определенной области ссылочной последовательности, которая определяется StartPos и EndPos, два положительных целых числа, такие, что StartPos меньше, чем EndPosи оба меньше длины опорной последовательности.

CompAlignment = getCompactAlignment(BioObj, StartPos, EndPos, R) выбирает ссылку, где getCompactAlignment восстанавливает трассу.

CompAlignment = getCompactAlignment(..., 'ParameterName', ParameterValue) принимает одну или несколько пар имя/значение параметра, разделенных запятыми. Определить ParameterName внутри одиночных кавычек.

[CompAlignment, Indices] = getCompactAlignment(...) прибыль Indicesвектор индексов, задающий считанные последовательности, которые выравниваются в пределах определенной области опорной последовательности.

[CompAlignment, Indices, Rows] = getCompactAlignment(...) прибыль Rows, вектор положительных чисел, указывающий строку в CompAlignment где каждая последовательность считывания отображается наилучшим образом.

Входные аргументы

BioObj

Объект BioMap класс.

StartPos

Положительное целое число, определяющее начало области ссылочной последовательности. StartPos должно быть меньше, чем EndPosи меньше, чем общая длина ссылочной последовательности.

EndPos

Положительное целое число, определяющее конец области ссылочной последовательности. EndPos должно быть больше, чем StartPosи меньше, чем общая длина ссылочной последовательности.

R

Положительное целочисленное индексирование SequenceDictionary имущество BioObjили символьный вектор или строку, указывающую фактическое имя ссылки.

Аргументы пары «имя-значение»

'Full'

Указывает, следует ли включать только те считанные последовательности, которые полностью выровнены с определенной областью ссылочной последовательности, т.е. они полностью содержатся в области и не выходят за ее пределы. Варианты: true или false (по умолчанию).

По умолчанию: false

'TrimAlignment'

Определяет необходимость обрезки пустых начальных и конечных столбцов трассы. Варианты: true или false. По умолчанию: false, которая не обрезает трассу, но включает любые пустые начальные или конечные столбцы, и возвращает трассу всегда длиной EndPosStartPos + 1.

По умолчанию: false

Выходные аргументы

CompAlignment

Символьный массив, содержащий выровненные последовательности чтения из BioObj которые выравниваются в пределах требуемой области. Символьный массив представляет компактное выравнивание, то есть каждая строка символьного массива содержит одну или несколько выровненных последовательностей, так что количество строк в символьном массиве минимизировано. Каждая выровненная последовательность включает в себя только позиции последовательности, которые попадают в запрашиваемую область, и каждая выровненная последовательность может включать в себя промежутки.

Indices

Вектор индексов, определяющих последовательности считывания из BioObj которые выравниваются в пределах требуемой области.

Rows

Вектор положительных чисел, указывающий строку в CompAlignment где каждая последовательность считывания отображается наилучшим образом.

Примеры

Построить BioMap объект, а затем построить компактное выравнивание между позициями 30 и 59 ссылочной последовательности:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Construct the compact alignment between positions 30 and 59 of
% the reference sequence, and return the indices of the reads in the
% compact alignment, as well as the row each read is in. 
[CompAlignment, Ind, Row] = getCompactAlignment(BMObj1, 30, 59)
CompAlignment =

TAACTCG      GCCCAGCATTAGGGAGC
TAACTCGT           CATTAGGGAGC
TAACTCGTCC          ATTAGGGAGC
TAACTCTTCTCT         TTAGGGAGC
TAACTCGTCCATGG        TAGGGAGC
TAACTCGTCCCTGGCCCA           C
TAACTCGTCCATGGCCCAG           
TAACTCGTCCATTGCCCAGC          
TAACTCGTCCATGGCCCAGCATT       
TAACTCGTCCATGGCCCAGCATTTGGG   
TAACTCGTCCATGGCCCAGCATTAGGG   
TAACTCGTCCATGGCCCAGCATTAGGGAGC
TAACTCGTCCATGGCCCAGCATTAGGGATC
TAACTCGTCCATGGCCCAGCATTAGGGAGC
 AACTCGTCCATGGCCCAGCATTAGGGAGC
      GTACATGGCCCAGCATTAGGGAGC
       TCCATGGCCCAGCATTAGGGCGC


Ind =

     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23


Row =

     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
     1
     2
     3
     4
     5
     6

Алгоритмы

getCompactAlignment предполагает, что ссылочная последовательность не имеет промежутков. Поэтому положения в считываниях, соответствующие вставкам (I) и заполнению (P), не появляются в выравнивании.

Поскольку мягкие отсеченные позиции (S) не связаны с позициями, которые выравниваются по ссылочной последовательности, они не отображаются в трассе.

Пропущенная позиция (N) отображается как - (дефис) в трассе.

Жестко отсеченные позиции (H) не отображаются в последовательностях или выравнивании.