getCompactAlignment

Класс: BioMap

Создайте компактное выравнивание, представленное в объекте BioMap

Синтаксис

CompAlignment = getCompactAlignment(BioObj, StartPos, EndPos)
CompAlignment = getCompactAlignment(BioObj, StartPos, EndPos, R)
CompAlignment = getCompactAlignment(..., 'ParameterName', ParameterValue)
[CompAlignment, Indices] = getCompactAlignment(...)
[CompAlignment, Indices, Rows] = getCompactAlignment(...)

Описание

CompAlignment = getCompactAlignment(BioObj, StartPos, EndPos) возвращает CompAlignment, символьный массив, содержащий выровненные последовательности чтения от BioObj, объекта BioMap, в компактном формате. Последовательности чтения должны выровняться в определенной области ссылочной последовательности, которая задана StartPos и EndPos, двумя положительными целыми числами, таким образом, что StartPos является меньше, чем EndPos, и оба меньше, чем длина ссылочной последовательности.

CompAlignment = getCompactAlignment(BioObj, StartPos, EndPos, R) выбирает ссылку, где getCompactAlignment восстанавливает выравнивание.

CompAlignment = getCompactAlignment(..., 'ParameterName', ParameterValue) принимает один или несколько разделенное от запятой название параметра / пары значения. Задайте ParameterName в одинарных кавычках.

[CompAlignment, Indices] = getCompactAlignment(...) возвращает Indices, вектор индексов, задающих последовательности чтения, которые выравниваются в определенной области ссылочной последовательности.

[CompAlignment, Indices, Rows] = getCompactAlignment(...) возвращает Rows, вектор положительных чисел, задающих строку в CompAlignment, где каждая последовательность чтения лучше всего отображена.

Входные параметры

BioObj

Объект класса BioMap.

StartPos

Положительное целое число, которое задает запуск области ссылочной последовательности. StartPos должен быть меньше, чем EndPos, и меньший, чем общая длина ссылочной последовательности.

EndPos

Положительное целое число, которое задает конец области ссылочной последовательности. EndPos должен быть больше, чем StartPos и меньшим, чем общая длина ссылочной последовательности.

R

Положительное целое число, индексирующее свойство SequenceDictionary BioObj, или вектор символов или строку, задающую подлинное имя ссылки.

Аргументы в виде пар имя-значение

'Full'

Задает, включать ли только последовательности чтения, которые полностью выравниваются с заданной областью ссылочной последовательности, то есть, они полностью содержатся в области и не расширяют вне области. Выбором является true или false (значение по умолчанию).

По умолчанию: false

'TrimAlignment'

Задает, обрезать ли пустое продвижение и запаздывающие столбцы от выравнивания. Выбором является true или false. Значением по умолчанию является false, который не обрезает выравнивание, но включает любое пустое продвижение или запаздывающие столбцы, и всегда возвращает выравнивание длины EndPosStartPos + 1.

По умолчанию: false

Выходные аргументы

CompAlignment

Символьный массив, содержащий выровненные последовательности чтения от BioObj, которые выравниваются в требуемой области. Символьный массив представляет компактное выравнивание, которое является каждой строкой символьного массива, содержит одну или несколько выровненных последовательностей, таких, что количество строк в символьном массиве минимизировано. Каждая выровненная последовательность включает только положения последовательности, которые находятся в пределах требуемой области, и каждая выровненная последовательность может включать разрывы.

Indices

Вектор индексов, задающих последовательности чтения от BioObj, которые выравниваются в требуемой области.

Rows

Вектор положительных чисел, задающих строку в CompAlignment, где каждая последовательность чтения лучше всего отображена.

Примеры

Создайте объект BioMap, и затем создайте компактное выравнивание между положениями 30 и 59 ссылочной последовательности:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Construct the compact alignment between positions 30 and 59 of
% the reference sequence, and return the indices of the reads in the
% compact alignment, as well as the row each read is in. 
[CompAlignment, Ind, Row] = getCompactAlignment(BMObj1, 30, 59)
CompAlignment =

TAACTCG      GCCCAGCATTAGGGAGC
TAACTCGT           CATTAGGGAGC
TAACTCGTCC          ATTAGGGAGC
TAACTCTTCTCT         TTAGGGAGC
TAACTCGTCCATGG        TAGGGAGC
TAACTCGTCCCTGGCCCA           C
TAACTCGTCCATGGCCCAG           
TAACTCGTCCATTGCCCAGC          
TAACTCGTCCATGGCCCAGCATT       
TAACTCGTCCATGGCCCAGCATTTGGG   
TAACTCGTCCATGGCCCAGCATTAGGG   
TAACTCGTCCATGGCCCAGCATTAGGGAGC
TAACTCGTCCATGGCCCAGCATTAGGGATC
TAACTCGTCCATGGCCCAGCATTAGGGAGC
 AACTCGTCCATGGCCCAGCATTAGGGAGC
      GTACATGGCCCAGCATTAGGGAGC
       TCCATGGCCCAGCATTAGGGCGC


Ind =

     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23


Row =

     1
     2
     3
     4
     5
     6
     7
     8
     9
    10
    11
    12
    13
    14
    15
    16
    17
     1
     2
     3
     4
     5
     6

Алгоритмы

getCompactAlignment принимает, что ссылочная последовательность не имеет никаких разрывов. Поэтому положения в чтениях, соответствующих вставкам (I) и дополняющих (P), не появляются в выравнивании.

Поскольку мягкие отсеченные положения (S) не сопоставлены с положениями, которые выравниваются к ссылочной последовательности, они не появляются в выравнивании.

Пропущенное положение (N) появляется как - (дефис) в выравнивании.

Трудно отсеченные положения (H) не появляются в последовательностях или выравнивании.