getBaseCoverage

Класс: BioMap

Верните базовый по основаниям охват выравниванием последовательности ссылки в BioMap объект

Синтаксис

Cov = getBaseCoverage(BioObj, StartPos, EndPos)
Cov = getBaseCoverage(BioObj, StartPos, EndPos, R)
Cov = getBaseCoverage(..., Name,Value)
[Cov, BinStart] = getBaseCoverage(...)

Описание

Cov = getBaseCoverage(BioObj, StartPos, EndPos) возвращает Cov, вектор-строка из неотрицательных целых чисел. Этот вектор указывает базовый охват выравнивания области значений или набора значений в опорной последовательности в BioObj, а BioMap объект. Области значений или набор областей значений определяются StartPos и EndPos. StartPos и EndPos могут быть двумя неотрицательными целыми числами, такими что StartPos меньше EndPosи оба целых чисел меньше длины ссылки последовательности. StartPos и EndPos могут также быть два векторов-столбцов, представляющими набор областями значений (перекрывающихся или сегментированных). Когда StartPos и EndPos задайте сегментированную область значений, Cov содержит NaN значения для базовых положений между сегментами.

Cov = getBaseCoverage(BioObj, StartPos, EndPos, R) выбирает ссылку где getBaseCoverage вычисляет покрытие.

Cov = getBaseCoverage(..., Name,Value) возвращает информацию о покрытии выравнивания с дополнительными опциями, заданными одним или несколькими Name,Value аргументы в виде пар.

[Cov, BinStart] = getBaseCoverage(...) возвращает BinStart, вектор-строка положительных целых чисел, задающих начальное положение каждого интервала (когда происходит раскладывание).

Входные параметры

BioObj

Объект BioMap класс.

StartPos

Одно из следующих:

  • Неотрицательное целое число, которое задает начало области значений в ссылочной последовательности. StartPos должно быть меньше EndPos и меньше, чем общая длина последовательности ссылки.

  • Вектор-столбец неотрицательных целых чисел, каждый из которых определяет начало области значений в ссылку последовательности.

EndPos

Одно из следующих:

  • Неотрицательное целое число, которое задает конец области значений в ссылочной последовательности. EndPos должно быть больше StartPos и меньше, чем общая длина последовательности ссылки.

  • Вектор-столбец неотрицательных целых чисел, каждый из которых определяет конец области значений в ссылку последовательности.

R

Положительное целое число, индексирующее SequenceDictionary свойство BioObj, или вектор символов или строка, задающая фактическое имя ссылки.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

'binWidth'

Положительное целое число, задающее ширину интервала, в количестве пар оснований (bp). Интервалы центрируются в пределах min (StartPos) и макс. (EndPos). Таким образом, первое и последнее интервалы распространяются приблизительно одинаково вне области значений от min (StartPos) до максимума (EndPos).

Примечание

Вы не можете задать оба binWidth и numberOfBins.

'numberOfBins'

Положительное целое число, указывающее количество интервалов равной ширины, используемых для охвата запрашиваемой области. Интервалы центрируются в пределах min (StartPos) и макс. (EndPos). Таким образом, первое и последнее интервалы распространяются приблизительно одинаково вне области значений от min (StartPos) до максимума (EndPos).

Примечание

Вы не можете задать оба binWidth и numberOfBins.

'binType'

Вектор символов или строка, задающая алгоритм раскладывания. Варианты:

  • 'max' - Из интервала, getBaseCoverage выбирает базовое положение с наибольшим количеством показаний, выровненных по нему, затем использует значение покрытия выравнивания для интервала.

  • 'min' - Из интервала, getBaseCoverage выбирает базовое положение с выровненными по нему наименьшими показаниями, затем использует значение покрытия выравнивания для интервала.

  • 'mean' - Используется средний охват выравниванием, вычисленный из всех базовых положений в интервале.

По умолчанию: 'max'

'complementRanges'

Определяет, возвращать ли покрытие выравнивания для базовых положений между сегментами, а не внутри сегментов. Если true, длина Cov является numel (min (StartPos): макс (EndPos)), и Cov содержит NaN значения для базовых положений в сегментах.

По умолчанию: false

'Spliced'

Логическое определение того, сращиваются ли короткие чтения во время отображения (как при отображении мРНК к геному). N символов в Signature свойство объекта не учитывается.

По умолчанию: false

Выходные аргументы

Cov

Вектор-строка из неотрицательных целых чисел. Этот вектор задает количество последовательностей считывания, которые совпадают с каждым базовым положением или интервалом в запрашиваемых областях. Набор областей значений может быть перекрывающимся или сегментированным. Для области значений, длина Cov является numel (StartPos: EndPos). Для сегментированной области значений длина Cov является numel (min (StartPos): макс (EndPos)). Cov содержит NaN значения для базовых положений между сегментами. Когда происходит раскладывание, количество элементов в Cov равен количеству интервалов.

BinStart

Вектор-строка положительных целых чисел, задающий начальное положение каждого интервала. BinStart - такая же длина, как и Cov. Если раскладывание не происходит, то BinStart равен min (StartPos): макс (EndPos).

Примеры

Создайте a BioMap Объекту и затем верните покрытие выравнивания каждого из первых 12 базовых положений последовательности ссылки:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the number of reads that align to each of
% the first 12 base positions of the reference sequence
cov = getBaseCoverage(BMObj1, 1, 12)
cov =

     1     1     2     2     3     4     4     4     5     5     5     5

Создайте a BioMap объект, а затем возвращает охват выравнивания области значений между 1 и 1000, на базис интервала на интервале, используя интервалы шириной 100 б.п.:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the number of reads that align to each 100-bp bin
% in the 1:1000 range of the reference sequence. Also return the
% start position of each bin
[cov, bin_starts] = getBaseCoverage(BMObj1, 1, 1000, 'binWidth', 100)
cov =

    17    20    41    44    45    48    48    45    46    42


bin_starts =

     1   101   201   301   401   501   601   701   801   901