getBaseCoverage

Класс: BioMap

Возвратите покрытие выравнивания основы основой ссылочной последовательности в объекте BioMap

Синтаксис

Cov = getBaseCoverage(BioObj, StartPos, EndPos)
Cov = getBaseCoverage(BioObj, StartPos, EndPos, R)
Cov = getBaseCoverage(..., Name,Value)
[Cov, BinStart] = getBaseCoverage(...)

Описание

Cov = getBaseCoverage(BioObj, StartPos, EndPos) возвращает Cov, вектор - строку из неотрицательных целых чисел. Этот вектор указывает на покрытие выравнивания основы основой области значений или набор областей значений в ссылочной последовательности в BioObj, объекте BioMap. Область значений или набор областей значений заданы StartPos и EndPos. StartPos и EndPos могут быть двумя неотрицательными целыми числами, таким образом, что StartPos является меньше, чем EndPos, и оба целых числа меньше, чем длина ссылочной последовательности. StartPos и EndPos могут также быть двумя вектор-столбцами, представляющими набор областей значений (наложение или сегментированный). Когда StartPos и EndPos задают сегментированную область значений, Cov содержит значения NaN для основных положений между сегментами.

Cov = getBaseCoverage(BioObj, StartPos, EndPos, R) выбирает ссылку, где getBaseCoverage вычисляет покрытие.

Cov = getBaseCoverage(..., Name,Value) возвращает информацию о покрытии выравнивания с дополнительными опциями, заданными одним или несколькими аргументами пары Name,Value.

[Cov, BinStart] = getBaseCoverage(...) возвращает BinStart, вектор - строку из положительных целых чисел, задающих положение запуска каждого интервала (когда раскладывание происходит).

Входные параметры

BioObj

Объект класса BioMap.

StartPos

Любое из следующего:

  • Неотрицательное целое число, которое задает запуск области значений в ссылочной последовательности. StartPos должен быть меньше, чем EndPos и меньший, чем общая длина ссылочной последовательности.

  • Вектор-столбец неотрицательных целых чисел, каждый задающий запуск области значений в ссылочной последовательности.

EndPos

Любое из следующего:

  • Неотрицательное целое число, которое задает конец области значений в ссылочной последовательности. EndPos должен быть больше, чем StartPos и меньшим, чем общая длина ссылочной последовательности.

  • Вектор-столбец неотрицательных целых чисел, каждый задающий конец области значений в ссылочной последовательности.

R

Положительное целое число, индексирующее свойство SequenceDictionary BioObj, или вектор символов или строку, задающую подлинное имя ссылки.

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

'binWidth'

Положительное целое число, задающее ширину интервала, в количестве пар оснований (BP). Интервалы сосредоточены в min(StartPos) и max(EndPos). Таким образом первые и последние интервалы охватывают приблизительно одинаково вне диапазона от min(StartPos) до max (EndPos).

Примечание

Вы не можете задать и binWidth и numberOfBins.

'numberOfBins'

Положительное целое число, задающее количество интервалов равной ширины, чтобы использовать, чтобы охватить требуемую область. Интервалы сосредоточены в min(StartPos) и max(EndPos). Таким образом первые и последние интервалы охватывают приблизительно одинаково вне диапазона от min(StartPos) до max (EndPos).

Примечание

Вы не можете задать и binWidth и numberOfBins.

'binType'

Вектор символов или строка, задающая алгоритм раскладывания. Выбор:

  • Max От интервала getBaseCoverage выбирает основное положение с большинством чтений, выровненных к нему, затем использует его значение покрытия выравнивания для интервала.

  • min От интервала getBaseCoverage выбирает основное положение с наименьшим количеством чтений, выровненных к нему, затем использует его значение покрытия выравнивания для интервала.

  • среднее значение Использует среднее покрытие выравнивания, вычисленное из всех основных положений в интервале.

Значение по умолчанию: 'max'

'complementRanges'

Задает, возвратить ли покрытие выравнивания для основных положений между сегментами, вместо в сегментах. Если true, длиной Cov является numel(min(StartPos):max(EndPos)), и Cov содержит значения NaN для основных положений в сегментах.

По умолчанию: false

'Spliced'

Логическое определение, соединены ли короткие чтения во время отображения (как в mRNA к геному, сопоставляющем). N символы в свойстве Signature объекта не считаются.

По умолчанию: false

Выходные аргументы

Cov

Вектор - строка из неотрицательных целых чисел. Этот вектор задает количество последовательностей чтения, которые выравниваются с каждым основным положением или интервалом в требуемых областях. Набор областей значений может накладываться или сегментированный. Для области значений длиной Cov является numel(StartPos:EndPos). Для сегментированной области значений длиной Cov является numel(min(StartPos):max(EndPos)). Cov содержит значения NaN для основных положений между сегментами. Когда раскладывание происходит, число элементов в Cov равняется количеству интервалов.

BinStart

Вектор - строка из положительных целых чисел, задающих положение запуска каждого интервала. BinStart является той же длиной как Cov. Если никакое раскладывание не происходит, то BinStart равняется min(StartPos):max(EndPos).

Примеры

Создайте объект BioMap, и затем возвратите покрытие выравнивания каждого из первых 12 основных положений ссылочной последовательности:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the number of reads that align to each of
% the first 12 base positions of the reference sequence
cov = getBaseCoverage(BMObj1, 1, 12)
cov =

     1     1     2     2     3     4     4     4     5     5     5     5

Создайте объект BioMap, и затем возвратите покрытие выравнивания области значений между 1 и 1000, на основе интервала интервалом, с помощью интервалов с шириной 100 BP:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the number of reads that align to each 100-bp bin
% in the 1:1000 range of the reference sequence. Also return the
% start position of each bin
[cov, bin_starts] = getBaseCoverage(BMObj1, 1, 1000, 'binWidth', 100)
cov =

    17    20    41    44    45    48    48    45    46    42


bin_starts =

     1   101   201   301   401   501   601   701   801   901