exponenta event banner

getBaseCoverage

Класс: BioMap

Возврат покрытия базовой выставки ссылочной последовательности в BioMap объект

Синтаксис

Cov = getBaseCoverage(BioObj, StartPos, EndPos)
Cov = getBaseCoverage(BioObj, StartPos, EndPos, R)
Cov = getBaseCoverage(..., Name,Value)
[Cov, BinStart] = getBaseCoverage(...)

Описание

Cov = getBaseCoverage(BioObj, StartPos, EndPos) прибыль Cov, вектор строки неотрицательных целых чисел. Этот вектор указывает охват выравнивания по основанию диапазона или набора диапазонов в ссылочной последовательности в BioObj, a BioMap объект. Диапазон или набор диапазонов определяются StartPos и EndPos. StartPos и EndPos могут быть двумя неотрицательными целыми числами, такими, что StartPos меньше, чем EndPosи оба целых числа меньше длины опорной последовательности. StartPos и EndPos также могут быть двумя векторами столбцов, представляющими набор диапазонов (перекрывающихся или сегментированных). Когда StartPos и EndPos укажите сегментированный диапазон, Cov содержит NaN значения для базовых положений между сегментами.

Cov = getBaseCoverage(BioObj, StartPos, EndPos, R) выбирает ссылку, где getBaseCoverage вычисляет покрытие.

Cov = getBaseCoverage(..., Name,Value) возвращает информацию об покрытии трассы с дополнительными опциями, указанными одним или несколькими Name,Value аргументы пары.

[Cov, BinStart] = getBaseCoverage(...) прибыль BinStart, вектор строки положительных целых чисел, задающий начальное положение каждого бина (когда происходит биннинг).

Входные аргументы

BioObj

Объект BioMap класс.

StartPos

Одно из следующих действий:

  • Неотрицательное целое число, определяющее начало диапазона в ссылочной последовательности. StartPos должно быть меньше, чем EndPos и меньше, чем общая длина опорной последовательности.

  • Вектор столбца неотрицательных целых чисел, каждый из которых определяет начало диапазона в ссылочной последовательности.

EndPos

Одно из следующих действий:

  • Неотрицательное целое число, определяющее конец диапазона в ссылочной последовательности. EndPos должно быть больше, чем StartPos и меньше, чем общая длина опорной последовательности.

  • Вектор столбца неотрицательных целых чисел, каждый из которых определяет конец диапазона в ссылочной последовательности.

R

Положительное целочисленное индексирование SequenceDictionary имущество BioObjили символьный вектор или строку, указывающую фактическое имя ссылки.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

'binWidth'

Положительное целое число, указывающее ширину ячейки в количестве базовых пар (bp). Ячейки центрируются в пределах min(StartPos) и max(EndPos). Таким образом, первый и последний бункеры примерно поровну выходят за пределы диапазона от min(StartPos) кому max (EndPos).

Примечание

Вы не можете указать оба binWidth и numberOfBins.

'numberOfBins'

Положительное целое число, указывающее количество ячеек равной ширины, используемых для охвата запрашиваемой области. Ячейки центрируются в пределах min(StartPos) и max(EndPos). Таким образом, первый и последний бункеры примерно поровну выходят за пределы диапазона от min(StartPos) кому max (EndPos).

Примечание

Вы не можете указать оба binWidth и numberOfBins.

'binType'

Символьный вектор или строка, задающая алгоритм объединения. Возможны следующие варианты:

  • 'max' - Из бункера, getBaseCoverage выбирает базовую позицию с максимальным выравниванием считываний, затем использует ее значение покрытия выравнивания для ячейки.

  • 'min' - Из бункера, getBaseCoverage выбирает базовую позицию с выравниванием наименьших считываний, затем использует ее значение покрытия выравнивания для ячейки.

  • 'mean' - использует среднее покрытие выравнивания, вычисленное по всем базовым позициям в ячейке.

По умолчанию: 'max'

'complementRanges'

Указывает, следует ли возвращать покрытие трассы для базовых позиций между сегментами, а не внутри сегментов. Если true, длина Cov является numel(min(StartPos):max(EndPos)), и Cov содержит NaN значения для базовых позиций в сегментах.

По умолчанию: false

'Spliced'

Логическое указание того, сплайсируются ли короткие чтения во время картирования (как при картировании мРНК в геном). N символов в Signature свойства объекта не учитываются.

По умолчанию: false

Выходные аргументы

Cov

Вектор строки неотрицательных целых чисел. Этот вектор определяет количество последовательностей считывания, которые выравниваются с каждой базовой позицией или ячейкой в требуемых областях. Набор диапазонов может перекрываться или сегментироваться. Для диапазона длина Cov является numel(StartPos:EndPos). Для сегментированного диапазона длина Cov является numel(min(StartPos):max(EndPos)). Cov содержит NaN значения для базовых положений между сегментами. При биннинге количество элементов в Cov равно количеству ячеек.

BinStart

Вектор строки положительных целых чисел, указывающий начальное положение каждого элемента. BinStart имеет ту же длину, что и Cov. Если биннинг не происходит, то BinStart равняется min(StartPos):max(EndPos).

Примеры

Построить BioMap объект, а затем возвратить покрытие выравнивания каждой из первых 12 базовых позиций опорной последовательности:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the number of reads that align to each of
% the first 12 base positions of the reference sequence
cov = getBaseCoverage(BMObj1, 1, 12)
cov =

     1     1     2     2     3     4     4     4     5     5     5     5

Построить BioMap объект, а затем возвратить покрытие выравнивания диапазона от 1 до 1000, на основе bin-by-bin, используя ячейки шириной 100 bp:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the number of reads that align to each 100-bp bin
% in the 1:1000 range of the reference sequence. Also return the
% start position of each bin
[cov, bin_starts] = getBaseCoverage(BMObj1, 1, 1000, 'binWidth', 100)
cov =

    17    20    41    44    45    48    48    45    46    42


bin_starts =

     1   101   201   301   401   501   601   701   801   901