getBaseCoverage

Класс: BioMap

Возвратите покрытие выравнивания основы основой ссылочной последовательности в BioMap объект

Синтаксис

Cov = getBaseCoverage(BioObj, StartPos, EndPos)
Cov = getBaseCoverage(BioObj, StartPos, EndPos, R)
Cov = getBaseCoverage(..., Name,Value)
[Cov, BinStart] = getBaseCoverage(...)

Описание

Cov = getBaseCoverage(BioObj, StartPos, EndPos) возвращает Cov, вектор-строка из неотрицательных целых чисел. Этот вектор указывает на покрытие выравнивания основы основой области значений или набор областей значений в ссылочной последовательности в BioObjA BioMap объект. Область значений или набор областей значений заданы StartPos и EndPosstartPos и EndPos могут быть два неотрицательных целых числа, таким образом что StartPos меньше EndPos, и оба целых числа меньше, чем длина ссылочной последовательности. StartPos и EndPos могут также быть два вектор-столбца, представляющие набор областей значений (наложение или сегментированный). Когда StartPos и EndPos укажите сегментированный диапазон, Cov содержит NaN значения для основных положений между сегментами.

Cov = getBaseCoverage(BioObj, StartPos, EndPos, R) выбирает ссылку где getBaseCoverage вычисляет покрытие.

Cov = getBaseCoverage(..., Name,Value) возвращает информацию о покрытии выравнивания с дополнительными опциями, заданными одним или несколькими Name,Value парные аргументы.

[Cov, BinStart] = getBaseCoverage(...) возвращает BinStart, вектор-строка из положительных целых чисел, задающих положение запуска каждого интервала (когда раскладывание происходит).

Входные параметры

BioObj

Объект BioMap класс.

StartPos

Любое из следующего:

  • Неотрицательное целое число, которое задает запуск области значений в ссылочной последовательности. StartPos должен быть меньше EndPos и меньший, чем общая длина ссылочной последовательности.

  • Вектор-столбец неотрицательных целых чисел, каждый задающий запуск области значений в ссылочной последовательности.

EndPos

Любое из следующего:

  • Неотрицательное целое число, которое задает конец области значений в ссылочной последовательности. EndPos должен быть больше StartPos и меньший, чем общая длина ссылочной последовательности.

  • Вектор-столбец неотрицательных целых чисел, каждый задающий конец области значений в ссылочной последовательности.

R

Положительное целое число, индексирующее SequenceDictionary свойство BioObj, или вектор символов или строка, задающая подлинное имя ссылки.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

'binWidth'

Положительное целое число, задающее ширину интервала, в количестве пар оснований (BP). Интервалы сосредоточены в течение min (StartPos) и макс. (EndPos). Таким образом первые и последние интервалы охватывают приблизительно одинаково вне диапазона с min (StartPos) к макс. (EndPos).

Примечание

Вы не можете задать оба binWidth и numberOfBins.

'numberOfBins'

Положительное целое число, задающее количество интервалов равной ширины, чтобы использовать, чтобы охватить требуемую область. Интервалы сосредоточены в течение min (StartPos) и макс. (EndPos). Таким образом первые и последние интервалы охватывают приблизительно одинаково вне диапазона с min (StartPos) к макс. (EndPos).

Примечание

Вы не можете задать оба binWidth и numberOfBins.

'binType'

Вектор символов или строка, задающая алгоритм раскладывания. Выбор:

  • 'max' — От интервала, getBaseCoverage выбирает основное положение с большинством чтений, выровненных к нему, затем использует его значение покрытия выравнивания для интервала.

  • 'min' — От интервала, getBaseCoverage выбирает основное положение с наименьшим количеством чтений, выровненных к нему, затем использует его значение покрытия выравнивания для интервала.

  • 'mean' — Использует среднее покрытие выравнивания, вычисленное из всех основных положений в интервале.

Значение по умолчанию: 'max'

'complementRanges'

Задает, возвратить ли покрытие выравнивания для основных положений между сегментами, вместо в сегментах. Если true, длина Cov numel (min (StartPos): макс. (EndPos)), и Cov содержит NaN значения для основных положений в сегментах.

По умолчанию: false

'Spliced'

Логическое определение, соединены ли короткие чтения во время отображения (как в mRNA к геному, сопоставляющем). N символы в Signature свойство объекта не считается.

По умолчанию: false

Выходные аргументы

Cov

Вектор-строка из неотрицательных целых чисел. Этот вектор задает количество последовательностей чтения, которые выравниваются с каждым основным положением или интервалом в требуемых областях. Набор областей значений может перекрываться или сегментированный. Для области значений, длины Cov numel (StartPosendPos ). Для сегментированной области значений, длины Cov numel (min (StartPos): макс. (EndPos))cov содержит NaN значения для основных положений между сегментами. Когда раскладывание происходит, число элементов в Cov равняется количеству интервалов.

BinStart

Вектор-строка из положительных целых чисел, задающих положение запуска каждого интервала. BinStart та же длина как Cov. Если никакое раскладывание не происходит, то BinStart равняется min (StartPos): макс. (EndPos).

Примеры

Создайте a BioMap объект, и затем возвращает покрытие выравнивания каждого из первых 12 основных положений ссылочной последовательности:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the number of reads that align to each of
% the first 12 base positions of the reference sequence
cov = getBaseCoverage(BMObj1, 1, 12)
cov =

     1     1     2     2     3     4     4     4     5     5     5     5

Создайте a BioMap объект, и затем возвращает покрытие выравнивания области значений между 1 и 1000, на базисе интервала интервалом, с помощью интервалов с шириной 100 BP:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the number of reads that align to each 100-bp bin
% in the 1:1000 range of the reference sequence. Also return the
% start position of each bin
[cov, bin_starts] = getBaseCoverage(BMObj1, 1, 1000, 'binWidth', 100)
cov =

    17    20    41    44    45    48    48    45    46    42


bin_starts =

     1   101   201   301   401   501   601   701   801   901