exponenta event banner

getCounts

Класс: BioMap

Возвращаемое число считанных последовательностей, выровненных по ссылочной последовательности в BioMap объект

Синтаксис

Count = getCounts(BioObj, StartPos, EndPos)
GroupCount = getCounts(BioObj, StartPos, EndPos, Groups)
GroupCount = getCounts(BioObj, StartPos, EndPos, Groups, R)
___ = getCounts(___, Name,Value)

Описание

Count = getCounts(BioObj, StartPos, EndPos) прибыль Count, неотрицательное целое число, указывающее количество считанных последовательностей в BioObj, a BioMap , которые выравниваются по определенному диапазону или набору диапазонов в ссылочной последовательности. Диапазон или набор диапазонов определяются StartPos и EndPos. StartPos и EndPos могут быть двумя неотрицательными целыми числами, такими, что StartPos меньше, чем EndPosи оба целых числа меньше длины опорной последовательности. StartPos и EndPos также могут быть двумя векторами столбцов, представляющими набор диапазонов (перекрывающихся или сегментированных).

По умолчанию getCounts подсчитывает каждое чтение только один раз. Поэтому, если чтение охватывает несколько диапазонов, этот экземпляр чтения подсчитывается только один раз. Когда StartPos и EndPos укажите перекрывающиеся диапазоны, перекрывающиеся диапазоны рассматриваются как один диапазон.

GroupCount = getCounts(BioObj, StartPos, EndPos, Groups) определяет Groupsвектор целых чисел или клеточный массив символьных векторов или строкового вектора, указывающий группы, к которым принадлежат сегментированные диапазоны. Сегментированные диапазоны обрабатывают независимо.

GroupCount = getCounts(BioObj, StartPos, EndPos, Groups, R) задает ссылку для каждого из сегментированных диапазонов, определенных StartPos, EndPos, и Groups.

___ = getCounts(___, Name,Value) использует дополнительные параметры, указанные одним или несколькими Name,Value аргументы пары.

Входные аргументы

BioObj

Объект BioMap класс.

StartPos

Одно из следующих действий:

  • Неотрицательное целое число, определяющее начало диапазона в ссылочной последовательности. StartPos должно быть меньше, чем EndPosи меньше, чем общая длина ссылочной последовательности.

  • Вектор столбца неотрицательных целых чисел, каждый из которых определяет начало диапазона в ссылочной последовательности.

EndPos

Одно из следующих действий:

  • Неотрицательное целое число, определяющее конец диапазона в ссылочной последовательности. EndPos должно быть больше, чем StartPosи меньше, чем общая длина ссылочной последовательности.

  • Вектор столбца неотрицательных целых чисел, каждый из которых определяет конец диапазона в ссылочной последовательности.

Groups

Вектор строки целых чисел, массив ячеек символьных векторов или строковый вектор того же размера, что и StartPos и EndPos. Этот вектор указывает группу, к которой принадлежит каждый диапазон.

R

Вектор положительных чисел индексация SequenceDictionary имущество BioObjили массив ячеек символьных векторов или строковых векторов ссылочных имен. R должен быть скалярным или иметь такое же количество элементов, как Groups.

Для заданного значения Groups, все соответствующие элементы в R должно быть то же самое.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

'Independent'

Логический, указывающий, следует ли обрабатывать диапазоны, определенные StartPos и EndPos независимо. Если true, Count - вектор столбца, содержащий то же количество элементов, что и StartPos и EndPos. В этом случае считывание, охватывающее несколько диапазонов, подсчитывается один раз в каждом диапазоне.

Примечание

Этот аргумент пары имя-значение игнорируется при использовании Groups входной аргумент, потому что getCounts предполагает, что каждая группа диапазонов является независимой.

По умолчанию: false

'Overlap'

Указывает минимальное количество базовых позиций, которые должны перекрываться при чтении в диапазоне или наборе диапазонов, подлежащих подсчету. Это значение может быть любым из следующих:

  • Положительное целое число

  • 'full' - Считывание должно полностью содержаться в диапазоне или наборе диапазонов, подлежащих подсчету.

  • 'start' - Начальное положение считывания должно находиться в пределах диапазона или набора диапазонов, подлежащих подсчету.

По умолчанию: 1

'Spliced'

Логическое указание того, сплайсируются ли короткие чтения во время картирования (как при картировании мРНК в геном). N символов в Signature свойства объекта не учитываются.

По умолчанию: false

'Method'

Символьный вектор или строка, задающая метод измерения количества операций чтения. Возможны следующие варианты:

  • 'raw' - Количество необработанных данных

  • 'rpkm' - Количество считываний на пары килобаз на миллион выровненных считываний

  • 'mean' - Средняя глубина охвата, вычисленная по базам

  • 'max' - Вычисленная базовая максимальная глубина покрытия

  • 'min' - Вычисленная базовая минимальная глубина покрытия

  • 'sum' - Сумма всех выровненных оснований во всех считываниях

По умолчанию: 'raw'

Выходные аргументы

Count

Одно из следующих действий:

  • Когда Independent является false, это значение является неотрицательным целым числом. Целое число указывает количество операций чтения, которые выравниваются по диапазону или набору диапазонов (перекрывающихся или сегментированных) ссылочной последовательности в BioObj, a BioMap объект. Каждое считывание подсчитывается только один раз, даже если считывание охватывает несколько диапазонов.

  • Когда Independent является true, это значение является вектором неотрицательных целых чисел. Этот вектор указывает количество операций чтения, которые выравниваются по независимым диапазонам, указанным в StartPos и EndPos. Этот вектор содержит то же количество элементов, что и StartPos и EndPos.

GroupCount

Одно из следующих действий:

  • Если ссылка или одиночная ссылка не указаны, это значение является вектором, содержащим число операций чтения для каждой уникальной группы в Groups. Порядок элементов в GroupsCount соответствует возрастающему порядку уникальных элементов в Groups.

  • Если указано несколько ссылок, GroupCount является массивом ячеек, где i-й элемент содержит число считываний для каждой уникальной группы в i-ой ссылке. Порядок элементов в GroupsCount соответствует возрастающему порядку уникальных элементов в R.

Примеры

развернуть все

Создайте объект BioMap.

obj = BioMap('ex1.sam');

Возвращает число операций чтения, охватывающих хотя бы одно основание сегментированного диапазона 1:50 и 71:100. По умолчанию диапазоны не обрабатываются независимо, то есть считывание подсчитывается один раз, даже если оно сопоставляется с обоими сегментированными диапазонами.

counts_1 = getCounts(obj,[1;71],[50;100])
counts_1 = 37

Вычислите количество операций чтения, обрабатывая сегментированные диапазоны [1:50] и [71:100] независимо. Обратите внимание, что sum(counts_2) больше, чем counts_1 потому что есть четыре чтения, которые охватывают два сегмента и учитываются дважды во втором случае.

counts_2 = getCounts(obj,[1;71],[50;100], 'Independent', true)
counts_2 = 2×1

    20
    21

Вычислите количество операций чтения, выровненных по сегментированному диапазону 30:60 (связанному с группой 1) и сегментированному диапазону [1:10 50:60] (связанному с группой 2).

counts_3 = getCounts(obj,[1;30;50],[10;60;60],[2 1 2])
counts_3 = 2×1

    25
    22

Возвращает общее число операций чтения, выровненных по ссылочной последовательности.

getCounts(obj, min(getStart(obj)), max(getStop(obj)))
ans = 1482