getCounts

Класс: BioMap

Возвратите количество последовательностей чтения, выровненных к ссылочной последовательности в BioMap объект

Синтаксис

Count = getCounts(BioObj, StartPos, EndPos)
GroupCount = getCounts(BioObj, StartPos, EndPos, Groups)
GroupCount = getCounts(BioObj, StartPos, EndPos, Groups, R)
___ = getCounts(___, Name,Value)

Описание

Count = getCounts(BioObj, StartPos, EndPos) возвращает Count, неотрицательное целое число, задающее количество последовательностей чтения в BioObjA BioMap объект, которые выравниваются к определенной области значений или набору областей значений в ссылочной последовательности. Область значений или набор областей значений заданы StartPos и EndPosstartPos и EndPos могут быть два неотрицательных целых числа, таким образом что StartPos меньше EndPos, и оба целых числа меньше, чем длина ссылочной последовательности. StartPos и EndPos могут также быть два вектор-столбца, представляющие набор областей значений (наложение или сегментированный).

По умолчанию, getCounts количества каждый только для чтения однажды. Поэтому, если чтение порождает несколько линейных оболочек столбцов, которые читают, экземпляр считается только однажды. Когда StartPos и EndPos укажите перекрывающиеся диапазоны, перекрывающиеся области значений рассматриваются как одну область значений.

GroupCount = getCounts(BioObj, StartPos, EndPos, Groups) задает Groups, вектор из целых чисел или массива ячеек из символьных векторов или вектор строки, указывая на группы, которые сегментировали области значений, принадлежат. Сегментированные области значений обработаны независимо.

GroupCount = getCounts(BioObj, StartPos, EndPos, Groups, R) задает ссылку для каждой из сегментированных областей значений, заданных StartPosendPos , и Groups.

___ = getCounts(___, Name,Value) дополнительные опции использования заданы одним или несколькими Name,Value парные аргументы.

Входные параметры

BioObj

Объект BioMap класс.

StartPos

Любое из следующего:

  • Неотрицательное целое число, которое задает запуск области значений в ссылочной последовательности. StartPos должен быть меньше EndPos, и меньший, чем общая длина ссылочной последовательности.

  • Вектор-столбец неотрицательных целых чисел, каждый задающий запуск области значений в ссылочной последовательности.

EndPos

Любое из следующего:

  • Неотрицательное целое число, которое задает конец области значений в ссылочной последовательности. EndPos должен быть больше StartPos, и меньший, чем общая длина ссылочной последовательности.

  • Вектор-столбец неотрицательных целых чисел, каждый задающий конец области значений в ссылочной последовательности.

Groups

Вектор-строка из целых чисел, массива ячеек из символьных векторов или вектора строки одного размера с StartPos и EndPos. Этот вектор указывает на группу, которой принадлежит каждая область значений.

R

Вектор из положительных целых чисел, индексирующих SequenceDictionary свойство BioObj, или массив ячеек из символьных векторов или вектор строки из ссылочных имен. R должен быть скаляр или должен иметь то же число элементов как Groups.

Для данного значения Groups, все соответствующие элементы в R должно быть то же самое.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

'Independent'

Логический, который задает, обработать ли области значений, заданные StartPos и EndPos независимо. Если trueколичество вектор-столбец, содержащий то же число элементов как StartPos и EndPos. В этом случае чтение, которое порождает несколько линейных оболочек столбцов, считается однажды в каждой области значений.

Примечание

Этот аргумент пары "имя-значение" проигнорирован при использовании Groups входной параметр, потому что getCounts принимает, что каждая группа областей значений независима.

По умолчанию: false

'Overlap'

Задает минимальное количество основных положений, которые чтение должно перекрыть в области значений или наборе областей значений, чтобы считаться. Это значение может быть любым следующим:

  • Положительное целое число

  • 'full' — Чтение должно полностью содержаться в области значений или наборе областей значений, которые будут считаться.

  • 'start' — Положение запуска чтения должно лечь в области значений или наборе областей значений, которые будут считаться.

Значение по умолчанию: 1

'Spliced'

Логическое определение, соединены ли короткие чтения во время отображения (как в mRNA к геному, сопоставляющем). N символы в Signature свойство объекта не считается.

По умолчанию: false

'Method'

Вектор символов или строка, задающая метод, чтобы измерить распространенность чтений. Выбор:

  • 'raw' — Необработанные количества

  • 'rpkm' — Количества чтений на kilobase пары на миллион выровненных чтений

  • 'mean' — Средняя глубина покрытия вычислила основу основой

  • 'max' — Максимальная глубина покрытия вычислила основу основой

  • 'min' — Минимальная глубина покрытия вычислила основу основой

  • 'sum' — Сумма всех выровненных базисов во всех чтениях

Значение по умолчанию: 'raw'

Выходные аргументы

Count

Любое из следующего:

  • Когда Independent false, это значение является неотрицательным целым числом. Целое число задает количество чтений, которые выравниваются к области значений или набору областей значений (наложение или сегментированный) ссылочной последовательности в BioObjA BioMap объект. Каждое чтение считается только однажды, даже если чтение порождает несколько линейных оболочек столбцов.

  • Когда Independent true, это значение является вектором из неотрицательных целых чисел. Этот вектор указывает на количество чтений, которые выравниваются к независимым диапазонам, указанным StartPos и EndPos. Этот вектор содержит то же число элементов как StartPos и EndPos.

GroupCount

Любое из следующего:

  • Если никакая ссылка или одна ссылка не заданы, это значение является вектором, содержащим количество чтений для каждой уникальной группы в Groups. Порядок элементов в GroupsCount соответствует порядку по возрастанию уникальных элементов в Groups.

  • Если несколько ссылок заданы, GroupCount массив ячеек, где i-ый элемент содержит количество чтений для каждой уникальной группы в i-ой ссылке. Порядок элементов в GroupsCount соответствует порядку по возрастанию уникальных элементов в R.

Примеры

развернуть все

Создайте объект BioMap.

obj = BioMap('ex1.sam');

Возвратите количество чтений, которые покрывают по крайней мере одну основу сегментированной области значений 1:50 и 71:100. По умолчанию области значений не обработаны независимо, то есть, чтение считается однажды, даже если оно сопоставляет с обеими сегментированными областями значений.

counts_1 = getCounts(obj,[1;71],[50;100])
counts_1 = 37

Вычислите количество чтений, обработав сегментированные области значений [1:50] и [71:100] независимо. Наблюдайте тот sum(counts_2) больше counts_1 потому что существует четыре чтения, которые охватывают по этим двум сегментам и считаются дважды во втором случае.

counts_2 = getCounts(obj,[1;71],[50;100], 'Independent', true)
counts_2 = 2×1

    20
    21

Вычислите количество чтений, которые выравниваются к сегментированной области значений 30:60 (сопоставленный с группой 1) и сегментированной области значений [1:10 50:60] (сопоставленный с группой 2).

counts_3 = getCounts(obj,[1;30;50],[10;60;60],[2 1 2])
counts_3 = 2×1

    25
    22

Возвратите общее количество чтений, выровненных к ссылочной последовательности.

getCounts(obj, min(getStart(obj)), max(getStop(obj)))
ans = 1482