getCounts

Класс: BioMap

Возвратите количество последовательностей чтения, выровненных к ссылочной последовательности в объекте BioMap

Синтаксис

Count = getCounts(BioObj, StartPos, EndPos)
GroupCount = getCounts(BioObj, StartPos, EndPos, Groups)
GroupCount = getCounts(BioObj, StartPos, EndPos, Groups, R)
___ = getCounts(___, Name,Value)

Описание

Count = getCounts(BioObj, StartPos, EndPos) возвращает Count, неотрицательное целое число, задающее количество последовательностей чтения в BioObj, объекте BioMap, которые выравниваются к определенной области значений или набору областей значений в ссылочной последовательности. Область значений или набор областей значений заданы StartPos и EndPos. StartPos и EndPos могут быть двумя неотрицательными целыми числами, таким образом, что StartPos является меньше, чем EndPos, и оба целых числа меньше, чем длина ссылочной последовательности. StartPos и EndPos могут также быть двумя вектор-столбцами, представляющими набор областей значений (наложение или сегментированный).

По умолчанию getCounts считает каждого только для чтения однажды. Поэтому, если чтение порождает несколько линейных оболочек столбцов, которые читают, экземпляр считается только однажды. Когда StartPos и EndPos задают перекрывающиеся области значений, перекрывающиеся области значений рассматриваются как одну область значений.

GroupCount = getCounts(BioObj, StartPos, EndPos, Groups) задает Groups, вектор целых чисел или массива ячеек из символьных векторов или вектор строки, указывая на группы, которые сегментировались, области значений принадлежат. Сегментированные области значений обработаны независимо.

GroupCount = getCounts(BioObj, StartPos, EndPos, Groups, R) задает ссылку для каждой из сегментированных областей значений, заданных StartPos, EndPos и Groups.

___ = getCounts(___, Name,Value) дополнительные опции использования заданы одним или несколькими аргументами пары Name,Value.

Входные параметры

BioObj

Объект класса BioMap.

StartPos

Любое из следующего:

  • Неотрицательное целое число, которое задает запуск области значений в ссылочной последовательности. StartPos должен быть меньше, чем EndPos, и меньший, чем общая длина ссылочной последовательности.

  • Вектор-столбец неотрицательных целых чисел, каждый задающий запуск области значений в ссылочной последовательности.

EndPos

Любое из следующего:

  • Неотрицательное целое число, которое задает конец области значений в ссылочной последовательности. EndPos должен быть больше, чем StartPos и меньшим, чем общая длина ссылочной последовательности.

  • Вектор-столбец неотрицательных целых чисел, каждый задающий конец области значений в ссылочной последовательности.

Groups

Вектор - строка из целых чисел, массива ячеек из символьных векторов или вектора строки, одного размера как StartPos и EndPos. Этот вектор указывает на группу, которой принадлежит каждая область значений.

R

Вектор положительных целых чисел, индексирующих свойство SequenceDictionary BioObj, или массив ячеек из символьных векторов или вектор строки ссылочных имен. R должен быть скаляром или должен иметь то же число элементов как Groups.

Для данного значения Groups все соответствующие элементы в R должны быть тем же самым.

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

'Independent'

Логический, который задает, обработать ли области значений, заданные StartPos и EndPos независимо. Если true, Count является вектор-столбцом, содержащим то же число элементов как StartPos и EndPos. В этом случае чтение, которое порождает несколько линейных оболочек столбцов, считается однажды в каждой области значений.

Примечание

Этот аргумент пары "имя-значение" проигнорирован при использовании входного параметра Groups, потому что getCounts принимает, что каждая группа областей значений независима.

По умолчанию: false

'Overlap'

Задает минимальное количество основных положений, которые чтение должно перекрыть в области значений или наборе областей значений, чтобы считаться. Это значение может быть любым следующим:

  • Положительное целое число

  • полный Чтение должно полностью содержаться в области значений или наборе областей значений, которые будут считаться.

  • запуск Положение запуска чтения должно лечь в области значений или наборе областей значений, которые будут считаться.

Значение по умолчанию: 1

'Spliced'

Логическое определение, соединены ли короткие чтения во время отображения (как в mRNA к геному, сопоставляющем). N символы в свойстве Signature объекта не считаются.

По умолчанию: false

'Method'

Вектор символов или строка, задающая метод, чтобы измерить распространенность чтений. Выбор:

  • 'raw' — Необработанные количества

  • 'rpkm' — Количества чтений на kilobase пары на миллион выровненных чтений

  • среднее значение Средняя глубина покрытия вычислила основу основой

  • Max Максимальная глубина покрытия вычислила основу основой

  • min Минимальная глубина покрытия вычислила основу основой

  • сумма Сумма всех выровненных основ во всех чтениях

Значение по умолчанию: 'raw'

Выходные аргументы

Count

Любое из следующего:

  • Когда Independent является false, это значение является неотрицательным целым числом. Целое число задает количество чтений, которые выравниваются к области значений или набору областей значений (наложение или сегментированный) ссылочной последовательности в BioObj, объекте BioMap. Каждое чтение считается только однажды, даже если чтение порождает несколько линейных оболочек столбцов.

  • Когда Independent является true, это значение является вектором неотрицательных целых чисел. Этот вектор указывает на количество чтений, которые выравниваются к независимым областям значений, заданным StartPos и EndPos. Этот вектор содержит то же число элементов как StartPos и EndPos.

GroupCount

Любое из следующего:

  • Если никакая ссылка или одна ссылка не заданы, это значение является вектором, содержащим количество чтений для каждой уникальной группы в Groups. Порядок элементов в GroupsCount соответствует порядку по возрастанию уникальных элементов в Groups.

  • Если несколько ссылок заданы, GroupCount является массивом ячеек, где ith элемент содержит количество чтений для каждой уникальной группы в ith ссылке. Порядок элементов в GroupsCount соответствует порядку по возрастанию уникальных элементов в R.

Примеры

развернуть все

Создайте объект BioMap.

obj = BioMap('ex1.sam');

Возвратите количество чтений, которые покрывают по крайней мере одну основу сегментированной области значений 1:50 и 71:100. По умолчанию области значений не обработаны независимо, то есть, чтение считается однажды, даже если оно сопоставляет с обеими сегментированными областями значений.

counts_1 = getCounts(obj,[1;71],[50;100])
counts_1 = 37

Вычислите количество чтений, обработав сегментированные области значений [1:50] и [71:100] независимо. Заметьте, что sum(counts_2) больше, чем counts_1, потому что существует четыре чтения, которые охватывают по этим двум сегментам и считаются дважды во втором случае.

counts_2 = getCounts(obj,[1;71],[50;100], 'Independent', true)
counts_2 = 2×1

    20
    21

Вычислите количество чтений, которые выравниваются к сегментированной области значений 30:60 (сопоставленный с группой 1) и сегментированной области значений [1:10 50:60] (сопоставленный с группой 2).

counts_3 = getCounts(obj,[1;30;50],[10;60;60],[2 1 2])
counts_3 = 2×1

    25
    22

Возвратите общее количество чтений, выровненных к ссылочной последовательности.

getCounts(obj, min(getStart(obj)), max(getStop(obj)))
ans = 1482