exponenta event banner

getIndex

Класс: BioMap

Возвращаемые индексы последовательностей считывания, выровненных по ссылочной последовательности в BioMap объект

Синтаксис

Indices = getIndex(BioObj, StartPos, EndPos)
Indices = getIndex(BioObj, StartPos, EndPos, R)
Indices = getIndex(..., Name,Value)

Описание

Indices = getIndex(BioObj, StartPos, EndPos) прибыль Indices, вектор столбца индексов, задающих последовательности считывания, которые выравниваются по диапазону или набору диапазонов в ссылочной последовательности в BioObj, a BioMap объект. Диапазон или набор диапазонов определяются StartPos и EndPos. StartPos и EndPos могут быть двумя неотрицательными целыми числами, такими, что StartPos меньше, чем EndPosи оба целых числа меньше длины опорной последовательности. StartPos и EndPos также могут быть двумя векторами столбцов, представляющими набор диапазонов (перекрывающихся или сегментированных).

getIndex включает каждое чтение только один раз. Поэтому, если чтение охватывает несколько диапазонов, индекс для этого чтения появляется только один раз.

Indices = getIndex(BioObj, StartPos, EndPos, R) выбирает ссылку, связанную с диапазоном, указанным StartPos и EndPos.

Indices = getIndex(..., Name,Value) возвращает индексы с дополнительными параметрами, указанными одним или несколькими Name,Value аргументы пары.

Входные аргументы

BioObj

Объект BioMap класс.

StartPos

Одно из следующих действий:

  • Неотрицательное целое число, определяющее начало диапазона в ссылочной последовательности. StartPos должно быть меньше, чем EndPosи меньше, чем общая длина ссылочной последовательности.

  • Вектор столбца неотрицательных целых чисел, каждый из которых определяет начало диапазона в ссылочной последовательности.

EndPos

Одно из следующих действий:

  • Неотрицательное целое число, определяющее конец диапазона в ссылочной последовательности. EndPos должно быть больше, чем StartPosи меньше, чем общая длина ссылочной последовательности.

  • Вектор столбца неотрицательных целых чисел, каждый из которых определяет конец диапазона в ссылочной последовательности.

R

Положительное целочисленное индексирование SequenceDictionary имущество BioObjили символьный вектор или строку, указывающую фактическое имя ссылки.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

'Overlap'

Указывает минимальное количество базовых позиций, которые должны перекрываться при чтении в диапазоне или наборе диапазонов для включения. Это значение может быть любым из следующих:

  • Положительное целое число

  • 'full' - Считывание должно полностью содержаться в диапазоне или наборе диапазонов, подлежащих подсчету.

  • 'start' - Начальное положение считывания должно находиться в пределах диапазона или набора диапазонов, подлежащих подсчету.

По умолчанию: 1

'Depth'

Определяет прореживание выходных индексов. Глубина покрытия в любой базовой позиции меньше или равна Depth, положительное целое число.

По умолчанию: Inf

'Spliced'

Логическое указание того, сплайсируются ли короткие чтения во время картирования (как при картировании мРНК в геном). N символов в Signature свойства объекта не учитываются.

По умолчанию: false

Выходные аргументы

Indices

Вектор столбца индексов, задающих чтения, которые выравниваются по диапазону или набору диапазонов в указанной ссылочной последовательности в BioObj, a BioMap объект.

Примеры

Построить BioMap объект, а затем используйте индексы считываний, чтобы извлечь начальные и конечные позиции для считываний, которые полностью содержатся в первых 50 позициях ссылочной последовательности:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the indices of reads that are fully contained in the
% first 50 positions of the reference sequence
indices = getIndex(BMObj1, 1, 50, 'overlap', 'full');
% Use these indices to return the start and stop positions of
% the reads 
starts = getStart(BMObj1, indices)
stops = getStop(BMObj1, indices)
starts =

           1
           3
           5
           6
           9
          13
          13
          15

stops =

          36
          37
          39
          41
          43
          47
          48
          49

Построить BioMap объект, а затем используйте индексы считываний, чтобы извлечь последовательности для считываний, трассы которых перекрывают сегментированный диапазон по меньшей мере на одну базовую пару:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the indices of the reads that overlap the
% segmented range 98:100 and 198:200, by at least 1 base pair
indices = getIndex(BMObj1, [98;198], [100;200], 'overlap', 1);
% Use these indices to return the sequences of the reads
sequences = getSequence(BMObj1, indices);

Совет

Используйте Indices выходные данные из getIndex метод в качестве входных данных для других BioMap методы. Это позволяет получить другую информацию о считывании в диапазоне, такую как заголовок, начальная позиция, качество отображения, последовательности и т.д.