getIndex

Класс: BioMap

Возвращает индексы считанных последовательностей, выровненных по ссылочной последовательности в BioMap объект

Синтаксис

Indices = getIndex(BioObj, StartPos, EndPos)
Indices = getIndex(BioObj, StartPos, EndPos, R)
Indices = getIndex(..., Name,Value)

Описание

Indices = getIndex(BioObj, StartPos, EndPos) возвращает Indicesвектор-столбец индексов, задающих считанные последовательности, которые выравниваются к области значений или набору диапазонов в ссылочной последовательности в BioObj, а BioMap объект. Области значений или набор областей значений определяются StartPos и EndPos. StartPos и EndPos могут быть двумя неотрицательными целыми числами, такими что StartPos меньше EndPosи оба целых чисел меньше длины ссылки последовательности. StartPos и EndPos могут также быть два векторов-столбцов, представляющими набор областями значений (перекрывающихся или сегментированных).

getIndex включает в себя каждое чтение только один раз. Поэтому, если чтение охватывает несколько области значений, индекс для этого чтения появляется только один раз.

Indices = getIndex(BioObj, StartPos, EndPos, R) выбирает ссылку, связанную с областью значений, заданной StartPos и EndPos.

Indices = getIndex(..., Name,Value) возвращает индексы с дополнительными опциями, заданными одним или несколькими Name,Value аргументы в виде пар.

Входные параметры

BioObj

Объект BioMap класс.

StartPos

Одно из следующих:

  • Неотрицательное целое число, которое задает начало области значений в ссылочной последовательности. StartPos должно быть меньше EndPosи меньше, чем общая длина последовательности ссылки.

  • Вектор-столбец неотрицательных целых чисел, каждый из которых определяет начало области значений в ссылку последовательности.

EndPos

Одно из следующих:

  • Неотрицательное целое число, которое задает конец области значений в ссылочной последовательности. EndPos должно быть больше StartPosи меньше, чем общая длина последовательности ссылки.

  • Вектор-столбец неотрицательных целых чисел, каждый из которых определяет конец области значений в ссылку последовательности.

R

Положительное целое число, индексирующее SequenceDictionary свойство BioObj, или вектор символов или строка, задающая фактическое имя ссылки.

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

'Overlap'

Задает минимальное количество базовых положений, которые должны перекрываться при считывании в области значений или наборе областей значений, подлежащих включению. Это значение может быть любым из следующих:

  • Положительное целое число

  • 'full' - Чтение должно быть полностью заключено в область значений или набор областей значений, которые будут подсчитаны.

  • 'start' - Начальное положение чтения должно находиться в области значений или наборе областей значений, которые будут подсчитаны.

По умолчанию: 1

'Depth'

Задает децимирование индексов выхода. Глубина покрытия в любом базовом положении меньше или равна Depth, положительное целое число.

По умолчанию: Inf

'Spliced'

Логическое определение того, сращиваются ли короткие чтения во время отображения (как при отображении мРНК к геному). N символов в Signature свойство объекта не учитывается.

По умолчанию: false

Выходные аргументы

Indices

Вектор-столбец индексов, задающих чтения, которые совпадают с диапазоном или набором диапазонов в заданной последовательности ссылки в BioObj, а BioMap объект.

Примеры

Создайте a BioMap объект, а затем используйте индексы показаний, чтобы извлечь начальное и стоповое положения для показаний, которые полностью содержатся в первых 50 позициях ссылки последовательности:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the indices of reads that are fully contained in the
% first 50 positions of the reference sequence
indices = getIndex(BMObj1, 1, 50, 'overlap', 'full');
% Use these indices to return the start and stop positions of
% the reads 
starts = getStart(BMObj1, indices)
stops = getStop(BMObj1, indices)
starts =

           1
           3
           5
           6
           9
          13
          13
          15

stops =

          36
          37
          39
          41
          43
          47
          48
          49

Создайте a BioMap объект, а затем используйте индексы показаний, чтобы извлечь последовательности для показаний, выравнивания которых перекрывают сегментированную область значений, по меньшей мере, одной базовой парой:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the indices of the reads that overlap the
% segmented range 98:100 and 198:200, by at least 1 base pair
indices = getIndex(BMObj1, [98;198], [100;200], 'overlap', 1);
% Use these indices to return the sequences of the reads
sequences = getSequence(BMObj1, indices);

Совет

Используйте Indices вывод из выхода getIndex метод как вход к другому BioMap методы. Это позволяет вам получить другую информацию о чтениях в области значений, таких как заголовок, начальное положение, качество отображения, последовательности и т.д.