getIndex

Класс: BioMap

Возвратите индексы последовательностей чтения, выровненных к ссылочной последовательности в объекте BioMap

Синтаксис

Indices = getIndex(BioObj, StartPos, EndPos)
Indices = getIndex(BioObj, StartPos, EndPos, R)
Indices = getIndex(..., Name,Value)

Описание

Indices = getIndex(BioObj, StartPos, EndPos) возвращает Indices, вектор-столбец индексов, задающих последовательности чтения, которые выравниваются к области значений или набору областей значений в ссылочной последовательности в BioObj, объекте BioMap. Область значений или набор областей значений заданы StartPos и EndPos. StartPos и EndPos могут быть двумя неотрицательными целыми числами, таким образом, что StartPos является меньше, чем EndPos, и оба целых числа меньше, чем длина ссылочной последовательности. StartPos и EndPos могут также быть двумя вектор-столбцами, представляющими набор областей значений (наложение или сегментированный).

getIndex включает каждого только для чтения однажды. Поэтому, если чтение порождает несколько линейных оболочек столбцов, индекс для того чтения появляется только однажды.

Indices = getIndex(BioObj, StartPos, EndPos, R) выбирает ссылку, сопоставленную с областью значений, заданной StartPos и EndPos.

Indices = getIndex(..., Name,Value) возвращает индексы с дополнительными опциями, заданными одним или несколькими аргументами пары Name,Value.

Входные параметры

BioObj

Объект класса BioMap.

StartPos

Любое из следующего:

  • Неотрицательное целое число, которое задает запуск области значений в ссылочной последовательности. StartPos должен быть меньше, чем EndPos, и меньший, чем общая длина ссылочной последовательности.

  • Вектор-столбец неотрицательных целых чисел, каждый задающий запуск области значений в ссылочной последовательности.

EndPos

Любое из следующего:

  • Неотрицательное целое число, которое задает конец области значений в ссылочной последовательности. EndPos должен быть больше, чем StartPos и меньшим, чем общая длина ссылочной последовательности.

  • Вектор-столбец неотрицательных целых чисел, каждый задающий конец области значений в ссылочной последовательности.

R

Положительное целое число, индексирующее свойство SequenceDictionary BioObj, или вектор символов или строку, задающую подлинное имя ссылки.

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

'Overlap'

Задает минимальное количество основных положений, которые чтение должно перекрыть в области значений или наборе областей значений, чтобы быть включенным. Это значение может быть любым следующим:

  • Положительное целое число

  • полный Чтение должно полностью содержаться в области значений или наборе областей значений, которые будут считаться.

  • запуск Положение запуска чтения должно лечь в области значений или наборе областей значений, которые будут считаться.

Значение по умолчанию: 1

'Depth'

Задает, чтобы десятикратно уменьшить выходные индексы. Глубина покрытия в любом основном положении меньше чем или равна Depth, положительному целому числу.

Значение по умолчанию: Inf

'Spliced'

Логическое определение, соединены ли короткие чтения во время отображения (как в mRNA к геному, сопоставляющем). N символы в свойстве Signature объекта не считаются.

По умолчанию: false

Выходные аргументы

Indices

Вектор-столбец индексов, задающих чтения, которые выравниваются к области значений или набору областей значений в заданной ссылочной последовательности в BioObj, объекте BioMap.

Примеры

Создайте объект BioMap, и затем используйте индексы чтений, чтобы получить запуск и положения остановки для чтений, которые полностью содержатся в первых 50 положениях ссылочной последовательности:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the indices of reads that are fully contained in the
% first 50 positions of the reference sequence
indices = getIndex(BMObj1, 1, 50, 'overlap', 'full');
% Use these indices to return the start and stop positions of
% the reads 
starts = getStart(BMObj1, indices)
stops = getStop(BMObj1, indices)
starts =

           1
           3
           5
           6
           9
          13
          13
          15

stops =

          36
          37
          39
          41
          43
          47
          48
          49

Создайте объект BioMap, и затем используйте индексы чтений, чтобы получить последовательности для чтений, выравнивания которых перекрывают сегментированную область значений по крайней мере одной парой оснований:

% Construct a BioMap object from a SAM file 
BMObj1 = BioMap('ex1.sam');
% Return the indices of the reads that overlap the
% segmented range 98:100 and 198:200, by at least 1 base pair
indices = getIndex(BMObj1, [98;198], [100;200], 'overlap', 1);
% Use these indices to return the sequences of the reads
sequences = getSequence(BMObj1, indices);

Советы

Используйте Indices вывод из метода getIndex, как введено к другим методам BioMap. Выполнение так позволяет вам получить другую информацию о чтениях в области значений, таких как заголовок, запустить положение, сопоставляя качество, последовательности, и т.д.