exponenta event banner

soapread

Считывание данных из файла пакета анализа коротких олигонуклеотидов (SOAP)

Синтаксис

SOAPStruct = soapread(File)
SOAPStruct = soapread(File,Name,Value)

Описание

SOAPStruct = soapread(File) читает File, файл в формате SOAP (версия 2.15) и возвращает данные в SOAPStruct, массив структур MATLAB ®.

SOAPStruct = soapread(File,Name,Value) считывает файл в формате SOAP с дополнительными параметрами, заданными одним или несколькими Name,Value аргументы пары.

Входные аргументы

File

Символьный вектор или строка, указывающая имя файла, путь и имя файла или текст файла в формате SOAP. Если указано только имя файла, он должен находиться в пути поиска MATLAB или в текущей папке.

soapread функция считывает файлы в формате SOAP (версия 2.15).

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

'BlockRead'

Скаляр или вектор, который управляет считыванием одной записи последовательности или блока записей последовательности из файла в формате SOAP, содержащего несколько последовательностей. Введите скаляр N, чтобы прочитать N-я запись в файле. Введите вектор 1 на 2 [M1, M2], чтобы прочитать блок записей, начиная с M1 вход и окончание в M2 вход. Чтение всех оставшихся записей в файле, начиная с M1 введите положительное значение для M1 и введите Inf для M2.

'AlignDetails'

Логическое указание, включать или нет AlignDetails в поле SOAPStruct выходной аргумент. AlignDetails содержит информацию о несоответствиях, вставках и удалениях в трассе. Варианты: true (по умолчанию) или false.

Значение по умолчанию: true

Выходные аргументы

SOAPStruct

Массив N-by-1 структур, содержащий информацию о выравнивании последовательности и отображении из файла в формате SOAP, где N - количество записей выравнивания, сохраненных в файле в формате SOAP. Каждая структура содержит следующие поля.

ОбластьОписание
QueryName

Имя выровненной последовательности чтения.

SequenceСимвольный вектор, содержащий буквенные представления последовательности считывания. Это обратное дополнение, если считанная последовательность выравнивается по обратной цепи ссылочной последовательности.
QualityСимвольный вектор, содержащий ASCII-представление показателя качества на базу для последовательности считывания. Оценка качества изменяется на обратную, если считанная последовательность выравнивается по обратной цепи ссылочной последовательности.
NumHitsОбщее число экземпляров, в которых эта последовательность считывания выровнена по одинаковой длине оснований в другой области ссылочной последовательности.
PairedEndSourceFileФлаг (a или b), указывающий исходный файл, которому принадлежит последовательность чтения. Это поле применяется только к последовательностям чтения, парным в трассе.
LengthСкаляр, указывающий длину считываемой последовательности.
Strand+ или − указание направления (прямого или обратного) ссылочной последовательности, по которому выравнивается считанная последовательность.
ReferenceNameИмя или числовой идентификатор ссылочной последовательности, по которой выравнивается считанная последовательность.
PositionПоложение (смещение по одному) прямой опорной последовательности, где начинается крайняя левая база выравнивания считанной последовательности.
AlignDetailsСведения о несоответствиях, вставках и удалениях на трассе. Для файлов в формате SOAP версии 2.15 это поле содержит строки CIGAR.

Примеры

Прочтите записи выравнивания (записи) из sample01.soap файл в массив структур MATLAB и доступ к некоторым данным:

% Read the alignment records stored in the file sample01.soap
data = soapread('sample01.soap')
data = 

17x1 struct array with fields:
    QueryName
    Sequence
    Quality
    NumHits
    PairedEndSourceFile
    Length
    Strand
    ReferenceName
    Position
    AlignDetails
% Access the quality score for the 6th entry
data(6).Quality
ans =

<>.>>>8>;:1>>>3>6>
% Determine the strand direction (forward or reverse) of the reference
% sequence to which the 12th entry aligns
data(12).Strand
ans =

-

Считывание блока записей (записей) выравнивания из sample01.soap в массив структур MATLAB:

% Read a block of six entries from a SOAP file
data_5_10 = soapread('sample01.soap','blockread', [5 10])
data_5_10 = 

6x1 struct array with fields:
    QueryName
    Sequence
    Quality
    NumHits
    PairedEndSourceFile
    Length
    Strand
    ReferenceName
    Position
    AlignDetails

Совет

Если файл в формате SOAP слишком велик для чтения с использованием доступной памяти, попробуйте выполнить одно из следующих действий:

  • Используйте BlockRead аргументы пары «имя-значение» для чтения подмножества записей.

  • Создать BioIndexedFile объект из файла в формате SOAP (с использованием 'TABLE' для Format), а затем получить доступ к записям с помощью методов BioIndexedFile класс.

Ссылки

Li, R., Yu, C., Li, Y., Lam, T., Yiu, S., Kristiansen, K. и Wang, J. (2009). SOAP2: усовершенствованный сверхбыстрый инструмент для короткой настройки чтения. Биоинформатика 25, 15, 1966-1967.

[2] Ли, Р., Ли, Я., Кристиансен, К. и Ван, Дж. (2008). SOAP: короткая программа олигонуклеотидного выравнивания. Биоинформатика 24 (5), 713-714.

Представлен в R2010b