soapread

Считайте данные из файла пакета анализа коротких олигонуклеотидов (SOAP)

Синтаксис

SOAPStruct = soapread(File)
SOAPStruct = soapread(File,Name,Value)

Описание

SOAPStruct = soapread(File) читает File, файл в формате SOAP (версия 2.15) и возвращает данные в SOAPStruct, MATLAB® массив структур.

SOAPStruct = soapread(File,Name,Value) читает файл в формате SOAP с дополнительными опциями, заданными одним или несколькими Name,Value аргументы в виде пар.

Входные параметры

File

Вектор символов или строка, указывающая имя файла, путь и имя файла или текст файла в формате SOAP. Если вы задаете только имя файла, этот файл должен быть в пути поиска файлов MATLAB или в Текущей папке.

soapread функция считывает файлы в формате SOAP (версия 2.15).

Аргументы в виде пар имя-значение

Задайте необязательные разделенные разделенными запятой парами Name,Value аргументы. Name - имя аргумента и Value - соответствующее значение. Name должны находиться внутри кавычек. Можно задать несколько аргументов в виде пар имен и значений в любом порядке Name1,Value1,...,NameN,ValueN.

'BlockRead'

Скаляр или вектор, который управляет считыванием записи одной последовательности или блока записей последовательности из файла с форматированием SOAP, содержащего несколько последовательностей. Введите скалярное N, чтобы прочитать Nвторая запись в файле. Введите вектор 1 на 2 [M1, M2], чтобы считать блок записей, начиная с M1 вход и окончание в M2 запись. Чтобы считать все оставшиеся записи в файле, начиная с M1 введите положительное значение для M1 и вводите Inf для M2.

'AlignDetails'

Логическое определение, включать ли AlignDetails поле в SOAPStruct выходной аргумент. The AlignDetails поле включает информацию о несоответствиях, вставках и удалениях в выравнивании. Варианты true (по умолчанию) или false.

По умолчанию: true

Выходные аргументы

SOAPStruct

Массив N -by-1 структур, содержащий информацию о выравнивании последовательности и отображении из файла в формате SOAP, где N количество записей выравнивания, хранящихся в файле в формате SOAP. Каждая структура содержит следующие поля.

ОбластьОписание
QueryName

Имя выровненной последовательности чтения.

SequenceВектор символов, содержащий буквенные представления последовательности read. Это - обратное дополнение, если последовательность read выравнивается по обратной цепочке ссылки последовательности.
QualityВектор символов, содержащий представление ASCII счета качества в относительных базах для последовательности чтения. Счет качества меняется назад, если последовательность считывания выравнивается по обратной цепи ссылки последовательности.
NumHitsКоличество суммарных образцов, в которых эта считанная последовательность выровнена по одинаковой длине основ в другой области ссылочной последовательности.
PairedEndSourceFileФлаг (a или b), определяющий, к какому исходному файлу принадлежит последовательность чтения. Это поле применяется только к последовательностям чтения, которые спарены в выравнивании.
LengthСкаляр, задающий длину последовательности чтения.
Strand+ или − указывающее направление (вперед или назад) ссылка последовательности, к которой выравнивается последовательность чтения.
ReferenceNameИмя или числовой идентификатор ссылочной последовательности, к которой выравнивается считанная последовательность.
PositionПоложение (смещение на одной основе) прямой опорной последовательности, где начинается самая левая база выравнивания считанной последовательности.
AlignDetailsИнформация о несоответствиях, вставках и удалениях в выравнивания. Для файлов формата SOAP версии 2.15 это поле содержит строки CIGAR.

Примеры

Чтение записей выравнивания (записей) из sample01.soap файл в массив структур MATLAB и доступ к некоторым данным:

% Read the alignment records stored in the file sample01.soap
data = soapread('sample01.soap')
data = 

17x1 struct array with fields:
    QueryName
    Sequence
    Quality
    NumHits
    PairedEndSourceFile
    Length
    Strand
    ReferenceName
    Position
    AlignDetails
% Access the quality score for the 6th entry
data(6).Quality
ans =

<>.>>>8>;:1>>>3>6>
% Determine the strand direction (forward or reverse) of the reference
% sequence to which the 12th entry aligns
data(12).Strand
ans =

-

Считайте блок записей выравнивания (записей) из sample01.soap файл в массив структур MATLAB:

% Read a block of six entries from a SOAP file
data_5_10 = soapread('sample01.soap','blockread', [5 10])
data_5_10 = 

6x1 struct array with fields:
    QueryName
    Sequence
    Quality
    NumHits
    PairedEndSourceFile
    Length
    Strand
    ReferenceName
    Position
    AlignDetails

Совет

Если файл в формате SOAP слишком велик для чтения с помощью доступной памяти, попробуйте одно из следующих действий:

  • Используйте BlockRead аргументы пары "имя-значение" для чтения подмножества записей.

  • Создайте BioIndexedFile объект из файла форматированного SOAP (использование 'TABLE' для Format), а затем доступ к записям с помощью методов BioIndexedFile класс.

Ссылки

[1] Li, R., Yu, C., Li, Y., Lam, T., Yiu, S., Kristiansen, K., and Wang, J. (2009). SOAP2: улучшенный ультраскоростной инструмент для краткого выравнивания чтения. Биоинформатика 25, 15, 1966-1967.

[2] Li, R., Li, Y., Kristiansen, K., and Wang, J. (2008). SOAP: короткая программа выравнивания олигонуклеотидов. Биоинформатика 24 (5), 713-714.

Введенный в R2010b