sffread

Чтение данных из файла SFF

Синтаксис

SFFStruct = sffread(File)
sffread(..., 'Blockread', BlockreadValue, ...)
sffread(..., 'Feature', FeatureValue, ...)

Описание

SFFStruct = sffread(File) читает файл стандартного формата Flowgram (SFF) и возвращает данные в MATLAB® массив структур.

sffread (..., 'PropertyName', PropertyValue, ...) вызывает sffread с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Заключайте каждую PropertyName в одинарных кавычках. Каждый PropertyName является нечувствительным к регистру. Эти имена свойства/пары значения свойств следующие:

sffread(..., 'Blockread', BlockreadValue, ...) считывает один элемент последовательности или блок записей последовательности из файла SFF, содержащего несколько последовательностей.

sffread(..., 'Feature', FeatureValue, ...) задает информацию, которая будет включена в структуру возврата.

Входные параметры

File

Вектор символов или строка, указывающая имя файла или путь и имя файла SFF, произведенные версией 1.0 программного обеспечения для анализа данных системы Genome Sequencer из 454 Life Sciences®. Если вы задаете только имя файла, этот файл должен быть в пути поиска файлов MATLAB или в текущей папке.

BlockreadValue

Скаляр или вектор, который управляет считыванием записи одной последовательности или блока записей последовательности из файла SFF, содержащего несколько последовательностей. Введите скалярное N, чтобы прочитать Nвторая запись в файле. Введите вектор 1 на 2 [M1, M2], чтобы считать блок записей, начиная с M1 вход и окончание в M2 запись. Чтобы считать все оставшиеся записи в файле, начиная с M1 введите положительное значение для M1 и вводите Inf для M2.

FeatureValue

Вектор символов или строка, указывающая информацию для включения в структуру output. Векторы символов или строка включает буквы из алфавита H, S, Q, C, F, и I, которые представляют поля Header, Sequence, Quality, Clipping, FlowgramValue, и FlowgramIndex, соответственно.

По умолчанию: 'HSQ'

Выходные аргументы

SFFStruct

Массив структур, содержащий информацию из файла SFF. Существует одна структура для каждого чтения или записи в файле. Каждая структура содержит одно или несколько из следующих полей.

ОбластьОписание
HeaderУниверсальный номер присоединения.
SequenceЧисленное представление нуклеотидной последовательности.
QualityКачественные счета в относительных единицах.
ClippingУсечение краевых положений.
FlowgramValueПоследовательность значений интенсивности грамм потока.
FlowgramIndexПоследовательность индексов интенсивности грамм потока.

Примеры

Файл SFF, SRR013472.sff, используемый в этих примерах, не обеспечивается программным обеспечением Bioinformatics Toolbox™. Можно скачать выборку файлов SFF из:

https://trace.ncbi.nlm.nih.gov/Traces/sra/

Чтение всего файла SFF:

% Read the contents of an entire SFF file into an
% array of structures
reads = sffread('SRR013472.sff')

reads = 

3546x1 struct array with fields:
    Header
    Sequence
    Quality

Считайте блок записей из файла SFF:

% Read only the header and sequence information of the
% first five reads from an SFF file into an array of structures
reads5 = sffread('SRR013472.sff', 'block', [1 5], 'feature', 'hs')

reads5 = 

5x1 struct array with fields:
    Header
    Sequence
Введенный в R2009b