exponenta event banner

fastqread

Считывание данных из файла FASTQ

Синтаксис

FASTQStruct = fastqread(File)
[Header, Sequence] = fastqread(File)
[Header, Sequence, Qual] = fastqread(File)
fastqread(..., 'Blockread', BlockreadValue, ...)
fastqread(..., 'HeaderOnly', HeaderOnlyValue, ...)
fastqread(..., 'TrimHeaders', TrimHeadersValue, ...)

Описание

FASTQStruct = fastqread(File) считывает файл в формате FASTQ и возвращает данные в массиве структур MATLAB ®.

[Header, Sequence] = fastqread(File) возвращает только данные заголовка и последовательности в двух отдельных переменных.

[Header, Sequence, Qual] = fastqread(File) возвращает данные в трех отдельных переменных.

fastqread(..., 'PropertyName', PropertyValue, ...) требования fastqread с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Заключить каждый PropertyName в одинарных кавычках. Каждый PropertyName нечувствителен к регистру. Эти пары имя/значение свойства следующие:

fastqread(..., 'Blockread', BlockreadValue, ...) считывает одну запись последовательности или блок записей последовательности из файла в формате FASTQ, содержащего несколько последовательностей.

fastqread(..., 'HeaderOnly', HeaderOnlyValue, ...) указывает, следует ли возвращать только информацию заголовка.

fastqread(..., 'TrimHeaders', TrimHeadersValue, ...) указывает, следует ли обрезать заголовок до первого пробела.

Входные аргументы

File

Одно из следующих действий:

  • Символьный вектор или строка, указывающая имя файла или путь и имя файла в формате FASTQ. Если указано только имя файла, этот файл должен находиться в пути поиска MATLAB или в текущей папке MATLAB.

  • Массив символов MATLAB, содержащий текст файла в формате FASTQ.

BlockreadValue

Скаляр или вектор, который управляет считыванием одной записи последовательности или блока записей последовательности из файла в формате FASTQ, содержащего несколько последовательностей. Введите скаляр N чтобы прочитать N-я запись в файле. Введите вектор 1 на 2 [M1, M2] для чтения блока записей, начиная с M1 вход и окончание в M2 вход. Чтение всех оставшихся записей в файле, начиная с M1 введите положительное значение для M1 и введите Inf для M2.

HeaderOnlyValue

Указывает, следует ли возвращать только информацию заголовка. Варианты: true или false (по умолчанию).

TrimHeadersValue

Указывает, следует ли обрезать заголовок после первого символа пробела. Символы пробела включают пробел (символ (32)) и табуляцию (символ (9)). Варианты: true или false (по умолчанию).

Выходные аргументы

FASTQStruct

Массив структур, содержащих информацию из файла в формате FASTQ. Существует одна структура для каждой последовательности чтения или записи в файле. Каждая структура содержит следующие поля.

ОбластьОписание
HeaderИнформация заголовка.
SequenceОднобуквенное представление нуклеотидной последовательности.
QualityASCII представление показателей качества по основаниям для нуклеотидной последовательности.

Header

Переменная, содержащая информацию заголовка, или, если файл в формате FASTQ содержит несколько последовательностей, массив ячеек, содержащий информацию заголовка.

Sequence

Переменная, содержащая информацию о последовательности, или, если файл в формате FASTQ содержит несколько последовательностей, массив ячеек, содержащий информацию о последовательности.

Qual

Переменная, содержащая информацию о качестве, или, если файл в формате FASTQ содержит несколько последовательностей, массив ячеек, содержащий информацию о качестве.

Примеры

Считывайте файл FASTQ в массив структур:

% Read the contents of a FASTQ-formatted file into
% an array of structures
reads = fastqread('SRR005164_1_50.fastq')

reads = 

1x50 struct array with fields:
    Header
    Sequence
    Quality

Считывайте файл FASTQ в три отдельные переменные:

% Read the contents of a FASTQ-formatted file into 
% three separate variables
[headers,seqs,quals] = fastqread('SRR005164_1_50.fastq');

Считывание блока записей из файла FASTQ:

% Read the contents of reads 5 through 10 into
% an array of structures
reads_5_10 = fastqread('SRR005164_1_50.fastq', 'blockread', [5 10])

1x6 struct array with fields:
    Header
    Sequence
    Quality

Подробнее

свернуть все

Формат файла FASTQ

Файл в формате FASTQ содержит нуклеотидную последовательность и информацию о качестве по четырем линиям:

  • Строка 1 - Информация заголовка с префиксом @ символ

  • Линия 2 - Нуклеотидная последовательность

  • Строка 3 - Информация заголовка с префиксом + символ

  • Линия 4 - ASCII представление показателей качества по основаниям для нуклеотидной последовательности с использованием кодирования Phred или Solexa

Представлен в R2009b