fastqread

Считайте данные из файла FASTQ

Синтаксис

FASTQStruct = fastqread(File)
[Header, Sequence] = fastqread(File)
[Header, Sequence, Qual] = fastqread(File)
fastqread(..., 'Blockread', BlockreadValue, ...)
fastqread(..., 'HeaderOnly', HeaderOnlyValue, ...)
fastqread(..., 'TrimHeaders', TrimHeadersValue, ...)

Описание

FASTQStruct = fastqread(File) читает файл в формате FASTQ и возвращает данные в MATLAB® массив структур.

[Header, Sequence] = fastqread(File) возвращает только заголовок и данные последовательности в двух отдельных переменных.

[Header, Sequence, Qual] = fastqread(File) возвращает данные в трех отдельных переменных.

fastqread (..., 'PropertyName', PropertyValue, ...) вызывает fastqread с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Заключайте каждую PropertyName в одинарных кавычках. Каждый PropertyName является нечувствительным к регистру. Эти имена свойства/пары значения свойств следующие:

fastqread(..., 'Blockread', BlockreadValue, ...) считывает одну запись последовательности или блок записей последовательности из FASTQ-форматированного файла, содержащего несколько последовательностей.

fastqread(..., 'HeaderOnly', HeaderOnlyValue, ...) определяет, возвращать ли только информацию о заголовке.

fastqread(..., 'TrimHeaders', TrimHeadersValue, ...) определяет, следует ли обрезать заголовок по первому белому пространству.

Входные параметры

File

Одно из следующих:

  • Вектор символов или строка, задающая имя файла или путь и имя файла FASTQ-форматированного файла. Если вы задаете только имя файла, этот файл должен быть в пути поиска файлов MATLAB или в текущей папке MATLAB.

  • MATLAB символьного массива, который содержит текст FASTQ-форматированного файла.

BlockreadValue

Скаляр или вектор, который управляет считыванием записи одной последовательности или блока записей последовательности из FASTQ-форматированного файла, содержащего несколько последовательностей. Введите скалярное N чтобы прочитать Nвторая запись в файле. Введите вектор 1 на 2 [M1, M2] чтобы считать блок записей, начиная с M1 вход и окончание в M2 запись. Чтобы считать все оставшиеся записи в файле, начиная с M1 введите положительное значение для M1 и вводите Inf для M2.

HeaderOnlyValue

Определяет, возвращать ли только информацию о заголовке. Варианты true или false (по умолчанию).

TrimHeadersValue

Определяет, следует ли обрезать заголовок после первого символа пробела. Символы белого пространства включают пробел (char (32)) и вкладку (char (9)). Варианты true или false (по умолчанию).

Выходные аргументы

FASTQStruct

Массив структур, содержащий информацию из FASTQ-форматированного файла. Существует одна структура для каждого чтения последовательности или записи в файле. Каждая структура содержит следующие поля.

ОбластьОписание
HeaderИнформация о заголовке.
SequenceПредставление нуклеотидной последовательности с одним буквенным кодом.
QualityПредставление ASCII счетов качества по основаниям для нуклеотидной последовательности.

Header

Переменная, содержащая информацию о заголовке или, если файл в формате FASTQ содержит несколько последовательностей, массив ячеек, содержащий информацию о заголовке.

Sequence

Переменная, содержащая информацию о последовательности или, если файл в формате FASTQ содержит несколько последовательностей, массив ячеек, содержащий информацию о последовательности.

Qual

Переменная, содержащая информацию о качестве, или, если файл в формате FASTQ содержит несколько последовательностей, массив ячеек, содержащий информацию о качестве.

Примеры

Считайте файл FASTQ в массив структур:

% Read the contents of a FASTQ-formatted file into
% an array of structures
reads = fastqread('SRR005164_1_50.fastq')

reads = 

1x50 struct array with fields:
    Header
    Sequence
    Quality

Считайте файл FASTQ в три отдельные переменные:

% Read the contents of a FASTQ-formatted file into 
% three separate variables
[headers,seqs,quals] = fastqread('SRR005164_1_50.fastq');

Считайте блок записей из файла FASTQ:

% Read the contents of reads 5 through 10 into
% an array of structures
reads_5_10 = fastqread('SRR005164_1_50.fastq', 'blockread', [5 10])

1x6 struct array with fields:
    Header
    Sequence
    Quality

Подробнее о

свернуть все

Формат FASTQ-файла

FASTQ-форматированный файл содержит нуклеотидную последовательность и информацию о качестве в четырёх линиях:

  • Line 1 - информация о заголовке с префиксом @ символ

  • Line 2 - Нуклеотидная последовательность

  • Line 3 - информация о заголовке с префиксом + символ

  • Line 4 - представление ASCII счетов качества по основаниям для нуклеотидной последовательности с использованием кодирования Phred или Solexa

Введенный в R2009b