fastqread

Считайте данные из файла FASTQ

Синтаксис

FASTQStruct = fastqread(File)
[Header, Sequence] = fastqread(File)
[Header, Sequence, Qual] = fastqread(File)
fastqread(..., 'Blockread', BlockreadValue, ...)
fastqread(..., 'HeaderOnly', HeaderOnlyValue, ...)
fastqread(..., 'TrimHeaders', TrimHeadersValue, ...)

Описание

FASTQStruct = fastqread(File) читает FASTQ-отформатированный файл и возвращает данные в массиве MATLAB® структур.

[Header, Sequence] = fastqread(File) возвращает только заголовок и данные о последовательности в двух отдельных переменных.

[Header, Sequence, Qual] = fastqread(File) возвращает данные в трех отдельных переменных.

fastqread(..., 'PropertyName', PropertyValue, ...) вызывает fastqread с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Заключите каждый PropertyName в одинарные кавычки. Каждый PropertyName является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:

fastqread(..., 'Blockread', BlockreadValue, ...) читает одну запись последовательности или блок записей последовательности из FASTQ-отформатированного файла, содержащего несколько последовательностей.

fastqread(..., 'HeaderOnly', HeaderOnlyValue, ...) задает, возвратить ли только информацию о заголовке.

fastqread(..., 'TrimHeaders', TrimHeadersValue, ...) задает, обрезать ли заголовок к первому пробелу.

Входные параметры

File

Любое из следующего:

  • Вектор символов или строка, задающая имя файла или путь и имя файла FASTQ-отформатированного файла. Если вы задаете только имя файла, тот файл должен быть на пути поиска файлов MATLAB или в Текущей папке MATLAB.

  • Символьный массив MATLAB, который содержит текст FASTQ-отформатированного файла.

BlockreadValue

Скаляр или вектор, который управляет чтением одной записи последовательности или блоком записей последовательности из FASTQ-отформатированного файла, содержащего несколько последовательностей. Введите скалярный N, чтобы считать N th запись в файле. Введите 1 2 векторный [M1, M2], чтобы считать блок записей, запускающихся при записи M1 и заканчивающихся при записи M2. Чтобы считать все остающиеся записи в файле, запускающемся при записи M1, введите положительное значение для M1 и введите Inf для M2.

HeaderOnlyValue

Задает, возвратить ли только информацию о заголовке. Выбором является true или false (значение по умолчанию).

TrimHeadersValue

Задает, обрезать ли заголовок после первого пробельного символа. Пробельные символы включают пробел (char (32)) и вкладка (char (9)). Выбором является true или false (значение по умолчанию).

Выходные аргументы

FASTQStruct

Массив структур, содержащих информацию из FASTQ-отформатированного файла. Существует одна структура для каждого чтения последовательности или записи в файле. Каждая структура содержит следующие поля.

Поле Описание
HeaderИнформация о заголовке.
SequenceОдно представление алфавитного кода последовательности нуклеотида.
QualityПредставление ASCII качественной музыки на основу к последовательности нуклеотида.

Header

Переменный содержащий информацию о заголовке или, если FASTQ-отформатированный файл содержит несколько последовательностей, массив ячеек, содержащий информацию о заголовке.

Sequence

Переменный содержащий информацию о последовательности или, если FASTQ-отформатированный файл содержит несколько последовательностей, массив ячеек, содержащий информацию о последовательности.

Qual

Переменный содержащий информацию о качестве или, если FASTQ-отформатированный файл содержит несколько последовательностей, массив ячеек, содержащий информацию о качестве.

Примеры

Считайте файл FASTQ в массив структур:

% Read the contents of a FASTQ-formatted file into
% an array of structures
reads = fastqread('SRR005164_1_50.fastq')

reads = 

1x50 struct array with fields:
    Header
    Sequence
    Quality

Считайте файл FASTQ в три отдельных переменные:

% Read the contents of a FASTQ-formatted file into 
% three separate variables
[headers,seqs,quals] = fastqread('SRR005164_1_50.fastq');

Считайте блок записей из файла FASTQ:

% Read the contents of reads 5 through 10 into
% an array of structures
reads_5_10 = fastqread('SRR005164_1_50.fastq', 'blockread', [5 10])

1x6 struct array with fields:
    Header
    Sequence
    Quality

Больше о

свернуть все

FASTQ-формат-файла

FASTQ-отформатированный файл содержит последовательность нуклеотида и информацию о качестве о четырех строках:

  • Line 1 — Информация о заголовке снабжается префиксом символ @

  • Line 2 — Последовательность нуклеотида

  • Line 3 — Информация о заголовке снабжается префиксом символ +

  • Line 4 — Представление ASCII качественной музыки на основу к использованию последовательности нуклеотида Phred или кодированию Solexa

Представленный в R2009b