fastqwrite

Запись в файл в формате FASTQ

Синтаксис

fastqwrite(File, FASTQStruct)
fastqwrite(File, Header, Sequence, Qual)

Описание

fastqwrite(File, FASTQStruct) записывает содержимое MATLAB® структура или массив структур в FASTQ-форматированный файл. Если вы задаете существующий файл в формате FASTQ, fastqwrite добавляет данные к файлу вместо перезаписи файла.

fastqwrite(File, Header, Sequence, Qual) записывает заголовок, последовательность и информацию о качестве в FASTQ-форматированный файл.

Совет

Чтобы добавить данные в формате FASTQ к существующему файлу, просто укажите это имя файла. fastqwrite добавляет данные в конец файла.

Если вы используете fastqwrite в скрипте можно отключить предупреждение о добавлении путем ввода следующих командных строк перед fastqwrite команда:

warnState = warning %Save the current warning state
warning('off','Bioinfo:fastqwrite:AppendToFile'); 
Затем введите следующую командную строку после fastqwrite команда:
warning(warnState) %Reset warning state to previous settings

Входные параметры

File

Вектор символов или строка, задающая имя файла или путь и имя файла для сохранения данных в формате FASTQ. Если вы задаете только имя файла, fastqwrite сохраняет файл в текущей папке MATLAB. Если вы задаете существующий файл, fastqwrite добавляет данные к файлу вместо перезаписи файла.

FASTQStruct

Структура MATLAB или массив структур, содержащий поля Header, Sequence, и Quality, таких как возвращенные fastqread.

Header

Вектор символов или строка, содержащая информацию заголовка о нуклеотидной последовательности. Этот текст появляется в заголовке файла в формате FASTQ, File.

Sequence

Вектор символов или строка, содержащая нуклеотидную последовательность с использованием стандартной буквы IUB/IUPAC или целочисленных кодов. Список допустимых символов см. в Amino Acid Lookup или Nucleotide Lookup.

Qual

Вектор символов или строка, содержащая представление ASCII счетов качества по основаниям для нуклеотидной последовательности.

Примеры

Запись нескольких последовательностей в файл FASTQ из массива структур:

% Read the contents of a FASTQ-formatted file into
% an array of structures
reads = fastqread('SRR005164_1_50.fastq');
% Create another array of structures for the first five reads
reads5 = reads(1:5);
% Write the first five reads to a separate FASTQ-formatted file
fastqwrite('fiveReads.fastq', reads5)

Запись одной последовательности в файл FASTQ из отдельных переменных:

% Create separate variables for the header, sequence, and 
% quality information of a nucleotide sequence
h = 'MYSEQ-000_1_1_1_953_493';
s = 'GTTACCATGATGTTATTTCTTCATTTGGAGGTAAAA';
q = ']]]]]]]]]]]]]]]]]]]]]]T]]]]RJRZTQLOA';
% Write the information to a FASTQ-formatted file
fastqwrite('oneRead.fastq', h, s, q)

Подробнее о

свернуть все

Формат FASTQ-файла

FASTQ-форматированный файл содержит нуклеотидную последовательность и информацию о качестве в четырёх линиях:

  • Line 1 - информация о заголовке с префиксом @ символ

  • Line 2 - Нуклеотидная последовательность

  • Line 3 - информация о заголовке с префиксом + символ

  • Line 4 - представление ASCII счетов качества по основаниям для нуклеотидной последовательности с использованием кодирования Phred или Solexa

Введенный в R2009b