Запись в файл в формате FASTA
fastawrite(File, Data)
fastawrite(File, Header, Sequence)
File | Вектор символов или строка, задающая имя файла или путь и имя файла для сохранения форматированных FASTA данных. Если вы задаете только имя файла, |
Data | Любое из следующих:
|
Header | Вектор символов или строка, содержащая информацию заголовка о последовательности. Этот текст появляется в заголовке файла в формате FASTA, File. |
Sequence | Вектор символов или строка, содержащая аминокислотную или нуклеотидную последовательность с использованием стандартной буквы IUB/IUPAC или целочисленных кодов. Список допустимых символов см. в Amino Acid Lookup или Nucleotide Lookup. |
fastawrite( записывает содержимое File, Data)Data на File, файл в формате FASTA. Если вы задаете существующий файл в формате FASTA,fastawrite добавляет данные к файлу вместо перезаписи файла. Для спецификаций FASTA-формата посетите https://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml.
fastawrite( записывает указанный заголовок и информацию о последовательности в File, Header, Sequence)File, файл в формате FASTA.
Совет
Чтобы добавить данные в формате FASTA к существующему файлу, просто укажите это имя файла. fastawrite добавляет данные в конец файла.
Если вы используете fastawrite в скрипте можно отключить предупреждение о добавлении путем ввода следующих командных строк перед fastawrite команда:
warnState = warning %Save the current warning state
warning('off','Bioinfo:fastawrite:AppendToFile'); fastawrite команда:warning(warnState) %Reset warning state to previous settings
Извлеките последовательность для гена p53 человека из базы данных GenBank.
seq = getgenbank('NM_000546');Считайте координаты области кодирования в линии CDS.
start = seq.CDS.indices(1) start = 198 stop = seq.CDS.indices(2) stop = 1379
Извлеките область кодирования.
codingSeq = seq.Sequence(start:stop);
Запишите область кодирования в файл с форматированием FASTA, задав Coding region for p53 для заголовка в файле и p53coding.txt для имени файла.
fastawrite('p53coding.txt','Coding region for p53',codingSeq);Запишите две нуклеотидные последовательности в структуру MATLAB, содержащую поля Header и Sequence.
data(1).Sequence = 'ACACAGGAAA'; data(1).Header = 'First sequence'; data(2).Sequence = 'ACGTCAGGTC'; data(2).Header = 'Second sequence';
Запишите последовательности в файл с форматированием FASTA, задав my_sequences.txt для имени файла.
fastawrite('my_sequences.txt', data)
Отображение файла в формате FASTA, my_sequences.txt.
type('my_sequences.txt')
>First sequence
ACACAGGAAA
>Second sequence
ACGTCAGGTC
Если вы еще не сделали этого, создайте файл в формате FASTA, my_sequences.txt, описанная ранее.
Добавьте третью последовательность к файлу.
fastawrite('my_sequences.txt','Third sequence','TACTGACTTC')
Отображение файла в формате FASTA, my_sequences.txt.
type('my_sequences.txt')
>First sequence
ACACAGGAAA
>Second sequence
ACGTCAGGTC
>Third sequence
TACTGACTTCfastainfo | fastaread | fastqinfo | fastqread | fastqwrite | genbankread | genpeptread | getgenbank | getgenpept | multialignwrite | saminfo | samread | seqviewer | sffinfo | sffread