Запись в файл в формате FASTA
fastawrite(File, Data)
fastawrite(File, Header, Sequence)
File | Символьный вектор или строка, указывающая либо имя файла, либо путь и имя файла для сохранения данных в формате FASTA. Если указано только имя файла, |
Data | Любое из следующих действий:
|
Header | Символьный вектор или строка, содержащая информацию заголовка о последовательности. Этот текст отображается в заголовке файла в формате FASTA. File. |
Sequence | Символьный вектор или строка, содержащая аминокислотную или нуклеотидную последовательность с использованием стандартных букв или целочисленных кодов IUB/IUPAC. Список допустимых символов см. в разделе Аминокислотный или нуклеотидный поиск. |
fastawrite( записывает содержимое File, Data)Data кому File, файл в формате FASTA. Если указан существующий файл в формате FASTA,fastawrite добавляет данные в файл вместо перезаписи файла. Спецификации формата FASTA см. на веб-сайте https://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml.
fastawrite( записывает указанный заголовок и информацию о последовательности в File, Header, Sequence)File, файл в формате FASTA.
Совет
Чтобы добавить данные в формате FASTA к существующему файлу, просто укажите это имя файла. fastawrite добавляет данные в конец файла.
Если используется fastawrite в сценарии можно отключить предупреждающее сообщение добавления, введя следующие командные строки перед fastawrite команда:
warnState = warning %Save the current warning state
warning('off','Bioinfo:fastawrite:AppendToFile'); fastawrite команда:warning(warnState) %Reset warning state to previous settings
Извлеките последовательность гена p53 человека из базы данных GenBank.
seq = getgenbank('NM_000546');Прочтите координаты области кодирования в строке CDS.
start = seq.CDS.indices(1) start = 198 stop = seq.CDS.indices(2) stop = 1379
Извлеките область кодирования.
codingSeq = seq.Sequence(start:stop);
Запишите область кодирования в файл в формате FASTA, указав Coding region for p53 для заголовка в файле, и p53coding.txt для имени файла.
fastawrite('p53coding.txt','Coding region for p53',codingSeq);Записать две нуклеотидные последовательности в структуру MATLAB, содержащую поля Header и Sequence.
data(1).Sequence = 'ACACAGGAAA'; data(1).Header = 'First sequence'; data(2).Sequence = 'ACGTCAGGTC'; data(2).Header = 'Second sequence';
Запишите последовательности в файл в формате FASTA, указав my_sequences.txt для имени файла.
fastawrite('my_sequences.txt', data)
Отображение файла в формате FASTA, my_sequences.txt.
type('my_sequences.txt')
>First sequence
ACACAGGAAA
>Second sequence
ACGTCAGGTC
Если это еще не сделано, создайте файл в формате FASTA, my_sequences.txt, описанного ранее.
Добавьте третью последовательность в файл.
fastawrite('my_sequences.txt','Third sequence','TACTGACTTC')
Отображение файла в формате FASTA, my_sequences.txt.
type('my_sequences.txt')
>First sequence
ACACAGGAAA
>Second sequence
ACGTCAGGTC
>Third sequence
TACTGACTTCfastainfo | fastaread | fastqinfo | fastqread | fastqwrite | genbankread | genpeptread | getgenbank | getgenpept | multialignwrite | saminfo | samread | seqviewer | sffinfo | sffread