Запись в файл в формате FASTA
fastawrite(
File
, Data
)
fastawrite(File
, Header
, Sequence
)
File | Вектор символов или строка, задающая имя файла или путь и имя файла для сохранения форматированных FASTA данных. Если вы задаете только имя файла, |
Data | Любое из следующих:
|
Header | Вектор символов или строка, содержащая информацию заголовка о последовательности. Этот текст появляется в заголовке файла в формате FASTA, File . |
Sequence | Вектор символов или строка, содержащая аминокислотную или нуклеотидную последовательность с использованием стандартной буквы IUB/IUPAC или целочисленных кодов. Список допустимых символов см. в Amino Acid Lookup или Nucleotide Lookup. |
fastawrite(
записывает содержимое File
, Data
)Data
на File
, файл в формате FASTA. Если вы задаете существующий файл в формате FASTA,fastawrite
добавляет данные к файлу вместо перезаписи файла. Для спецификаций FASTA-формата посетите https://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml.
fastawrite(
записывает указанный заголовок и информацию о последовательности в File
, Header
, Sequence
)File
, файл в формате FASTA.
Совет
Чтобы добавить данные в формате FASTA к существующему файлу, просто укажите это имя файла. fastawrite
добавляет данные в конец файла.
Если вы используете fastawrite
в скрипте можно отключить предупреждение о добавлении путем ввода следующих командных строк перед fastawrite
команда:
warnState = warning %Save the current warning state warning('off','Bioinfo:fastawrite:AppendToFile');
fastawrite
команда:warning(warnState) %Reset warning state to previous settings
Извлеките последовательность для гена p53 человека из базы данных GenBank.
seq = getgenbank('NM_000546');
Считайте координаты области кодирования в линии CDS.
start = seq.CDS.indices(1) start = 198 stop = seq.CDS.indices(2) stop = 1379
Извлеките область кодирования.
codingSeq = seq.Sequence(start:stop);
Запишите область кодирования в файл с форматированием FASTA, задав Coding region for p53
для заголовка в файле и p53coding.txt
для имени файла.
fastawrite('p53coding.txt','Coding region for p53',codingSeq);
Запишите две нуклеотидные последовательности в структуру MATLAB, содержащую поля Header
и Sequence
.
data(1).Sequence = 'ACACAGGAAA'; data(1).Header = 'First sequence'; data(2).Sequence = 'ACGTCAGGTC'; data(2).Header = 'Second sequence';
Запишите последовательности в файл с форматированием FASTA, задав my_sequences.txt
для имени файла.
fastawrite('my_sequences.txt', data)
Отображение файла в формате FASTA, my_sequences.txt
.
type('my_sequences.txt') >First sequence ACACAGGAAA >Second sequence ACGTCAGGTC
Если вы еще не сделали этого, создайте файл в формате FASTA, my_sequences.txt
, описанная ранее.
Добавьте третью последовательность к файлу.
fastawrite('my_sequences.txt','Third sequence','TACTGACTTC')
Отображение файла в формате FASTA, my_sequences.txt
.
type('my_sequences.txt') >First sequence ACACAGGAAA >Second sequence ACGTCAGGTC >Third sequence TACTGACTTC
fastainfo
| fastaread
| fastqinfo
| fastqread
| fastqwrite
| genbankread
| genpeptread
| getgenbank
| getgenpept
| multialignwrite
| saminfo
| samread
| seqviewer
| sffinfo
| sffread