exponenta event banner

fastawrite

Запись в файл в формате FASTA

Синтаксис

fastawrite(File, Data)
fastawrite(File, Header, Sequence)

Аргументы

File

Символьный вектор или строка, указывающая либо имя файла, либо путь и имя файла для сохранения данных в формате FASTA. Если указано только имя файла, fastawrite сохраняет файл в текущей папке MATLAB ®. Если указан существующий файл ,fastawrite добавляет данные в файл вместо перезаписи файла.

Data

Любое из следующих действий:

  • Символьный вектор или строка, содержащая последовательность

  • Структура MATLAB, содержащая поля Header и Sequence

  • Структура MATLAB, содержащая информацию о последовательности из базы данных GenBank ® или GenPept, например, genbankread, getgenbank, genpeptread, или getgenpept.

  • Символьный массив, где каждая строка является последовательностью.

HeaderСимвольный вектор или строка, содержащая информацию заголовка о последовательности. Этот текст отображается в заголовке файла в формате FASTA. File.
Sequence

Символьный вектор или строка, содержащая аминокислотную или нуклеотидную последовательность с использованием стандартных букв или целочисленных кодов IUB/IUPAC. Список допустимых символов см. в разделе Аминокислотный или нуклеотидный поиск.

Описание

fastawrite(File, Data) записывает содержимое Data кому File, файл в формате FASTA. Если указан существующий файл в формате FASTA,fastawrite добавляет данные в файл вместо перезаписи файла. Спецификации формата FASTA см. на веб-сайте https://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml.

fastawrite(File, Header, Sequence) записывает указанный заголовок и информацию о последовательности в File, файл в формате FASTA.

Совет

Чтобы добавить данные в формате FASTA к существующему файлу, просто укажите это имя файла. fastawrite добавляет данные в конец файла.

Если используется fastawrite в сценарии можно отключить предупреждающее сообщение добавления, введя следующие командные строки перед fastawrite команда:

warnState = warning %Save the current warning state
warning('off','Bioinfo:fastawrite:AppendToFile'); 
Затем введите следующую командную строку после fastawrite команда:
warning(warnState) %Reset warning state to previous settings

Примеры

Пример 8. Запись области кодирования в файл в формате FASTA
  1. Извлеките последовательность гена p53 человека из базы данных GenBank.

    seq = getgenbank('NM_000546');
  2. Прочтите координаты области кодирования в строке CDS.

    start = seq.CDS.indices(1)
    
    start =
    
       198
    
    stop = seq.CDS.indices(2)
    
    stop =
    
       1379
  3. Извлеките область кодирования.

    codingSeq = seq.Sequence(start:stop);
  4. Запишите область кодирования в файл в формате FASTA, указав Coding region for p53 для заголовка в файле, и p53coding.txt для имени файла.

    fastawrite('p53coding.txt','Coding region for p53',codingSeq);
Пример 9. Сохранение нескольких последовательностей в файл в формате FASTA
  1. Записать две нуклеотидные последовательности в структуру MATLAB, содержащую поля Header и Sequence.

    data(1).Sequence = 'ACACAGGAAA';
    data(1).Header = 'First sequence';
    data(2).Sequence = 'ACGTCAGGTC';
    data(2).Header = 'Second sequence';
    
  2. Запишите последовательности в файл в формате FASTA, указав my_sequences.txt для имени файла.

    fastawrite('my_sequences.txt', data)
    
  3. Отображение файла в формате FASTA, my_sequences.txt.

    type('my_sequences.txt')
    
    >First sequence
    ACACAGGAAA
    
    >Second sequence
    ACGTCAGGTC
    
Пример 10. Добавление последовательностей в файл в формате FASTA
  1. Если это еще не сделано, создайте файл в формате FASTA, my_sequences.txt, описанного ранее.

  2. Добавьте третью последовательность в файл.

    fastawrite('my_sequences.txt','Third sequence','TACTGACTTC')
    
  3. Отображение файла в формате FASTA, my_sequences.txt.

    type('my_sequences.txt')
    
    >First sequence
    ACACAGGAAA
    
    >Second sequence
    ACGTCAGGTC
    
    >Third sequence
    TACTGACTTC
Представлен до R2006a