fastawrite

Запишите в файл с помощью формата FASTA

Синтаксис

fastawrite(File, Data)
fastawrite(File, Header, Sequence)

Аргументы

File

Вектор символов или строка, задающая или имя файла или путь и имя файла для сохранения FASTA-отформатированных-данных. Если вы задаете только имя файла, fastawrite сохранил файл к MATLAB® Current Folder. Если вы задаете существующий файл, fastawrite добавляет данные к файлу, вместо того, чтобы перезаписать файл.

Data

Любое следующее:

  • Вектор символов или строка, содержащая последовательность

  • Структура MATLAB, содержащая поля Header и Sequence

  • Структура MATLAB, содержащая информацию о последовательности от GenBank® или базы данных GenPept, такой, как возвращено genbankread, getgenbank, genpeptread или getgenpept.

  • Символьный массив, где каждая строка является последовательностью.

HeaderВектор символов или информация о заголовке строки, содержащей о последовательности. Этот текст появляется в заголовке FASTA-отформатированного файла, File.
Sequence

Вектор символов или строка, содержащая аминокислота или последовательность нуклеотида с помощью стандартной буквы IUB/IUPAC или целочисленных кодов. Для списка допустимых символов смотрите Поиск Поиска или Нуклеотида Аминокислоты.

Описание

fastawrite(File, Data) пишет содержимое Data к File, FASTA-отформатированному файлу. Если вы задаете существующий FASTA-отформатированный файл, fastawrite добавляет данные к файлу, вместо того, чтобы перезаписать файл. Для спецификаций FASTA-формата посетите https://www.ncbi.nlm.nih.gov/BLAST/fasta.shtml.

fastawrite(File, Header, Sequence) пишет заданная информация о заголовке и последовательности в File, FASTA-отформатированный файл.

Совет

Чтобы добавить FASTA-отформатированные-данные к существующему файлу, просто задайте то имя файла. fastawrite добавляет данные в конец файла.

Если вы используете fastawrite в скрипте, можно отключить добавлять предупреждающее сообщение путем ввода следующих командных строк перед командой fastawrite:

warnState = warning %Save the current warning state
warning('off','Bioinfo:fastawrite:AppendToFile'); 
Затем введите следующую командную строку после команды fastawrite:
warning(warnState) %Reset warning state to previous settings

Примеры

Пример 13. Запись области кодирования к FASTA-отформатированному файлу
  1. Получите последовательность для человеческого p53 гена от базы данных GenBank.

    seq = getgenbank('NM_000546');
  2. Считайте координаты области кодирования в строке CDS.

    start = seq.CDS.indices(1)
    
    start =
    
       198
    
    stop = seq.CDS.indices(2)
    
    stop =
    
       1379
  3. Извлеките область кодирования.

    codingSeq = seq.Sequence(start:stop);
  4. Запишите область кодирования в FASTA-отформатированный файл, задав Coding region for p53 для Заголовка в файле и p53coding.txt для имени файла.

    fastawrite('p53coding.txt','Coding region for p53',codingSeq);
Пример 14. Сохранение нескольких последовательностей к FASTA-отформатированному файлу
  1. Запишите две последовательности нуклеотида в структуру MATLAB, содержащую поля Header и Sequence.

    data(1).Sequence = 'ACACAGGAAA';
    data(1).Header = 'First sequence';
    data(2).Sequence = 'ACGTCAGGTC';
    data(2).Header = 'Second sequence';
    
  2. Запишите последовательности в FASTA-отформатированный файл, задав my_sequences.txt для имени файла.

    fastawrite('my_sequences.txt', data)
    
  3. Отобразите FASTA-отформатированный файл, my_sequences.txt.

    type('my_sequences.txt')
    
    >First sequence
    ACACAGGAAA
    
    >Second sequence
    ACGTCAGGTC
    
Пример 15. Добавление последовательностей к FASTA-отформатированному файлу
  1. Если вы уже не сделали так, создайте FASTA-отформатированный файл, my_sequences.txt, описанный ранее.

  2. Добавьте третью последовательность к файлу.

    fastawrite('my_sequences.txt','Third sequence','TACTGACTTC')
    
  3. Отобразите FASTA-отформатированный файл, my_sequences.txt.

    type('my_sequences.txt')
    
    >First sequence
    ACACAGGAAA
    
    >Second sequence
    ACGTCAGGTC
    
    >Third sequence
    TACTGACTTC

Представлено до R2006a