exponenta event banner

genbankread

Считывание данных из файла GenBank

Синтаксис

GenBankData = genbankread(File)
GenBankData = genbankread(File, 'TimeOut', TimeOutValue)

Аргументы

File

Одно из следующих действий:

  • Символьный вектор или строка, указывающая имя файла, путь и имя файла или URL-адрес, указывающий на файл. Файл, на который имеется ссылка, имеет формат GenBank (текстовый файл ASCII). Если указано только имя файла, этот файл должен находиться в пути поиска MATLAB ® или в текущей папке MATLAB.

  • Символьный массив MATLAB или вектор строки, содержащий текст файла в формате GenBank.

Совет

Вы можете использовать getgenbank функции с помощью 'ToFile' свойство для получения информации о последовательности из базы данных GenBank ® и создания файла в формате GenBank.

TimeOutValueВремя ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь.
GenBankData Структура MATLAB или массив структур, содержащих поля, соответствующие ключевым словам GenBank.

Описание

GenBankData = genbankread(File) читает файл в формате GenBank, File, и создает GenBankDataструктура или массив структур, содержащих поля, соответствующие ключевым словам GenBank. Когда File содержит несколько записей, каждая запись хранится как отдельный элемент в GenBankData. Список ключевых слов GenBank см. в разделе https://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html.

GenBankData = genbankread(File, 'TimeOut', TimeOutValue) задает время ожидания подключения (в секундах) для чтения данных из удаленного файла или URL-адреса.

Примеры

  1. Извлеките информацию о последовательности для гена HEXA, сохраните данные в файле и затем прочтите в программное обеспечение MATLAB.

    getgenbank('nm_000520', 'ToFile', 'TaySachs_Gene.txt')
    s = genbankread('TaySachs_Gene.txt')
    
    s = 
    
                    LocusName: 'NM_000520'
          LocusSequenceLength: '2437'
         LocusNumberofStrands: ''
                LocusTopology: 'linear'
            LocusMoleculeType: 'mRNA'
         LocusGenBankDivision: 'PRI'
        LocusModificationDate: '18-FEB-2009'
                   Definition: [1x63 char]
                    Accession: 'NM_000520'
                      Version: 'NM_000520.4'
                           GI: '189181665'
                      Project: []
                       DBLink: []
                     Keywords: []
                      Segment: []
                       Source: 'Homo sapiens (human)'
               SourceOrganism: [4x65 char]
                    Reference: {1x10 cell}
                      Comment: [32x67 char]
                     Features: [147x74 char]
                          CDS: [1x1 struct]
                     Sequence: [1x2437 char]
  2. Отображение исходного организма для этой последовательности.

    s.SourceOrganism
    
    ans =
    
    Homo sapiens                                                     
    Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
    Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;     
    Catarrhini; Hominidae; Homo.
Представлен до R2006a