genbankread

Считайте данные из файла GenBank

Синтаксис

GenBankData = genbankread(File)

Аргументы

File

Любое из следующего:

  • Вектор символов или строка, задающая имя файла, путь и имя файла или URL, указывающий на файл. Файл, на который ссылаются, является GenBank-отформатированным файлом (текстовый ASCII-файл). Если вы задаете только имя файла, тот файл должен быть на пути поиска файлов MATLAB® или в Текущей папке MATLAB.

  • Символьный массив MATLAB или вектор строки, который содержит текст GenBank-отформатированного файла.

Совет

Можно использовать функцию getgenbank со свойством 'ToFile' получить информацию о последовательности из базы данных GenBank® и создать GenBank-отформатированный файл.

GenBankData Структура MATLAB или массив структур, содержащих полевое соответствие ключевым словам GenBank.

Описание

GenBankData = genbankread(File) читает GenBank-отформатированный файл, File, и создает GenBankData, структуру или массив структур, содержа поля, соответствующие ключевым словам GenBank. Когда File содержит многократные въезды, каждая запись хранится как отдельный элемент в GenBankData. Для списка ключевых слов GenBank см. https://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html.

Примеры

  1. Получите информацию о последовательности для гена HEXA, храните данные в файле, и затем читайте в программное обеспечение MATLAB.

    getgenbank('nm_000520', 'ToFile', 'TaySachs_Gene.txt')
    s = genbankread('TaySachs_Gene.txt')
    
    s = 
    
                    LocusName: 'NM_000520'
          LocusSequenceLength: '2437'
         LocusNumberofStrands: ''
                LocusTopology: 'linear'
            LocusMoleculeType: 'mRNA'
         LocusGenBankDivision: 'PRI'
        LocusModificationDate: '18-FEB-2009'
                   Definition: [1x63 char]
                    Accession: 'NM_000520'
                      Version: 'NM_000520.4'
                           GI: '189181665'
                      Project: []
                       DBLink: []
                     Keywords: []
                      Segment: []
                       Source: 'Homo sapiens (human)'
               SourceOrganism: [4x65 char]
                    Reference: {1x10 cell}
                      Comment: [32x67 char]
                     Features: [147x74 char]
                          CDS: [1x1 struct]
                     Sequence: [1x2437 char]
  2. Отобразите исходный организм для этой последовательности.

    s.SourceOrganism
    
    ans =
    
    Homo sapiens                                                     
    Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
    Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;     
    Catarrhini; Hominidae; Homo.

Смотрите также

| | | | |

Представлено до R2006a