genbankread

Чтение данных из файла GenBank

Синтаксис

GenBankData = genbankread(File)
GenBankData = genbankread(File, 'TimeOut', TimeOutValue)

Аргументы

File

Одно из следующих:

  • Вектор символов или строка, указывающая имя файла, путь и имя файла или URL-адрес, указывающий на файл. Файл-ссылка является файлом в формате GenBank (текстовый файл ASCII). Если вы задаете только имя файла, этот файл должен быть в MATLAB® путь поиска файлов или в текущей папке MATLAB.

  • MATLAB символьного массива или вектор строки, который содержит текст файла в формате GenBank.

Совет

Вы можете использовать getgenbank функция со 'ToFile' свойство для извлечения информации о последовательности из GenBank® и создайте файл в формате GenBank.

TimeOutValueТайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь.
GenBankData Структура MATLAB или массив структур, содержащий поля, соответствующие ключевым словам GenBank.

Описание

GenBankData = genbankread(File) считывает файл в формате GenBank, File, и создает GenBankData, структуру или массив структур, содержащих поля, соответствующие ключевым словам GenBank. Когда File содержит несколько записей, каждая запись хранится как отдельный элемент в GenBankData. Список ключевых слов GenBank см. в разделе https://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html.

GenBankData = genbankread(File, 'TimeOut', TimeOutValue) устанавливает тайм-аут подключения (в секундах), чтобы считать данные из удаленного файла или URL-адреса.

Примеры

  1. Получите информацию о последовательности для гена HEXA, сохраните данные в файле и затем прочтите в программное обеспечение MATLAB.

    getgenbank('nm_000520', 'ToFile', 'TaySachs_Gene.txt')
    s = genbankread('TaySachs_Gene.txt')
    
    s = 
    
                    LocusName: 'NM_000520'
          LocusSequenceLength: '2437'
         LocusNumberofStrands: ''
                LocusTopology: 'linear'
            LocusMoleculeType: 'mRNA'
         LocusGenBankDivision: 'PRI'
        LocusModificationDate: '18-FEB-2009'
                   Definition: [1x63 char]
                    Accession: 'NM_000520'
                      Version: 'NM_000520.4'
                           GI: '189181665'
                      Project: []
                       DBLink: []
                     Keywords: []
                      Segment: []
                       Source: 'Homo sapiens (human)'
               SourceOrganism: [4x65 char]
                    Reference: {1x10 cell}
                      Comment: [32x67 char]
                     Features: [147x74 char]
                          CDS: [1x1 struct]
                     Sequence: [1x2437 char]
  2. Отобразите исходный организм для этой последовательности.

    s.SourceOrganism
    
    ans =
    
    Homo sapiens                                                     
    Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
    Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;     
    Catarrhini; Hominidae; Homo.
Представлено до R2006a