emblread

Чтение данных из файла EMBL

Синтаксис

EMBLData = emblread(File)
EMBLSeq = emblread (File, 'SequenceOnly', SequenceOnlyValue)
EMBLSeq = emblread (File, 'TimeOut', TimeOutValue)

Входные параметры

File

Одно из следующих:

  • Вектор символов или строка, указывающая имя файла, путь и имя файла или URL-адрес, указывающий на файл. Файл-ссылка является файлом в формате EMBL. Если вы задаете только имя файла, этот файл должен быть в MATLAB® путь поиска файлов или в текущей папке MATLAB.

  • Вектор символов, содержащая текст файла в формате EMBL

Совет

Вы можете использовать getembl функция со 'ToFile' свойство для извлечения данных из базы данных Европейской лаборатории молекулярной биологии (EMBL) и создания файла в формате EMBL.

SequenceOnlyValueУправляет чтением только последовательности без метаданных. Варианты true или false (по умолчанию).
TimeOutValueТайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь.

Выходные аргументы

EMBLData Структура с полями, соответствующими данным EMBL.
EMBLSeqВектор символов, представляющий последовательность.

Описание

EMBLData = emblread(File) считывает данные из File, файл в формате EMBL, и создает EMBLData, структуру MATLAB, содержащую поля, соответствующие коду типа двухсимвольной линии EMBL, основанную на релизе 107 формата плоского файла EMBL-Bank. Каждый код типа линия хранится как отдельный элемент в структуре. Список кодов типа двухсимвольных линий EMBL см. в разделе ftp://ftp.ebi.ac.uk/pub/databases/embl/doc/usrman.txt.

Примечание

Информация о топологии не была включена в плоские файлы EMBL до релиза 87 базы данных. При чтении файла, созданного до релиза 87, EMBLREAD возвращает пустое Identification.Topology поле.

Примечание

Имя записи больше не отображается в линии ID плоских файлов EMBL в релизе 87. При чтении файла, созданного в релизе 87, EMBLREAD возвращает номер присоединения в Identification.EntryName поле.

EMBLSeq = emblread (File, 'SequenceOnly', SequenceOnlyValue) управляет чтением только последовательности без метаданных. Варианты true или false (по умолчанию).

EMBLSeq = emblread (File, 'TimeOut', TimeOutValue) устанавливает тайм-аут подключения (в секундах), чтобы считать данные из удаленного файла или URL-адреса.

Примеры

свернуть все

Загрузите информацию о последовательности из Интернета и сохраните в файл.

out = getembl('X00558','ToFile','rat_protein.txt');

Считайте данные из файла EMBL.

seqData = emblread('rat_protein.txt')
seqData = 

  struct with fields:

            Identification: [1×1 struct]
                 Accession: 'X00558'
           SequenceVersion: 'X00558.1'
               DateCreated: '13-JUN-1985  Rel. 06, Created '
               DateUpdated: '18-APR-2005  Rel. 83, Last updated, Version 4 '
               Description: 'Rat liver apolipoprotein A-I mRNA  apoA-I    ...'
                   Keyword: 'apolipoprotein; lipoprotein; signal peptide. ...'
           OrganismSpecies: 'Rattus norvegicus  Norway rat                ...'
    OrganismClassification: [3×75 char]
                 Organelle: ''
                 Reference: {[1×1 struct]}
    DatabaseCrossReference: [4×75 char]
                  Comments: ''
                  Assembly: ''
                   Feature: [22×75 char]
                 BaseCount: [1×1 struct]
                  Sequence: 'agctccgggggaggtcgcccacatccttcgggatgaaagctgcag...'

Представлено до R2006a