getembl

Получение информации о последовательности из базы данных EMBL

Синтаксис

EMBLData = getembl(AccessionNumber)
EMBLData = getembl(..., 'ToFile', ToFileValue, ...)
EMBLSeq = getembl(..., 'SequenceOnly', SequenceOnlyValue, ...)
EMBLSeq = getembl(..., 'TimeOut', TimeOutValue, ...)

Входные параметры

AccessionNumber Уникальный идентификатор для записи последовательности. Введите уникальную комбинацию букв и цифр.
ToFileValue Вектор символов имя файла или путь и имя файла, к которым нужно сохранить данные. Если вы задаете только имя файла, файл хранится в текущей папке.
SequenceOnlyValueУправляет извлечением только последовательности без метаданных. Варианты true или false (по умолчанию).
TimeOutValueТайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь.

Выходные аргументы

EMBLData MATLAB® структура с полями, соответствующими данным EMBL.
EMBLSeqMATLAB вектор символов, представляющий последовательность.

Описание

getembl извлекает информацию из базы данных Европейской лаборатории молекулярной биологии (EMBL) для нуклеотидных последовательностей. Эта база данных ведется Европейским институтом биоинформатики (EBI). Для получения дополнительной информации о базе данных EMBL см.

EMBLData = getembl(AccessionNumber) ищет номер доступа в базе данных EMBL (https://www.ebi.ac.uk/) и возвращается EMBLData, структуру MATLAB с полями, соответствующими коду типа двухсимвольной линии EMBL. Каждый код типа линия хранится как отдельный элемент в структуре.

EMBLData содержит следующие поля.

Область
Identification
Accession
SequenceVersion
DateCreated
DateUpdated
Description
Keyword
OrganismSpecies
OrganismClassification
Organelle
Reference
DatabaseCrossReference
Comments
Assembly
Feature
BaseCount
Sequence

EMBLData = getembl (..., 'PropertyName', PropertyValue, ...) вызывает getembl с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

EMBLData = getembl(..., 'ToFile', ToFileValue, ...) сохраняет информацию в файл в формате EMBL. ToFileValue - вектор символов, задающий имя файла или путь и имя файла, в который можно сохранить данные. Если вы задаете только имя файла, файл хранится в текущей папке.

Совет

Прочитайте файл в формате EMBL обратно в программное обеспечение MATLAB с помощью emblread функция.

EMBLSeq = getembl(..., 'SequenceOnly', SequenceOnlyValue, ...) управляет извлечением только последовательности без метаданных. Варианты true или false (по умолчанию).

EMBLSeq = getembl(..., 'TimeOut', TimeOutValue, ...) устанавливает тайм-аут подключения (в секундах) для извлечения данных из базы данных EMBL.

Примеры

Получите данные для аполипопротеина A-I печени крысы.

emblout = getembl('X00558')

Найдите данные для аполипопротеина A-I печени крысы и сохраните их в файл rat_protein. Если вы задаете имя файла без пути, файл хранится в текущей папке.

emblout = getembl('X00558','ToFile','c:\project\rat_protein.txt')

Извлеките только последовательность для аполипопротеина A-I печени крыс.

Seq = getembl('X00558','SequenceOnly',true)
Представлено до R2006a