exponenta event banner

getembl

Получение информации о последовательности из базы данных EMBL

Синтаксис

EMBLData = getembl(AccessionNumber)
EMBLData = getembl(..., 'ToFile', ToFileValue, ...)
EMBLSeq = getembl(..., 'SequenceOnly', SequenceOnlyValue, ...)
EMBLSeq = getembl(..., 'TimeOut', TimeOutValue, ...)

Входные аргументы

AccessionNumber Уникальный идентификатор записи последовательности. Введите уникальное сочетание букв и цифр.
ToFileValue Вектор символов, указывающий имя файла или путь и имя файла для сохранения данных. Если указано только имя файла, файл сохраняется в текущей папке.
SequenceOnlyValueУправляет извлечением только последовательности без метаданных. Варианты: true или false (по умолчанию).
TimeOutValueВремя ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь.

Выходные аргументы

EMBLData Структура MATLAB ® с полями, соответствующими данным EMBL.
EMBLSeqСимвольный вектор MATLAB, представляющий последовательность.

Описание

getembl извлекает информацию из базы данных Европейской лаборатории молекулярной биологии (EMBL) для нуклеотидных последовательностей. Эта база данных поддерживается Европейским институтом биоинформатики (EBI). Дополнительные сведения о базе данных EMBL см. в разделе

EMBLData = getembl(AccessionNumber) ищет номер присоединения в базе данных EMBL (https://www.ebi.ac.uk/) и возвращает EMBLDataструктура MATLAB с полями, соответствующими двухсимвольному коду типа строки EMBL. Каждый код типа строки сохраняется в структуре как отдельный элемент.

EMBLData содержит следующие поля.

Область
Identification
Accession
SequenceVersion
DateCreated
DateUpdated
Description
Keyword
OrganismSpecies
OrganismClassification
Organelle
Reference
DatabaseCrossReference
Comments
Assembly
Feature
BaseCount
Sequence

EMBLData = getembl(..., 'PropertyName', PropertyValue, ...) требования getembl с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

EMBLData = getembl(..., 'ToFile', ToFileValue, ...) сохраняет информацию в файле в формате EMBL. ToFileValue является вектором символов, указывающим имя файла или путь и имя файла, в которые следует сохранить данные. Если указано только имя файла, файл сохраняется в текущей папке.

Совет

Прочитайте файл в формате EMBL обратно в программное обеспечение MATLAB с помощью emblread функция.

EMBLSeq = getembl(..., 'SequenceOnly', SequenceOnlyValue, ...) управляет извлечением только последовательности без метаданных. Варианты: true или false (по умолчанию).

EMBLSeq = getembl(..., 'TimeOut', TimeOutValue, ...) устанавливает время ожидания подключения (в секундах) для получения данных из базы данных EMBL.

Примеры

Извлеките данные для аполипопротеина A-I печени крысы.

emblout = getembl('X00558')

Извлеките данные для аполипопротеина A-I печени крысы и сохраните их в файле rat_protein. Если указать имя файла без пути, файл будет сохранен в текущей папке.

emblout = getembl('X00558','ToFile','c:\project\rat_protein.txt')

Извлекают только последовательность аполипопротеина A-I печени крысы.

Seq = getembl('X00558','SequenceOnly',true)
Представлен до R2006a