Получение информации о последовательности из базы данных EMBL
EMBLData = getembl(AccessionNumber)
EMBLData = getembl(..., 'ToFile', ToFileValue, ...)
EMBLSeq = getembl(..., 'SequenceOnly', SequenceOnlyValue, ...)
EMBLSeq = getembl(..., 'TimeOut', TimeOutValue, ...)
AccessionNumber | Уникальный идентификатор записи последовательности. Введите уникальное сочетание букв и цифр. |
ToFileValue | Вектор символов, указывающий имя файла или путь и имя файла для сохранения данных. Если указано только имя файла, файл сохраняется в текущей папке. |
SequenceOnlyValue | Управляет извлечением только последовательности без метаданных. Варианты: true или false (по умолчанию). |
TimeOutValue | Время ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь. |
EMBLData | Структура MATLAB ® с полями, соответствующими данным EMBL. |
EMBLSeq | Символьный вектор MATLAB, представляющий последовательность. |
getembl извлекает информацию из базы данных Европейской лаборатории молекулярной биологии (EMBL) для нуклеотидных последовательностей. Эта база данных поддерживается Европейским институтом биоинформатики (EBI). Дополнительные сведения о базе данных EMBL см. в разделе
ищет номер присоединения в базе данных EMBL (EMBLData = getembl(AccessionNumber)https://www.ebi.ac.uk/) и возвращает EMBLDataструктура MATLAB с полями, соответствующими двухсимвольному коду типа строки EMBL. Каждый код типа строки сохраняется в структуре как отдельный элемент.
EMBLData содержит следующие поля.
| Область |
|---|
Identification |
Accession |
SequenceVersion |
DateCreated |
DateUpdated |
Description |
Keyword |
OrganismSpecies |
OrganismClassification |
Organelle |
Reference |
DatabaseCrossReference |
Comments |
Assembly |
Feature |
BaseCount |
Sequence |
требования EMBLData = getembl(..., 'PropertyName', PropertyValue, ...)getembl с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:
сохраняет информацию в файле в формате EMBL. EMBLData = getembl(..., 'ToFile', ToFileValue, ...)ToFileValue является вектором символов, указывающим имя файла или путь и имя файла, в которые следует сохранить данные. Если указано только имя файла, файл сохраняется в текущей папке.
Совет
Прочитайте файл в формате EMBL обратно в программное обеспечение MATLAB с помощью emblread функция.
управляет извлечением только последовательности без метаданных. Варианты: EMBLSeq = getembl(..., 'SequenceOnly', SequenceOnlyValue, ...)true или false (по умолчанию).
устанавливает время ожидания подключения (в секундах) для получения данных из базы данных EMBL.EMBLSeq = getembl(..., 'TimeOut', TimeOutValue, ...)
Извлеките данные для аполипопротеина A-I печени крысы.
emblout = getembl('X00558')
Извлеките данные для аполипопротеина A-I печени крысы и сохраните их в файле rat_protein. Если указать имя файла без пути, файл будет сохранен в текущей папке.
emblout = getembl('X00558','ToFile','c:\project\rat_protein.txt')
Извлекают только последовательность аполипопротеина A-I печени крысы.
Seq = getembl('X00558','SequenceOnly',true)
emblread | getgenbank | getgenpept | getpdb | seqviewer