Получение информации о последовательности из базы данных EMBL
EMBLData = getembl(AccessionNumber)
EMBLData = getembl(...,
'ToFile', ToFileValue, ...)
EMBLSeq = getembl(...,
'SequenceOnly', SequenceOnlyValue, ...)
EMBLSeq = getembl(...,
'TimeOut', TimeOutValue, ...)
AccessionNumber | Уникальный идентификатор для записи последовательности. Введите уникальную комбинацию букв и цифр. |
ToFileValue | Вектор символов имя файла или путь и имя файла, к которым нужно сохранить данные. Если вы задаете только имя файла, файл хранится в текущей папке. |
SequenceOnlyValue | Управляет извлечением только последовательности без метаданных. Варианты true или false (по умолчанию). |
TimeOutValue | Тайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь. |
EMBLData | MATLAB® структура с полями, соответствующими данным EMBL. |
EMBLSeq | MATLAB вектор символов, представляющий последовательность. |
getembl извлекает информацию из базы данных Европейской лаборатории молекулярной биологии (EMBL) для нуклеотидных последовательностей. Эта база данных ведется Европейским институтом биоинформатики (EBI). Для получения дополнительной информации о базе данных EMBL см.
ищет номер доступа в базе данных EMBL (EMBLData = getembl(AccessionNumber)https://www.ebi.ac.uk/) и возвращается EMBLData, структуру MATLAB с полями, соответствующими коду типа двухсимвольной линии EMBL. Каждый код типа линия хранится как отдельный элемент в структуре.
EMBLData содержит следующие поля.
| Область |
|---|
Identification |
Accession |
SequenceVersion |
DateCreated |
DateUpdated |
Description |
Keyword |
OrganismSpecies |
OrganismClassification |
Organelle |
Reference |
DatabaseCrossReference |
Comments |
Assembly |
Feature |
BaseCount |
Sequence |
вызывает EMBLData = getembl (..., 'PropertyName', PropertyValue, ...)getembl с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
сохраняет информацию в файл в формате EMBL. EMBLData = getembl(...,
'ToFile', ToFileValue, ...)ToFileValue - вектор символов, задающий имя файла или путь и имя файла, в который можно сохранить данные. Если вы задаете только имя файла, файл хранится в текущей папке.
Совет
Прочитайте файл в формате EMBL обратно в программное обеспечение MATLAB с помощью emblread функция.
управляет извлечением только последовательности без метаданных. Варианты EMBLSeq = getembl(...,
'SequenceOnly', SequenceOnlyValue, ...)true или false (по умолчанию).
устанавливает тайм-аут подключения (в секундах) для извлечения данных из базы данных EMBL.EMBLSeq = getembl(...,
'TimeOut', TimeOutValue, ...)
Получите данные для аполипопротеина A-I печени крысы.
emblout = getembl('X00558')
Найдите данные для аполипопротеина A-I печени крысы и сохраните их в файл rat_protein. Если вы задаете имя файла без пути, файл хранится в текущей папке.
emblout = getembl('X00558','ToFile','c:\project\rat_protein.txt')
Извлеките только последовательность для аполипопротеина A-I печени крыс.
Seq = getembl('X00558','SequenceOnly',true)
emblread | getgenbank | getgenpept | getpdb | seqviewer