Получение информации о последовательности из базы данных EMBL
EMBLData
= getembl(AccessionNumber
)
EMBLData
= getembl(...,
'ToFile', ToFileValue
, ...)
EMBLSeq
= getembl(...,
'SequenceOnly', SequenceOnlyValue
, ...)
EMBLSeq
= getembl(...,
'TimeOut', TimeOutValue
, ...)
AccessionNumber | Уникальный идентификатор для записи последовательности. Введите уникальную комбинацию букв и цифр. |
ToFileValue | Вектор символов имя файла или путь и имя файла, к которым нужно сохранить данные. Если вы задаете только имя файла, файл хранится в текущей папке. |
SequenceOnlyValue | Управляет извлечением только последовательности без метаданных. Варианты true или false (по умолчанию). |
TimeOutValue | Тайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь. |
EMBLData | MATLAB® структура с полями, соответствующими данным EMBL. |
EMBLSeq | MATLAB вектор символов, представляющий последовательность. |
getembl
извлекает информацию из базы данных Европейской лаборатории молекулярной биологии (EMBL) для нуклеотидных последовательностей. Эта база данных ведется Европейским институтом биоинформатики (EBI). Для получения дополнительной информации о базе данных EMBL см.
ищет номер доступа в базе данных EMBL (EMBLData
= getembl(AccessionNumber
)https://www.ebi.ac.uk/
) и возвращается EMBLData
, структуру MATLAB с полями, соответствующими коду типа двухсимвольной линии EMBL. Каждый код типа линия хранится как отдельный элемент в структуре.
EMBLData
содержит следующие поля.
Область |
---|
Identification |
Accession |
SequenceVersion |
DateCreated |
DateUpdated |
Description |
Keyword |
OrganismSpecies |
OrganismClassification |
Organelle |
Reference |
DatabaseCrossReference |
Comments |
Assembly |
Feature |
BaseCount |
Sequence |
вызывает EMBLData
= getembl (..., 'PropertyName
', PropertyValue
, ...)getembl
с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
сохраняет информацию в файл в формате EMBL. EMBLData
= getembl(...,
'ToFile', ToFileValue
, ...)ToFileValue
- вектор символов, задающий имя файла или путь и имя файла, в который можно сохранить данные. Если вы задаете только имя файла, файл хранится в текущей папке.
Совет
Прочитайте файл в формате EMBL обратно в программное обеспечение MATLAB с помощью emblread
функция.
управляет извлечением только последовательности без метаданных. Варианты EMBLSeq
= getembl(...,
'SequenceOnly', SequenceOnlyValue
, ...)true
или false
(по умолчанию).
устанавливает тайм-аут подключения (в секундах) для извлечения данных из базы данных EMBL.EMBLSeq
= getembl(...,
'TimeOut', TimeOutValue
, ...)
Получите данные для аполипопротеина A-I печени крысы.
emblout = getembl('X00558')
Найдите данные для аполипопротеина A-I печени крысы и сохраните их в файл rat_protein
. Если вы задаете имя файла без пути, файл хранится в текущей папке.
emblout = getembl('X00558','ToFile','c:\project\rat_protein.txt')
Извлеките только последовательность для аполипопротеина A-I печени крыс.
Seq = getembl('X00558','SequenceOnly',true)
emblread
| getgenbank
| getgenpept
| getpdb
| seqviewer