Извлечение скрытого профиля модели Маркова (HMM) из базы данных PFAM
HMMStruct
= gethmmprof(PFAMName
)
HMMStruct
= gethmmprof(PFAMNumber
)
HMMStruct
= gethmmprof(...,
'ToFile', ToFileValue
, ...)
HMMStruct
= gethmmprof(...,
'Mode', ModeValue
, ...)
HMMStruct
= gethmmprof(...,
'TimeOut', TimeOutValue
, ...)
PFAMName | Вектор символов, задающий имя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM. Для примера, '7tm_2' . |
PFAMNumber | Целое число, указывающее номер семейства белков записи профиля HMM в базе данных PFAM. Для примера, 2 - номер семейства белков для семейства белков 'PF00002' . |
ToFileValue | Вектор символов имя файла или путь и имя файла для сохранения данных. Если вы задаете только имя файла, этот файл будет сохранен в MATLAB® Текущая папка. |
ModeValue | Вектор символов, который задает возвращенный режим выравнивания. Варианты:
|
TimeOutValue | Тайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь. |
HMMStruct | Структура MATLAB, содержащая информацию для профиля HMM, полученную из базы данных PFAM. |
Примечание
gethmmprof
извлекает информацию из профилей PFAM-HMM, из версии формата файла HMMER2.0 в HMMER3/f.
выполняет поиск в базе данных PFAM (http://pfam.xfam.org/) записи, представленной HMMStruct
= gethmmprof(PFAMName
)PFAMName
(имя семейства белков), извлекает информацию профиля HMM и хранит ее в HMMStruct
, структуру MATLAB, содержащую следующие поля, соответствующие параметрам профиля HMM.
Область | Описание |
---|---|
Name | Имя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM. |
PfamAccessionNumber | Номер присоединения семейства белков к записи профиля HMM в базе данных PFAM. |
ModelDescription | Описание профиля HMM. |
ModelLength | Длина профиля (количество состояний MATCH). |
Alphabet | Алфавит, используемый в модели, 'AA' или 'NT' . Примечание
|
MatchEmission | Вероятности излучения символов в состояниях MATCH. Формат является матрицей размера |
InsertEmission | Вероятности излучения символов в состоянии INSERT. Формат является матрицей размера |
NullEmission | Вероятности излучения символов в состояниях MATCH и INSERT для модели NULL. Формат: 1-by- Примечание Вероятности NULL также известны как фоновые вероятности. |
BeginX | Вероятности перехода BEGIN. Формат: 1-by- [B->D1 B->M1 B->M2 B->M3 .... B->Mend] |
MatchX | Вероятности перехода состояния MATCH. Формат: 4-бай- [M1->M2 M2->M3 ... M[end-1]->Mend; M1->I1 M2->I2 ... M[end-1]->I[end-1]; M1->D2 M2->D3 ... M[end-1]->Dend; M1->E M2->E ... M[end-1]->E ] |
InsertX | INSERT состояния вероятности перехода. Формат: 2-бай- [ I1->M2 I2->M3 ... I[end-1]->Mend; I1->I1 I2->I2 ... I[end-1]->I[end-1] ] |
DeleteX | Вероятность перехода DELETE. Формат: 2-бай- [ D1->M2 D2->M3 ... D[end-1]->Mend ; D1->D2 D2->D3 ... D[end-1]->Dend ] |
FlankingInsertX | Состояния фланцевой вставки (N и C), используемые для выравнивания профиля LOCAL. Формат является матрицей 2 на 2: [N->B C->T ; N->N C->C] |
LoopX | Переходные вероятности состояний цикла, используемые для выравнивания нескольких ударов. Формат является матрицей 2 на 2: [E->C J->B ; E->J J->J] |
NullX | Пустые вероятности перехода, используемые для обеспечения счетов со значениями логарифмических шансов, также для переходов состояния. Формат представляет собой вектор-столбец 2 на 1: [G->F ; G->G] |
определяет число присоединения семейства белков из HMMStruct
= gethmmprof(PFAMNumber
)PFAMNumber
(целое число), ищет в базе данных PFAM связанную запись, извлекает информацию профиля HMM и сохраняет ее в HMMStruct
, структуру MATLAB.
вызывает HMMStruct
= gethmmprof (..., 'PropertyName
', PropertyValue
, ...)gethmmprof
с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
сохраняет данные, возвращенные из базы данных PFAM, в файле, заданном HMMStruct
= gethmmprof(...,
'ToFile', ToFileValue
, ...)ToFileValue
.
Примечание
Вы можете считать HMM-форматированный файл обратно в программное обеспечение MATLAB, используя pfamhmmread
функция.
задает возвращенный режим выравнивания. Варианты:HMMStruct
= gethmmprof(...,
'Mode', ModeValue
, ...)
'ls'
(по умолчанию) - Глобальный режим выравнивания.
'fs'
- Режим локальной выравнивания.
Для получения дополнительной информации о моделях профиля HMM, см. Модель профиля HMM.
устанавливает тайм-аут подключения (в секундах), чтобы получить данные в базе данных PFAM.HMMStruct
= gethmmprof(...,
'TimeOut', TimeOutValue
, ...)
Чтобы извлечь скрытый профиль модели Маркова (HMM) для глобального выравнивания белка 7-трансмембранного рецептора в семействе секретинов, введите:
hmm = gethmmprof('7tm_2') hmm = struct with fields: Name: '7tm_2' PfamAccessionNumber: 'PF00002.21' ModelDescription: '7 transmembrane receptor (Secretin family)' ModelLength: 241 Alphabet: 'AA' MatchEmission: [241×20 double] InsertEmission: [241×20 double] NullEmission: [1×20 double] BeginX: [242×1 double] MatchX: [240×4 double] InsertX: [240×2 double] DeleteX: [240×2 double] FlankingInsertX: [2×2 double] LoopX: [2×2 double] NullX: [2×1 double]
gethmmalignment
| hmmprofalign
| hmmprofstruct
| pfamhmmread
| showhmmprof