Получение скрытого профиля модели Маркова (HMM) из базы данных PFAM
HMMStruct = gethmmprof(PFAMName)
HMMStruct = gethmmprof(PFAMNumber)
HMMStruct = gethmmprof(..., 'ToFile', ToFileValue, ...)
HMMStruct = gethmmprof(..., 'Mode', ModeValue, ...)
HMMStruct = gethmmprof(..., 'TimeOut', TimeOutValue, ...)
PFAMName | Вектор символов, указывающий имя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM. Например, '7tm_2'. |
PFAMNumber | Целое число, указывающее номер семейства белков записи профиля HMM в базе данных PFAM. Например, 2 - номер семейства белков для семейства белков 'PF00002'. |
ToFileValue | Вектор символов, указывающий имя файла или путь и имя файла для сохранения данных. Если указано только имя файла, он будет сохранен в текущей папке MATLAB ®. |
ModeValue | Символьный вектор, определяющий возвращаемый режим выравнивания. Возможны следующие варианты:
|
TimeOutValue | Время ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь. |
HMMStruct | Структура MATLAB содержит информацию для профиля HMM, извлеченного из базы данных PFAM. |
Примечание
gethmmprof извлекает информацию из профилей PFAM-HMM из версии формата файла HMMER2.0 в HMMER3/f.
выполняет поиск в базе данных PFAM (http://pfam.xfam.org/) записи, представленной HMMStruct = gethmmprof(PFAMName)PFAMName (имя семейства белков), извлекает информацию профиля HMM и сохраняет ее в HMMStructструктура MATLAB, содержащая следующие поля, соответствующие параметрам профиля HMM.
| Область | Описание |
|---|---|
Name | Имя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM. |
PfamAccessionNumber | Номер присоединения семейства белков к записи профиля HMM в базе данных PFAM. |
ModelDescription | Описание профиля HMM. |
ModelLength | Длина профиля (количество состояний MATCH). |
Alphabet | Алфавит, используемый в модели, 'AA' или 'NT'. Примечание
|
MatchEmission | Вероятности испускания символов в состояниях MATCH. Формат является матрицей размера |
InsertEmission | Вероятности испускания символов в состоянии INSERT. Формат является матрицей размера |
NullEmission | Вероятности испускания символов в состояниях MATCH и INSERT для модели NULL. Формат - 1-by- Примечание Вероятности NULL также известны как фоновые вероятности. |
BeginX | Вероятности перехода состояния BEGIN. Формат - это 1-по- [B->D1 B->M1 B->M2 B->M3 .... B->Mend] |
MatchX | Вероятности перехода состояния MATCH. Формат - это 4-по- [M1->M2 M2->M3 ... M[end-1]->Mend; M1->I1 M2->I2 ... M[end-1]->I[end-1]; M1->D2 M2->D3 ... M[end-1]->Dend; M1->E M2->E ... M[end-1]->E ] |
InsertX | Вероятность перехода состояния INSERT. Формат - 2-по- [ I1->M2 I2->M3 ... I[end-1]->Mend; I1->I1 I2->I2 ... I[end-1]->I[end-1] ] |
DeleteX | Вероятность перехода состояния DELETE. Формат - 2-по- [ D1->M2 D2->M3 ... D[end-1]->Mend ; D1->D2 D2->D3 ... D[end-1]->Dend ] |
FlankingInsertX | Фланцевые вставки (N и C), используемые для выравнивания профиля LOCAL. Формат - это матрица 2 на 2: [N->B C->T ; N->N C->C] |
LoopX | Вероятности перехода состояний цикла, используемые для выравнивания множественных попаданий. Формат - это матрица 2 на 2: [E->C J->B ; E->J J->J] |
NullX | Нулевые вероятности перехода, используемые для обеспечения оценок со значениями логарифмических шансов, также для переходов состояний. Формат - это вектор столбца 2 на 1: [G->F ; G->G] |
определяет номер присоединения семейства белков из HMMStruct = gethmmprof(PFAMNumber)PFAMNumber (целое число), выполняет поиск связанной записи в базе данных PFAM, извлекает информацию профиля HMM и сохраняет ее в HMMStruct, структура MATLAB.
требования HMMStruct = gethmmprof(..., 'PropertyName', PropertyValue, ...)gethmmprof с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:
сохраняет данные, возвращенные из базы данных PFAM, в файле, указанном HMMStruct = gethmmprof(..., 'ToFile', ToFileValue, ...)ToFileValue.
Примечание
Файл в формате HMM можно прочитать обратно в программное обеспечение MATLAB с помощью pfamhmmread функция.
определяет возвращаемый режим выравнивания. Возможны следующие варианты:HMMStruct = gethmmprof(..., 'Mode', ModeValue, ...)
'ls' (по умолчанию) - глобальный режим выравнивания.
'fs' - Режим локальной выставки.
Дополнительные сведения о моделях профилей HMM см. в разделе Модель профиля HMM.
устанавливает время ожидания соединения (в секундах) для получения данных из базы данных PFAM.HMMStruct = gethmmprof(..., 'TimeOut', TimeOutValue, ...)
Чтобы извлечь скрытый профиль модели Маркова (HMM) для глобального выравнивания белка 7-трансмембранного рецептора в семействе секретинов, введите:
hmm = gethmmprof('7tm_2')
hmm =
struct with fields:
Name: '7tm_2'
PfamAccessionNumber: 'PF00002.21'
ModelDescription: '7 transmembrane receptor (Secretin family)'
ModelLength: 241
Alphabet: 'AA'
MatchEmission: [241×20 double]
InsertEmission: [241×20 double]
NullEmission: [1×20 double]
BeginX: [242×1 double]
MatchX: [240×4 double]
InsertX: [240×2 double]
DeleteX: [240×2 double]
FlankingInsertX: [2×2 double]
LoopX: [2×2 double]
NullX: [2×1 double]gethmmalignment | hmmprofalign | hmmprofstruct | pfamhmmread | showhmmprof