gethmmprof

Получите профиль скрытой модели Маркова (HMM) из базы данных PFAM

Синтаксис

HMMStruct = gethmmprof(PFAMName)
HMMStruct = gethmmprof(PFAMNumber)
HMMStruct = gethmmprof(..., 'ToFile', ToFileValue, ...)
HMMStruct = gethmmprof(..., 'Mode', ModeValue, ...)

Входные параметры

PFAMNameВектор символов, задающий имя семейства белков (уникальный идентификатор) HMM, профилирует запись в базе данных PFAM. Например, '7tm_2'.
PFAMNumberЦелое число, задающее количество семейства белков HMM, профилирует запись в базе данных PFAM. Например, 2 является номером семейства белков для семейства белков 'PF00002'.
ToFileValue Вектор символов, задающий имя файла или путь и имя файла для того, чтобы сохранить данные. Если вы зададите только имя файла, тот файл будет сохранен в MATLAB® Current Folder.
ModeValue

Вектор символов, который задает возвращенный режим выравнивания. Выбор:

  • ls Значение по умолчанию. Глобальный режим выравнивания.

  • 'fs' — Локальный режим выравнивания.

Выходные аргументы

HMMStructСтруктура MATLAB, содержащая информацию для профиля HMM, получена из базы данных PFAM.

Описание

Примечание

gethmmprof получает информацию из профилей PFAM-HMM от версии HMMER2.0 формата файла до HMMER3/f.

HMMStruct = gethmmprof(PFAMName) ищет базу данных PFAM (http://pfam.xfam.org/) запись, представленную PFAMName (имя семейства белков), получает информацию о профиле HMM и хранит его в HMMStruct, структура MATLAB, содержащая следующие поля, соответствующие параметрам профиля HMM.

Поле Описание
NameИмя семейства белков (уникальный идентификатор) HMM профилирует запись в базе данных PFAM.
PfamAccessionNumberИнвентарный номер семейства белков HMM профилирует запись в базе данных PFAM.
ModelDescriptionОписание профиля HMM.
ModelLengthДлина профиля (количество состояний СООТВЕТСТВИЯ).
AlphabetАлфавит используется в модели, 'AA' или 'NT'.

Примечание

AlphaLength 20 для 'AA' и 4 для 'NT'.

MatchEmission

Вероятности эмиссии символа в состояниях СООТВЕТСТВИЯ.

Формат является матрицей размера ModelLength-by-AlphaLength, где каждая строка соответствует распределению эмиссии для определенного состояния СООТВЕТСТВИЯ.

InsertEmission

Вероятности эмиссии символа во ВСТАВКА состоянии.

Формат является матрицей размера ModelLength-by-AlphaLength, где каждая строка соответствует распределению эмиссии для определенного, ВСТАВЛЯЮТ состояние.

NullEmission

Вероятности эмиссии символа в СООТВЕТСТВИИ и ВСТАВЛЯЮТ состояния для модели NULL.

Формат является 1 AlphaLength вектором - строкой.

Примечание

Вероятности NULL также известны как фоновые вероятности.

BeginX

Вероятности изменения состояния BEGIN.

Формат является 1 (ModelLength + 1) вектором - строкой:

[B->D1 B->M1 B->M2 B->M3 .... B->Mend]
MatchX

СОВПАДАЙТЕ с вероятностями изменения состояния.

Формат является 4 (ModelLength - 1) матрицей:

[M1->M2 M2->M3 ... M[end-1]->Mend;
 M1->I1 M2->I2 ... M[end-1]->I[end-1];
 M1->D2 M2->D3 ... M[end-1]->Dend;
 M1->E  M2->E  ... M[end-1]->E  ]
InsertX

ВСТАВЬТЕ вероятности изменения состояния.

Формат является 2 (ModelLength - 1) матрицей:

[ I1->M2 I2->M3 ... I[end-1]->Mend;
  I1->I1 I2->I2 ... I[end-1]->I[end-1] ]
DeleteX

Вероятности изменения состояния DELETE.

Формат является 2 (ModelLength - 1) матрицей:

[ D1->M2 D2->M3 ... D[end-1]->Mend ;
  D1->D2 D2->D3 ... D[end-1]->Dend ]
FlankingInsertX

Фланговые состояния вставки (N и C) используемый для ЛОКАЛЬНОГО выравнивания профиля.

Формат является матрицей 2 на 2:

[N->B  C->T ;
 N->N  C->C]
LoopX

Цикл утверждает вероятности перехода, используемые для нескольких выравнивания хитов.

Формат является матрицей 2 на 2:

[E->C  J->B ;
 E->J  J->J]
NullX

Пустые вероятности перехода раньше предоставляли очкам значения логарифмических разногласий также для изменений состояния.

Формат 2 1 вектор-столбец:

[G->F ; G->G]

HMMStruct = gethmmprof(PFAMNumber) определяет инвентарный номер семейства белков от PFAMNumber (целое число), ищет базу данных PFAM связанную запись, получает информацию о профиле HMM и хранит его в HMMStruct, структуре MATLAB.

HMMStruct = gethmmprof(..., 'PropertyName', PropertyValue, ...) вызывает gethmmprof с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

HMMStruct = gethmmprof(..., 'ToFile', ToFileValue, ...) сохраняет данные, возвращенные в базу данных PFAM в файле, заданном ToFileValue.

Примечание

Можно считать отформатированный HMM файл назад в программное обеспечение MATLAB с помощью функции pfamhmmread.

HMMStruct = gethmmprof(..., 'Mode', ModeValue, ...) задает возвращенный режим выравнивания. Выбор:

  • 'ls' (значение по умолчанию) — Глобальный режим выравнивания.

  • 'fs' — Локальный режим выравнивания.

Для получения дополнительной информации о моделях профиля HMM см. Модель Профиля HMM.

Примеры

Получать профиль скрытой модели Маркова (HMM) для глобального выравнивания 7-трансмембранного белка приемника в семействе секретинов, введите:

hmm = gethmmprof('7tm_2')

hmm = 

  struct with fields:

                   Name: '7tm_2'
    PfamAccessionNumber: 'PF00002.21'
       ModelDescription: '7 transmembrane receptor (Secretin family)'
            ModelLength: 241
               Alphabet: 'AA'
          MatchEmission: [241×20 double]
         InsertEmission: [241×20 double]
           NullEmission: [1×20 double]
                 BeginX: [242×1 double]
                 MatchX: [240×4 double]
                InsertX: [240×2 double]
                DeleteX: [240×2 double]
        FlankingInsertX: [2×2 double]
                  LoopX: [2×2 double]
                  NullX: [2×1 double]

Представлено до R2006a