gethmmprof

Получите профиль скрытой модели Маркова (HMM) из базы данных PFAM

Синтаксис

HMMStruct = gethmmprof(PFAMName)
HMMStruct = gethmmprof(PFAMNumber)
HMMStruct = gethmmprof(..., 'ToFile', ToFileValue, ...)
HMMStruct = gethmmprof(..., 'Mode', ModeValue, ...)
HMMStruct = gethmmprof(..., 'TimeOut', TimeOutValue, ...)

Входные параметры

PFAMNameВектор символов, задающий имя семейства белков (уникальный идентификатор) HMM, профилирует запись в базе данных PFAM. Например, '7tm_2'.
PFAMNumberЦелое число, задающее количество семейства белков HMM, профилирует запись в базе данных PFAM. Например, 2 номер семейства белков для семейства белков 'PF00002'.
ToFileValue Вектор символов, задающий имя файла или путь и имя файла для того, чтобы сохранить данные. Если вы зададите только имя файла, тот файл будет сохранен в MATLAB® Текущая папка.
ModeValue

Вектор символов, который задает возвращенный режим выравнивания. Выбор:

  • 'ls' — Значение по умолчанию. Глобальный режим выравнивания.

  • 'fs' — Локальный режим выравнивания.

TimeOutValueТайм-аут связи в секундах в виде положительной скалярной величины. Значение по умолчанию равняется 5. Для получения дополнительной информации смотрите здесь.

Выходные аргументы

HMMStructСтруктура MATLAB, содержащая информацию для профиля HMM, получена из базы данных PFAM.

Описание

Примечание

gethmmprof получает информацию из профилей PFAM-HMM, от версии HMMER2.0 формата файла до HMMER3/f.

HMMStruct = gethmmprof(PFAMName) ищет базу данных PFAM (http://pfam.xfam.org/) запись, представленную PFAMName (имя семейства белков), получает информацию о профиле HMM и хранит его в HMMStruct, структура MATLAB, содержащая следующие поля, соответствующие параметрам профиля HMM.

Поле Описание
NameИмя семейства белков (уникальный идентификатор) HMM профилирует запись в базе данных PFAM.
PfamAccessionNumberИнвентарный номер семейства белков HMM профилирует запись в базе данных PFAM.
ModelDescriptionОписание профиля HMM.
ModelLengthДлина профиля (количество состояний СООТВЕТСТВИЯ).
AlphabetАлфавит используется в модели, 'AA' ornt .

Примечание

AlphaLength 20 для 'AA' и 4 для 'NT'.

MatchEmission

Вероятности эмиссии символа в состояниях СООТВЕТСТВИЯ.

Формат является матрицей размера ModelLength- AlphaLength, где каждая строка соответствует распределению эмиссии для определенного состояния СООТВЕТСТВИЯ.

InsertEmission

Вероятности эмиссии символа во ВСТАВКА состоянии.

Формат является матрицей размера ModelLength- AlphaLength, где каждая строка соответствует распределению эмиссии для определенного, ВСТАВЛЯЮТ состояние.

NullEmission

Вероятности эмиссии символа в СООТВЕТСТВИИ и ВСТАВЛЯЮТ состояния для модели NULL.

Формат является 1 AlphaLength вектор-строка.

Примечание

Вероятности NULL также известны как фоновые вероятности.

BeginX

Вероятности изменения состояния BEGIN.

Формат является 1 (ModelLength + 1) вектор-строка:

[B->D1 B->M1 B->M2 B->M3 .... B->Mend]
MatchX

СОВПАДАЙТЕ с вероятностями изменения состояния.

Формат является 4 (ModelLength - 1) матрица:

[M1->M2 M2->M3 ... M[end-1]->Mend;
 M1->I1 M2->I2 ... M[end-1]->I[end-1];
 M1->D2 M2->D3 ... M[end-1]->Dend;
 M1->E  M2->E  ... M[end-1]->E  ]
InsertX

ВСТАВЬТЕ вероятности изменения состояния.

Формат является 2 (ModelLength - 1) матрица:

[ I1->M2 I2->M3 ... I[end-1]->Mend;
  I1->I1 I2->I2 ... I[end-1]->I[end-1] ]
DeleteX

Вероятности изменения состояния DELETE.

Формат является 2 (ModelLength - 1) матрица:

[ D1->M2 D2->M3 ... D[end-1]->Mend ;
  D1->D2 D2->D3 ... D[end-1]->Dend ]
FlankingInsertX

Фланговые состояния вставки (N и C) используемый для ЛОКАЛЬНОГО выравнивания профиля.

Формат является матрицей 2 на 2:

[N->B  C->T ;
 N->N  C->C]
LoopX

Цикл утверждает вероятности перехода, используемые для нескольких выравнивания хитов.

Формат является матрицей 2 на 2:

[E->C  J->B ;
 E->J  J->J]
NullX

Пустые вероятности перехода раньше предоставляли баллам значения логарифмических разногласий также для изменений состояния.

Формат является вектором столбцов 2 на 1:

[G->F ; G->G]

HMMStruct = gethmmprof(PFAMNumber) определяет инвентарный номер семейства белков из PFAMNumber (целое число), ищет базу данных PFAM связанную запись, получает информацию о профиле HMM и хранит его в HMMStruct, структура MATLAB.

HMMStruct = gethmmprof (..., 'PropertyName', PropertyValue, ...) вызовы gethmmprof с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

HMMStruct = gethmmprof(..., 'ToFile', ToFileValue, ...) сохраняет данные, возвращенные в базу данных PFAM в файле, заданном ToFileValue.

Примечание

Можно считать отформатированный HMM файл назад в программное обеспечение MATLAB с помощью pfamhmmread функция.

HMMStruct = gethmmprof(..., 'Mode', ModeValue, ...) задает возвращенный режим выравнивания. Выбор:

  • 'ls' (значение по умолчанию) — Глобальный режим выравнивания.

  • 'fs' — Локальный режим выравнивания.

Для получения дополнительной информации о моделях профиля HMM см. Модель Профиля HMM.

HMMStruct = gethmmprof(..., 'TimeOut', TimeOutValue, ...) устанавливает тайм-аут связи (в секундах) получать данные база данных PFAM.

Примеры

Получать профиль скрытой модели Маркова (HMM) для глобального выравнивания 7-трансмембранного белка приемника в семействе секретинов, введите:

hmm = gethmmprof('7tm_2')

hmm = 

  struct with fields:

                   Name: '7tm_2'
    PfamAccessionNumber: 'PF00002.21'
       ModelDescription: '7 transmembrane receptor (Secretin family)'
            ModelLength: 241
               Alphabet: 'AA'
          MatchEmission: [241×20 double]
         InsertEmission: [241×20 double]
           NullEmission: [1×20 double]
                 BeginX: [242×1 double]
                 MatchX: [240×4 double]
                InsertX: [240×2 double]
                DeleteX: [240×2 double]
        FlankingInsertX: [2×2 double]
                  LoopX: [2×2 double]
                  NullX: [2×1 double]
Представлено до R2006a