exponenta event banner

gethmmprof

Получение скрытого профиля модели Маркова (HMM) из базы данных PFAM

Синтаксис

HMMStruct = gethmmprof(PFAMName)
HMMStruct = gethmmprof(PFAMNumber)
HMMStruct = gethmmprof(..., 'ToFile', ToFileValue, ...)
HMMStruct = gethmmprof(..., 'Mode', ModeValue, ...)
HMMStruct = gethmmprof(..., 'TimeOut', TimeOutValue, ...)

Входные аргументы

PFAMNameВектор символов, указывающий имя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM. Например, '7tm_2'.
PFAMNumberЦелое число, указывающее номер семейства белков записи профиля HMM в базе данных PFAM. Например, 2 - номер семейства белков для семейства белков 'PF00002'.
ToFileValue Вектор символов, указывающий имя файла или путь и имя файла для сохранения данных. Если указано только имя файла, он будет сохранен в текущей папке MATLAB ®.
ModeValue

Символьный вектор, определяющий возвращаемый режим выравнивания. Возможны следующие варианты:

  • 'ls' - По умолчанию. Режим глобальной выставки.

  • 'fs' - Режим локальной выставки.

TimeOutValueВремя ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь.

Выходные аргументы

HMMStructСтруктура MATLAB содержит информацию для профиля HMM, извлеченного из базы данных PFAM.

Описание

Примечание

gethmmprof извлекает информацию из профилей PFAM-HMM из версии формата файла HMMER2.0 в HMMER3/f.

HMMStruct = gethmmprof(PFAMName) выполняет поиск в базе данных PFAM (http://pfam.xfam.org/) записи, представленной PFAMName (имя семейства белков), извлекает информацию профиля HMM и сохраняет ее в HMMStructструктура MATLAB, содержащая следующие поля, соответствующие параметрам профиля HMM.

ОбластьОписание
NameИмя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM.
PfamAccessionNumberНомер присоединения семейства белков к записи профиля HMM в базе данных PFAM.
ModelDescriptionОписание профиля HMM.
ModelLengthДлина профиля (количество состояний MATCH).
AlphabetАлфавит, используемый в модели, 'AA' или 'NT'.

Примечание

AlphaLength составляет 20 для 'AA' и 4 для 'NT'.

MatchEmission

Вероятности испускания символов в состояниях MATCH.

Формат является матрицей размера ModelLengthоколо-AlphaLength, где каждая строка соответствует распределению выбросов для конкретного состояния MATCH.

InsertEmission

Вероятности испускания символов в состоянии INSERT.

Формат является матрицей размера ModelLengthоколо-AlphaLength, где каждая строка соответствует распределению выбросов для конкретного состояния INSERT.

NullEmission

Вероятности испускания символов в состояниях MATCH и INSERT для модели NULL.

Формат - 1-by-AlphaLength вектор строки.

Примечание

Вероятности NULL также известны как фоновые вероятности.

BeginX

Вероятности перехода состояния BEGIN.

Формат - это 1-по-(ModelLength + 1) вектор строки:

[B->D1 B->M1 B->M2 B->M3 .... B->Mend]
MatchX

Вероятности перехода состояния MATCH.

Формат - это 4-по-(ModelLength - 1) матрица:

[M1->M2 M2->M3 ... M[end-1]->Mend;
 M1->I1 M2->I2 ... M[end-1]->I[end-1];
 M1->D2 M2->D3 ... M[end-1]->Dend;
 M1->E  M2->E  ... M[end-1]->E  ]
InsertX

Вероятность перехода состояния INSERT.

Формат - 2-по-(ModelLength - 1) матрица:

[ I1->M2 I2->M3 ... I[end-1]->Mend;
  I1->I1 I2->I2 ... I[end-1]->I[end-1] ]
DeleteX

Вероятность перехода состояния DELETE.

Формат - 2-по-(ModelLength - 1) матрица:

[ D1->M2 D2->M3 ... D[end-1]->Mend ;
  D1->D2 D2->D3 ... D[end-1]->Dend ]
FlankingInsertX

Фланцевые вставки (N и C), используемые для выравнивания профиля LOCAL.

Формат - это матрица 2 на 2:

[N->B  C->T ;
 N->N  C->C]
LoopX

Вероятности перехода состояний цикла, используемые для выравнивания множественных попаданий.

Формат - это матрица 2 на 2:

[E->C  J->B ;
 E->J  J->J]
NullX

Нулевые вероятности перехода, используемые для обеспечения оценок со значениями логарифмических шансов, также для переходов состояний.

Формат - это вектор столбца 2 на 1:

[G->F ; G->G]

HMMStruct = gethmmprof(PFAMNumber) определяет номер присоединения семейства белков из PFAMNumber (целое число), выполняет поиск связанной записи в базе данных PFAM, извлекает информацию профиля HMM и сохраняет ее в HMMStruct, структура MATLAB.

HMMStruct = gethmmprof(..., 'PropertyName', PropertyValue, ...) требования gethmmprof с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

HMMStruct = gethmmprof(..., 'ToFile', ToFileValue, ...) сохраняет данные, возвращенные из базы данных PFAM, в файле, указанном ToFileValue.

Примечание

Файл в формате HMM можно прочитать обратно в программное обеспечение MATLAB с помощью pfamhmmread функция.

HMMStruct = gethmmprof(..., 'Mode', ModeValue, ...) определяет возвращаемый режим выравнивания. Возможны следующие варианты:

  • 'ls' (по умолчанию) - глобальный режим выравнивания.

  • 'fs' - Режим локальной выставки.

Дополнительные сведения о моделях профилей HMM см. в разделе Модель профиля HMM.

HMMStruct = gethmmprof(..., 'TimeOut', TimeOutValue, ...) устанавливает время ожидания соединения (в секундах) для получения данных из базы данных PFAM.

Примеры

Чтобы извлечь скрытый профиль модели Маркова (HMM) для глобального выравнивания белка 7-трансмембранного рецептора в семействе секретинов, введите:

hmm = gethmmprof('7tm_2')

hmm = 

  struct with fields:

                   Name: '7tm_2'
    PfamAccessionNumber: 'PF00002.21'
       ModelDescription: '7 transmembrane receptor (Secretin family)'
            ModelLength: 241
               Alphabet: 'AA'
          MatchEmission: [241×20 double]
         InsertEmission: [241×20 double]
           NullEmission: [1×20 double]
                 BeginX: [242×1 double]
                 MatchX: [240×4 double]
                InsertX: [240×2 double]
                DeleteX: [240×2 double]
        FlankingInsertX: [2×2 double]
                  LoopX: [2×2 double]
                  NullX: [2×1 double]
Представлен до R2006a