gethmmprof

Извлечение скрытого профиля модели Маркова (HMM) из базы данных PFAM

Синтаксис

HMMStruct = gethmmprof(PFAMName)
HMMStruct = gethmmprof(PFAMNumber)
HMMStruct = gethmmprof(..., 'ToFile', ToFileValue, ...)
HMMStruct = gethmmprof(..., 'Mode', ModeValue, ...)
HMMStruct = gethmmprof(..., 'TimeOut', TimeOutValue, ...)

Входные параметры

PFAMNameВектор символов, задающий имя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM. Для примера, '7tm_2'.
PFAMNumberЦелое число, указывающее номер семейства белков записи профиля HMM в базе данных PFAM. Для примера, 2 - номер семейства белков для семейства белков 'PF00002'.
ToFileValue Вектор символов имя файла или путь и имя файла для сохранения данных. Если вы задаете только имя файла, этот файл будет сохранен в MATLAB® Текущая папка.
ModeValue

Вектор символов, который задает возвращенный режим выравнивания. Варианты:

  • 'ls' - По умолчанию. Глобальный режим выравнивания.

  • 'fs' - Режим локальной выравнивания.

TimeOutValueТайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь.

Выходные аргументы

HMMStructСтруктура MATLAB, содержащая информацию для профиля HMM, полученную из базы данных PFAM.

Описание

Примечание

gethmmprof извлекает информацию из профилей PFAM-HMM, из версии формата файла HMMER2.0 в HMMER3/f.

HMMStruct = gethmmprof(PFAMName) выполняет поиск в базе данных PFAM (http://pfam.xfam.org/) записи, представленной PFAMName (имя семейства белков), извлекает информацию профиля HMM и хранит ее в HMMStruct, структуру MATLAB, содержащую следующие поля, соответствующие параметрам профиля HMM.

ОбластьОписание
NameИмя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM.
PfamAccessionNumberНомер присоединения семейства белков к записи профиля HMM в базе данных PFAM.
ModelDescriptionОписание профиля HMM.
ModelLengthДлина профиля (количество состояний MATCH).
AlphabetАлфавит, используемый в модели, 'AA' или 'NT'.

Примечание

AlphaLength 20 для 'AA' и 4 для 'NT'.

MatchEmission

Вероятности излучения символов в состояниях MATCH.

Формат является матрицей размера ModelLength-by- AlphaLength, где каждая строка соответствует распределению выбросов для определенного состояния MATCH.

InsertEmission

Вероятности излучения символов в состоянии INSERT.

Формат является матрицей размера ModelLength-by- AlphaLength, где каждая строка соответствует распределению выбросов для определенного состояния INSERT.

NullEmission

Вероятности излучения символов в состояниях MATCH и INSERT для модели NULL.

Формат: 1-by- AlphaLength Вектор-строка.

Примечание

Вероятности NULL также известны как фоновые вероятности.

BeginX

Вероятности перехода BEGIN.

Формат: 1-by- (ModelLength + 1) Вектор-строка:

[B->D1 B->M1 B->M2 B->M3 .... B->Mend]
MatchX

Вероятности перехода состояния MATCH.

Формат: 4-бай- (ModelLength - 1) матрица:

[M1->M2 M2->M3 ... M[end-1]->Mend;
 M1->I1 M2->I2 ... M[end-1]->I[end-1];
 M1->D2 M2->D3 ... M[end-1]->Dend;
 M1->E  M2->E  ... M[end-1]->E  ]
InsertX

INSERT состояния вероятности перехода.

Формат: 2-бай- (ModelLength - 1) матрица:

[ I1->M2 I2->M3 ... I[end-1]->Mend;
  I1->I1 I2->I2 ... I[end-1]->I[end-1] ]
DeleteX

Вероятность перехода DELETE.

Формат: 2-бай- (ModelLength - 1) матрица:

[ D1->M2 D2->M3 ... D[end-1]->Mend ;
  D1->D2 D2->D3 ... D[end-1]->Dend ]
FlankingInsertX

Состояния фланцевой вставки (N и C), используемые для выравнивания профиля LOCAL.

Формат является матрицей 2 на 2:

[N->B  C->T ;
 N->N  C->C]
LoopX

Переходные вероятности состояний цикла, используемые для выравнивания нескольких ударов.

Формат является матрицей 2 на 2:

[E->C  J->B ;
 E->J  J->J]
NullX

Пустые вероятности перехода, используемые для обеспечения счетов со значениями логарифмических шансов, также для переходов состояния.

Формат представляет собой вектор-столбец 2 на 1:

[G->F ; G->G]

HMMStruct = gethmmprof(PFAMNumber) определяет число присоединения семейства белков из PFAMNumber (целое число), ищет в базе данных PFAM связанную запись, извлекает информацию профиля HMM и сохраняет ее в HMMStruct, структуру MATLAB.

HMMStruct = gethmmprof (..., 'PropertyName', PropertyValue, ...) вызывает gethmmprof с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

HMMStruct = gethmmprof(..., 'ToFile', ToFileValue, ...) сохраняет данные, возвращенные из базы данных PFAM, в файле, заданном ToFileValue.

Примечание

Вы можете считать HMM-форматированный файл обратно в программное обеспечение MATLAB, используя pfamhmmread функция.

HMMStruct = gethmmprof(..., 'Mode', ModeValue, ...) задает возвращенный режим выравнивания. Варианты:

  • 'ls' (по умолчанию) - Глобальный режим выравнивания.

  • 'fs' - Режим локальной выравнивания.

Для получения дополнительной информации о моделях профиля HMM, см. Модель профиля HMM.

HMMStruct = gethmmprof(..., 'TimeOut', TimeOutValue, ...) устанавливает тайм-аут подключения (в секундах), чтобы получить данные в базе данных PFAM.

Примеры

Чтобы извлечь скрытый профиль модели Маркова (HMM) для глобального выравнивания белка 7-трансмембранного рецептора в семействе секретинов, введите:

hmm = gethmmprof('7tm_2')

hmm = 

  struct with fields:

                   Name: '7tm_2'
    PfamAccessionNumber: 'PF00002.21'
       ModelDescription: '7 transmembrane receptor (Secretin family)'
            ModelLength: 241
               Alphabet: 'AA'
          MatchEmission: [241×20 double]
         InsertEmission: [241×20 double]
           NullEmission: [1×20 double]
                 BeginX: [242×1 double]
                 MatchX: [240×4 double]
                InsertX: [240×2 double]
                DeleteX: [240×2 double]
        FlankingInsertX: [2×2 double]
                  LoopX: [2×2 double]
                  NullX: [2×1 double]
Представлено до R2006a