exponenta event banner

pfamhmmread

Считывание данных из файла в формате PFAM HMM

Синтаксис

HMMStruct = pfamhmmread(File)
HMMStruct = pfamhmmread(File,'TimeOut',TimeOutValue)

Входные аргументы

File

Символьный вектор или строка, указывающая имя файла, путь и имя файла, URL-адрес, указывающий на файл, или текст файла в формате PFAM-HMM. Файл, на который имеется ссылка, является файлом в формате ЧММ PFAM. Если указано только имя файла, он должен находиться в пути поиска MATLAB ® или в текущей папке.

Совет

Вы можете использовать gethmmprof функции с помощью 'ToFile' свойство для получения информации о профиле HMM из базы данных PFAM и создания файла в формате PFAM HMM.

TimeOutValueВремя ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь.

Выходные аргументы

HMMStructСтруктура MATLAB, содержащая информацию из файла в формате PFAM HMM.

Описание

Примечание

pfamhmmread считывает форматированные файлы PFAM-HMM из версии формата файла HMMER2.0 в HMMER3/f.

HMMStruct = pfamhmmread(File) читает File, файл в формате HMM PFAM и преобразует его в HMMStruct, структура MATLAB, содержащая следующие поля, соответствующие параметрам профиля HMM:

ОбластьОписание
NameИмя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM.
PfamAccessionNumberНомер присоединения семейства белков к записи профиля HMM в базе данных PFAM.
ModelDescriptionОписание профиля HMM.
ModelLengthДлина профиля (количество состояний MATCH).
AlphabetАлфавит, используемый в модели, 'AA' или 'NT'.

Примечание

AlphaLength составляет 20 для 'AA' и 4 для 'NT'.

MatchEmission

Вероятности испускания символов в состояниях MATCH.

Формат является матрицей размера ModelLengthоколо-AlphaLength, где каждая строка соответствует распределению выбросов для конкретного состояния MATCH.

InsertEmission

Вероятности испускания символов в состоянии INSERT.

Формат является матрицей размера ModelLengthоколо-AlphaLength, где каждая строка соответствует распределению выбросов для конкретного состояния INSERT.

NullEmission

Вероятности испускания символов в состояниях MATCH и INSERT для модели NULL.

Формат - 1-by-AlphaLength вектор строки.

Примечание

Вероятности NULL также известны как фоновые вероятности.

BeginX

Вероятности перехода состояния BEGIN.

Формат - это 1-по-(ModelLength + 1) вектор строки:

[B->D1 B->M1 B->M2 B->M3 .... B->Mend]
MatchX

Вероятности перехода состояния MATCH.

Формат - это 4-по-(ModelLength - 1) матрица:

[M1->M2 M2->M3 ... M[end-1]->Mend;
 M1->I1 M2->I2 ... M[end-1]->I[end-1];
 M1->D2 M2->D3 ... M[end-1]->Dend;
 M1->E  M2->E  ... M[end-1]->E  ]
InsertX

Вероятность перехода состояния INSERT.

Формат - 2-по-(ModelLength - 1) матрица:

[ I1->M2 I2->M3 ... I[end-1]->Mend;
  I1->I1 I2->I2 ... I[end-1]->I[end-1] ]
DeleteX

Вероятность перехода состояния DELETE.

Формат - 2-по-(ModelLength - 1) матрица:

[ D1->M2 D2->M3 ... D[end-1]->Mend ;
  D1->D2 D2->D3 ... D[end-1]->Dend ]
FlankingInsertX

Фланцевые вставки (N и C), используемые для выравнивания профиля LOCAL.

Формат - это матрица 2 на 2:

[N->B  C->T ;
 N->N  C->C]
LoopX

Вероятности перехода состояний цикла, используемые для выравнивания множественных попаданий.

Формат - это матрица 2 на 2:

[E->C  J->B ;
 E->J  J->J]
NullX

Нулевые вероятности перехода, используемые для обеспечения оценок со значениями логарифмических шансов, также для переходов состояний.

Формат - это вектор столбца 2 на 1:

[G->F ; G->G]

HMMStruct = pfamhmmread(File,'TimeOut',TimeOutValue) устанавливает время ожидания соединения (в секундах) для получения данных из базы данных PFAM.

Дополнительные сведения о моделях профилей HMM см. в разделе Модель профиля HMM.

Примеры

Считывайте локально сохраненный файл в формате PFAM HMM в структуру MATLAB.

pfamhmmread('pf00002.ls')

ans = 

                   Name: '7tm_2'
    PfamAccessionNumber: 'PF00002.15'
       ModelDescription: '7 transmembrane receptor (Secretin family)'
            ModelLength: 293
               Alphabet: 'AA'
          MatchEmission: [293x20 double]
         InsertEmission: [293x20 double]
           NullEmission: [1x20 double]
                 BeginX: [294x1 double]
                 MatchX: [292x4 double]
                InsertX: [292x2 double]
                DeleteX: [292x2 double]
        FlankingInsertX: [2x2 double]
                  LoopX: [2x2 double]
                  NullX: [2x1 double]
Представлен до R2006a