Извлечение из базы данных PFAM выравнивания нескольких последовательностей, связанных со скрытым профилем модели Маркова (HMM)
AlignStruct = gethmmalignment(PFAMName)
AlignStruct = gethmmalignment(PFAMAccessNumber)
AlignStruct = gethmmalignment(PFAMNumber)
AlignStruct = gethmmalignment(..., 'ToFile', ToFileValue, ...)
AlignStruct = gethmmalignment(..., 'Type', TypeValue, ...)
AlignStruct = gethmmalignment(..., 'IgnoreGaps', IgnoreGaps, ...)
AlignStruct = gethmmalignment(..., 'TimeOut', TimeOutValue, ...)
PFAMName | Вектор символов, указывающий имя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM. Например, '7tm_2'. |
PFAMAccessNumber | Вектор символов, указывающий номер присоединения семейства белков к записи профиля HMM в базе данных PFAM. Например, 'PF00002'. |
PFAMNumber | Целое число, указывающее номер семейства белков записи профиля HMM в базе данных PFAM. Например, 2 - номер семейства белков для семейства белков PF00002. |
ToFileValue | Вектор символов, указывающий имя файла или путь и имя файла для сохранения данных. Если указано только имя файла, он будет сохранен в текущей папке MATLAB ®. |
TypeValue | Символьный вектор, указывающий набор возвращаемых трасс. Возможны следующие варианты:
|
IgnoreGapsValue | Управление удалением обозначений - и . из последовательности. Варианты: true или false (по умолчанию). |
TimeOutValue | Время ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь. |
AlignStruct | Массив структуры MATLAB, содержащий выравнивание нескольких последовательностей, связанное с профилем HMM. |
выполняет поиск в базе данных PFAM (http://pfam.xfam.org/) записи профиля HMM, представленной AlignStruct = gethmmalignment(PFAMName)PFAMName, имя семейства белков, извлекает выравнивание нескольких последовательностей, связанное с профилем HMM, и возвращает AlignStruct, массив структуры MATLAB, каждая структура которого содержит следующие поля:
| Область | Описание |
|---|---|
Header | Название белка |
Sequence | Белковая последовательность |
выполняет поиск в базе данных PFAM записи профиля HMM, представленной AlignStruct = gethmmalignment(PFAMAccessNumber)PFAMAccessNumber, регистрационный номер семейства белков, извлекает выравнивание нескольких последовательностей, связанное с профилем HMM, и возвращает AlignStruct, массив структуры MATLAB.
определяет номер присоединения семейства белков из AlignStruct = gethmmalignment(PFAMNumber)PFAMNumber, целое число, выполняет поиск в базе данных PFAM связанной записи профиля HMM, извлекает выравнивание нескольких последовательностей, связанное с профилем HMM, и возвращает AlignStruct, массив структуры MATLAB.
требования AlignStruct = gethmmalignment(..., 'PropertyName', PropertyValue, ...)gethmmalignment с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:
сохраняет данные, возвращенные из базы данных PFAM, в файл, указанный AlignStruct = gethmmalignment(..., 'ToFile', ToFileValue, ...)ToFileValue.
Примечание
Файл в формате FASTA, содержащий данные PFAM, можно прочитать обратно в программное обеспечение MATLAB с помощью fastaread функция.
определяет набор возвращаемых трасс. Возможны следующие варианты: AlignStruct = gethmmalignment(..., 'Type', TypeValue, ...)
'full' - По умолчанию. Возвращает все последовательности, соответствующие профилю HMM.
'seed' - возвращает только последовательности, используемые для создания профиля HMM.
управляет удалением символов AlignStruct = gethmmalignment(..., 'IgnoreGaps', IgnoreGaps, ...)- и . из последовательности. Варианты: true или false (по умолчанию).
устанавливает время ожидания соединения (в секундах) для получения данных из базы данных PFAM.AlignStruct = gethmmalignment(..., 'TimeOut', TimeOutValue, ...)
Чтобы извлечь множественное выравнивание последовательностей, используемых для обучения профиля HMM для глобального выравнивания с 7-трансмембранным рецепторным белком в семействе секретинов, введите:
pfamalign = gethmmalignment('PF00002','Type','seed')
pfamalign =
29×1 struct array with fields:
Header
Sequencefastaread | gethmmprof | gethmmtree | multialignread | multialignwrite | pfamhmmread