exponenta event banner

gethmmalignment

Извлечение из базы данных PFAM выравнивания нескольких последовательностей, связанных со скрытым профилем модели Маркова (HMM)

Синтаксис

AlignStruct = gethmmalignment(PFAMName)
AlignStruct = gethmmalignment(PFAMAccessNumber)
AlignStruct = gethmmalignment(PFAMNumber)
AlignStruct = gethmmalignment(..., 'ToFile', ToFileValue, ...)
AlignStruct = gethmmalignment(..., 'Type', TypeValue, ...)
AlignStruct = gethmmalignment(..., 'IgnoreGaps', IgnoreGaps, ...)
AlignStruct = gethmmalignment(..., 'TimeOut', TimeOutValue, ...)

Входные аргументы

PFAMNameВектор символов, указывающий имя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM. Например, '7tm_2'.
PFAMAccessNumberВектор символов, указывающий номер присоединения семейства белков к записи профиля HMM в базе данных PFAM. Например, 'PF00002'.
PFAMNumberЦелое число, указывающее номер семейства белков записи профиля HMM в базе данных PFAM. Например, 2 - номер семейства белков для семейства белков PF00002.
ToFileValueВектор символов, указывающий имя файла или путь и имя файла для сохранения данных. Если указано только имя файла, он будет сохранен в текущей папке MATLAB ®.
TypeValue

Символьный вектор, указывающий набор возвращаемых трасс. Возможны следующие варианты:

  • 'full' - По умолчанию. Возвращает все трассы, соответствующие профилю HMM.

  • 'seed' - возвращает только трассы, используемые для создания профиля HMM.

IgnoreGapsValueУправление удалением обозначений - и . из последовательности. Варианты: true или false (по умолчанию).
TimeOutValueВремя ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь.

Выходные аргументы

AlignStructМассив структуры MATLAB, содержащий выравнивание нескольких последовательностей, связанное с профилем HMM.

Описание

AlignStruct = gethmmalignment(PFAMName) выполняет поиск в базе данных PFAM (http://pfam.xfam.org/) записи профиля HMM, представленной PFAMName, имя семейства белков, извлекает выравнивание нескольких последовательностей, связанное с профилем HMM, и возвращает AlignStruct, массив структуры MATLAB, каждая структура которого содержит следующие поля:

ОбластьОписание
HeaderНазвание белка
SequenceБелковая последовательность

AlignStruct = gethmmalignment(PFAMAccessNumber) выполняет поиск в базе данных PFAM записи профиля HMM, представленной PFAMAccessNumber, регистрационный номер семейства белков, извлекает выравнивание нескольких последовательностей, связанное с профилем HMM, и возвращает AlignStruct, массив структуры MATLAB.

AlignStruct = gethmmalignment(PFAMNumber) определяет номер присоединения семейства белков из PFAMNumber, целое число, выполняет поиск в базе данных PFAM связанной записи профиля HMM, извлекает выравнивание нескольких последовательностей, связанное с профилем HMM, и возвращает AlignStruct, массив структуры MATLAB.

AlignStruct = gethmmalignment(..., 'PropertyName', PropertyValue, ...) требования gethmmalignment с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

AlignStruct = gethmmalignment(..., 'ToFile', ToFileValue, ...) сохраняет данные, возвращенные из базы данных PFAM, в файл, указанный ToFileValue.

Примечание

Файл в формате FASTA, содержащий данные PFAM, можно прочитать обратно в программное обеспечение MATLAB с помощью fastaread функция.

AlignStruct = gethmmalignment(..., 'Type', TypeValue, ...) определяет набор возвращаемых трасс. Возможны следующие варианты:

  • 'full' - По умолчанию. Возвращает все последовательности, соответствующие профилю HMM.

  • 'seed' - возвращает только последовательности, используемые для создания профиля HMM.

AlignStruct = gethmmalignment(..., 'IgnoreGaps', IgnoreGaps, ...) управляет удалением символов - и . из последовательности. Варианты: true или false (по умолчанию).

AlignStruct = gethmmalignment(..., 'TimeOut', TimeOutValue, ...) устанавливает время ожидания соединения (в секундах) для получения данных из базы данных PFAM.

Примеры

Чтобы извлечь множественное выравнивание последовательностей, используемых для обучения профиля HMM для глобального выравнивания с 7-трансмембранным рецепторным белком в семействе секретинов, введите:

pfamalign = gethmmalignment('PF00002','Type','seed')

pfamalign = 

  29×1 struct array with fields:

    Header
    Sequence
Представлен до R2006a