gethmmalignment

Извлечение выравнивания нескольких последовательностей, сопоставленного со скрытым профилем модели Маркова (HMM), из базы данных PFAM

Синтаксис

AlignStruct = gethmmalignment(PFAMName)
AlignStruct = gethmmalignment(PFAMAccessNumber)
AlignStruct = gethmmalignment(PFAMNumber)
AlignStruct = gethmmalignment(..., 'ToFile', ToFileValue, ...)
AlignStruct = gethmmalignment(..., 'Type', TypeValue, ...)
AlignStruct = gethmmalignment(..., 'IgnoreGaps', IgnoreGaps, ...)
AlignStruct = gethmmalignment(..., 'TimeOut', TimeOutValue, ...)

Входные параметры

PFAMNameВектор символов, задающий имя семейства белков (уникальный идентификатор) записи профиля HMM в базе данных PFAM. Для примера, '7tm_2'.
PFAMAccessNumberВектор символов, задающий номер доступа семейства белков к записи профиля HMM в базе данных PFAM. Для примера, 'PF00002'.
PFAMNumberЦелое число, указывающее номер семейства белков записи профиля HMM в базе данных PFAM. Для примера, 2 - номер семейства белков для семейства белков PF00002.
ToFileValueВектор символов имя файла или путь и имя файла для сохранения данных. Если вы задаете только имя файла, этот файл будет сохранен в MATLAB® Текущая папка.
TypeValue

Вектор символов, задающий набор возвращённых выравниваний. Варианты:

  • 'full' - По умолчанию. Возвращает все выравнивания, соответствующие профилю HMM.

  • 'seed' - Возвращает только трассы, используемые для генерации профиля HMM.

IgnoreGapsValueУправляет удалением символов - и . из последовательности. Варианты true или false (по умолчанию).
TimeOutValueТайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь.

Выходные аргументы

AlignStructМассив структуры MATLAB, содержащий выравнивание нескольких последовательностей, связанное с профилем HMM.

Описание

AlignStruct = gethmmalignment(PFAMName) выполняет поиск в базе данных PFAM (http://pfam.xfam.org/) записи профиля HMM, представленной PFAMName, имя семейства белков, извлекает выравнивание нескольких последовательностей, связанное с профилем HMM, и возвращает AlignStruct, массив структуры MATLAB с каждой структурой, содержащей следующие поля:

ОбластьОписание
HeaderИмя белка
SequenceБелковая последовательность

AlignStruct = gethmmalignment(PFAMAccessNumber) выполняет поиск в базе данных PFAM записи профиля HMM, представленной PFAMAccessNumber, номер присоединения семейства белков, извлекает выравнивание нескольких последовательностей, связанное с профилем HMM, и возвращает AlignStruct, массив структур MATLAB.

AlignStruct = gethmmalignment(PFAMNumber) определяет число присоединения семейства белков из PFAMNumberцелое число, ищет в базе данных PFAM связанную запись профиля HMM, извлекает выравнивание нескольких последовательностей, связанное с профилем HMM, и возвращает AlignStruct, массив структур MATLAB.

AlignStruct = gethmmalignment (..., 'PropertyName', PropertyValue, ...) вызывает gethmmalignment с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

AlignStruct = gethmmalignment(..., 'ToFile', ToFileValue, ...) сохраняет данные, возвращенные из базы данных PFAM, в файл, заданный как ToFileValue.

Примечание

Вы можете прочитать файл в формате FASTA, содержащий данные PFAM, обратно в программное обеспечение MATLAB, используя fastaread функция.

AlignStruct = gethmmalignment(..., 'Type', TypeValue, ...) задает набор возвращённых выравниваний. Варианты:

  • 'full' - По умолчанию. Возвращает все последовательности, которые соответствуют профилю HMM.

  • 'seed' - Возвращает только последовательности, используемые для генерации профиля HMM.

AlignStruct = gethmmalignment(..., 'IgnoreGaps', IgnoreGaps, ...) управляет удалением символов - и . из последовательности. Варианты true или false (по умолчанию).

AlignStruct = gethmmalignment(..., 'TimeOut', TimeOutValue, ...) устанавливает тайм-аут подключения (в секундах) для извлечения данных из базы данных PFAM.

Примеры

Чтобы извлечь множественное выравнивание последовательностей, используемых для обучения профиля HMM для глобального выравнивания с белком 7-трансмембранного рецептора в семействе секретинов, введите:

pfamalign = gethmmalignment('PF00002','Type','seed')

pfamalign = 

  29×1 struct array with fields:

    Header
    Sequence
Представлено до R2006a