getpdb

Получите данные структуры белка из базы данных Protein Data Bank (PDB)

Синтаксис

PDBStruct = getpdb(PDBid)
PDBStruct = getpdb(PDBid, ...'ToFile', ToFileValue, ...)
PDBStruct = getpdb(PDBid, ...'SequenceOnly', SequenceOnlyValue, ...)
PDBStruct = getpdb(PDBid, ...'TimeOut', TimeOutValue, ...)

Входные параметры

PDBidВектор символов или строка, задающая уникальный идентификатор для записи структуры белка в базе данных PDB.

Примечание

Каждая структура в базе данных PDB представлена четырехсимвольным алфавитно-цифровым идентификатором. Для примера, 4hhb - идентификатор гемоглобина.

ToFileValue Вектор символов или строка, задающая имя файла или путь и имя файла для сохранения данных в формате PDB. Если вы задаете только имя файла, этот файл будет сохранен в MATLAB® Текущая папка.

Совет

После сохранения записи структуры белка в локальный файл PDB, можно использовать pdbread функция, чтобы считать файл в программное обеспечение MATLAB в автономном режиме или использовать molviewer функция для отображения и управления 3-D изображением структуры.

SequenceOnlyValue Управляет возврат только белковой последовательности. Варианты true или false (по умолчанию).

Если существует одна последовательность, она возвращается как символьный массив. Если существует несколько последовательностей, они возвращаются как массив ячеек.

TimeOutValueТайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь.

Выходные аргументы

PDBStructСтруктура MATLAB, содержащая поле для каждой записи PDB.

Описание

База данных Protein Data Bank (PDB) является архивом экспериментально определенных 3-D данных о биологической макромолекулярной структуре. getpdb извлекает данные структуры белка из базы данных Protein Data Bank (PDB), которая содержит 3-D данные о биологической макромолекулярной структуре.

PDBStruct = getpdb(PDBid) выполняет поиск в базе данных PDB записи структуры белка, заданной идентификатором PDBid и возвращает структуру MATLAB PDBStruct, содержащее поле для каждой записи PDB. В следующей таблице представлены возможные записи PDB и соответствующие поля в структуре MATLAB PDBStruct:

Запись базы данных PDBПоле в структуре MATLAB
HEADERHeader
OBSLTEObsolete
TITLETitle
CAVEATCaveat
COMPNDCompound
SOURCESource
KEYWDSKeywords
EXPDTAExperimentData
AUTHORAuthors
REVDATRevisionDate
SPRSDESuperseded
JRNLJournal
REMARK 1Remark1
REMARK N

Примечание

N равно от 2 до 999.

Remarkn

Примечание

n равно от 2 до 999.

DBREFDBReferences
SEQADVSequenceConflicts
SEQRESSequence
FTNOTEFootnote
MODRESModifiedResidues
HETHeterogen
HETNAMHeterogenName
HETSYNHeterogenSynonym
FORMULFormula
HELIXHelix
SHEETSheet
TURNTurn
SSBONDSSBond
LINKLink
HYDBNDHydrogenBond
SLTBRGSaltBridge
CISPEPCISPeptides
SITESite
CRYST1Cryst1
ORIGXnOriginX
SCALEnScale
MTRIXnMatrix
TVECTTranslationVector
MODELModel
ATOMAtom
SIGATMAtomSD
ANISOUAnisotropicTemp
SIGUIJAnisotropicTempSD
TERTerminal
HETATMHeterogenAtom
CONECTConnectivity

PDBStruct = getpdb (PDBid... 'PropertyName', PropertyValue, ...) вызывает getpdb с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

PDBStruct = getpdb(PDBid, ...'ToFile', ToFileValue, ...) сохраняет данные, возвращенные из базы данных, в файл PDB, ToFileValue.

Совет

После сохранения записи структуры белка в локальный файл PDB, можно использовать pdbread функция, чтобы считать файл в программное обеспечение MATLAB в автономном режиме или использовать molviewer функция для отображения и управления 3-D изображением структуры.

PDBStruct = getpdb(PDBid, ...'SequenceOnly', SequenceOnlyValue, ...) управляет возврат только белковой последовательности. Варианты true или false (по умолчанию). Если существует одна последовательность, она возвращается как символьный массив. Если существует несколько последовательностей, они возвращаются как массив ячеек.

PDBStruct = getpdb(PDBid, ...'TimeOut', TimeOutValue, ...) устанавливает тайм-аут подключения (в секундах) для извлечения данных из базы данных PDB.

Поле последовательности

The Sequence поле также является структурой, содержащей информацию о последовательности в следующих подполях:

  • NumOfResidues

  • ChainID

  • ResidueNames - Содержит трехбуквенные коды для остатков последовательности.

  • Sequence - Содержит коды одной буквы для остатков последовательности.

Примечание

Если последовательность имеет измененные остатки, то ResidueNames подполе может не соответствовать стандартным трехбуквенным аминокислотным кодам. В этом случае Sequence подполе будет содержать модифицированный код остатка в положении, соответствующем модифицированному остатку. Модифицированный код остатка приведен в ModifiedResidues поле.

Поле модели

The Model поле также является структурой или массивом структур, содержащих информацию о координатах. Если структура MATLAB содержит одну модель, Model поле является структурой, содержащей информацию о координатах для этой модели. Если структура MATLAB содержит несколько моделей, Model поле является массивом структур, содержащих информацию о координатах для каждой модели. The Model поле содержит следующие подполя:

  • Atom

  • AtomSD

  • AnisotropicTemp

  • AnisotropicTempSD

  • Terminal

  • HeterogenAtom

Поле Атома

The Atom поле также является массивом структур, содержащих следующие подполя:

  • AtomSerNo

  • AtomName

  • altLoc

  • resName

  • chainID

  • resSeq

  • iCode

  • X

  • Y

  • Z

  • occupancy

  • tempFactor

  • segID

  • element

  • charge

  • AtomNameStruct - Содержит три подполя: chemSymbol, remoteInd, и branch.

Примеры

Найдите информацию о структуре белка переноса электронов (гема), который имеет идентификатор PDB 5CYT, считайте информацию в структуру MATLAB pdbstructи сохраните информацию в файл PDB electron_transport.pdb в текущей папке MATLAB.

pdbstruct = getpdb('5CYT', 'ToFile', 'electron_transport.pdb')
Представлено до R2006a