exponenta event banner

getpdb

Получение данных о структуре белка из базы данных банка данных белка (PDB)

Синтаксис

PDBStruct = getpdb(PDBid)
PDBStruct = getpdb(PDBid, ...'ToFile', ToFileValue, ...)
PDBStruct = getpdb(PDBid, ...'SequenceOnly', SequenceOnlyValue, ...)
PDBStruct = getpdb(PDBid, ...'TimeOut', TimeOutValue, ...)

Входные аргументы

PDBidСимвольный вектор или строка, указывающая уникальный идентификатор для записи структуры белка в базе данных PDB.

Примечание

Каждая структура в базе данных PDB представлена четырехсимвольным буквенно-цифровым идентификатором. Например, 4hhb - идентификатор гемоглобина.

ToFileValue Символьный вектор или строка, указывающая имя файла или путь и имя файла для сохранения данных в формате PDB. Если указано только имя файла, он будет сохранен в текущей папке MATLAB ®.

Совет

После сохранения записи структуры белка в локальный файл в формате PDB можно использовать pdbread для чтения файла в программное обеспечение MATLAB в автономном режиме или использования molviewer для отображения и управления 3-D изображением структуры.

SequenceOnlyValue Управляет возвращением только белковой последовательности. Варианты: true или false (по умолчанию).

Если имеется одна последовательность, она возвращается в виде символьного массива. Если существует несколько последовательностей, они возвращаются в виде массива ячеек.

TimeOutValueВремя ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь.

Выходные аргументы

PDBStructСтруктура MATLAB содержит поле для каждой записи PDB.

Описание

База данных банка данных белка (PDB) представляет собой архив экспериментально определенных данных о 3-D биологической макромолекулярной структуре. getpdb извлекает данные о структуре белка из базы данных банка данных белка (PDB), которая содержит 3-D данные о биологической макромолекулярной структуре.

PDBStruct = getpdb(PDBid) поиск в базе данных PDB записи структуры белка, указанной идентификатором PDBid и возвращает структуру MATLAB PDBStruct, который содержит поле для каждой записи PDB. В следующей таблице представлены возможные записи PDB и соответствующие поля в структуре MATLAB. PDBStruct:

Запись базы данных PDBПоле в структуре MATLAB
HEADERHeader
OBSLTEObsolete
TITLETitle
CAVEATCaveat
COMPNDCompound
SOURCESource
KEYWDSKeywords
EXPDTAExperimentData
AUTHORAuthors
REVDATRevisionDate
SPRSDESuperseded
JRNLJournal
REMARK 1Remark1
REMARK N

Примечание

N равно от 2 до 999.

Remarkn

Примечание

n равно от 2 до 999.

DBREFDBReferences
SEQADVSequenceConflicts
SEQRESSequence
FTNOTEFootnote
MODRESModifiedResidues
HETHeterogen
HETNAMHeterogenName
HETSYNHeterogenSynonym
FORMULFormula
HELIXHelix
SHEETSheet
TURNTurn
SSBONDSSBond
LINKLink
HYDBNDHydrogenBond
SLTBRGSaltBridge
CISPEPCISPeptides
SITESite
CRYST1Cryst1
ORIGXnOriginX
SCALEnScale
MTRIXnMatrix
TVECTTranslationVector
MODELModel
ATOMAtom
SIGATMAtomSD
ANISOUAnisotropicTemp
SIGUIJAnisotropicTempSD
TERTerminal
HETATMHeterogenAtom
CONECTConnectivity

PDBStruct = getpdb(PDBid, ...'PropertyName', PropertyValue, ...) требования getpdb с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

PDBStruct = getpdb(PDBid, ...'ToFile', ToFileValue, ...) сохраняет данные, возвращенные из базы данных, в файл в формате PDB, ToFileValue.

Совет

После сохранения записи структуры белка в локальный файл в формате PDB можно использовать pdbread для чтения файла в программное обеспечение MATLAB в автономном режиме или использования molviewer для отображения и управления 3-D изображением структуры.

PDBStruct = getpdb(PDBid, ...'SequenceOnly', SequenceOnlyValue, ...) контролирует только возврат белковой последовательности. Варианты: true или false (по умолчанию). Если имеется одна последовательность, она возвращается в виде символьного массива. Если существует несколько последовательностей, они возвращаются в виде массива ячеек.

PDBStruct = getpdb(PDBid, ...'TimeOut', TimeOutValue, ...) устанавливает время ожидания подключения (в секундах) для получения данных из базы данных PDB.

Поле последовательности

Sequence поле также является структурой, содержащей информацию о последовательности в следующих подполях:

  • NumOfResidues

  • ChainID

  • ResidueNames - содержит трехбуквенные коды для остатков последовательности.

  • Sequence - содержит однобуквенные коды для остатков последовательности.

Примечание

Если последовательность имеет модифицированные остатки, то ResidueNames поле может не соответствовать стандартным трехбуквенным аминокислотным кодам. В этом случае Sequence поле содержит модифицированный код остатка в положении, соответствующем модифицированному остатку. Модифицированный код остатка представлен в ModifiedResidues поле.

Поле модели

Model поле также является структурой или массивом структур, содержащих информацию о координатах. Если структура MATLAB содержит одну модель, Model - это структура, содержащая информацию о координатах для этой модели. Если структура MATLAB содержит несколько моделей, Model поле представляет собой массив структур, содержащих информацию о координатах для каждой модели. Model поле содержит следующие подполя:

  • Atom

  • AtomSD

  • AnisotropicTemp

  • AnisotropicTempSD

  • Terminal

  • HeterogenAtom

Поле «Атом»

Atom поле также является массивом структур, содержащих следующие подполя:

  • AtomSerNo

  • AtomName

  • altLoc

  • resName

  • chainID

  • resSeq

  • iCode

  • X

  • Y

  • Z

  • occupancy

  • tempFactor

  • segID

  • element

  • charge

  • AtomNameStruct - Содержит три подраздела: chemSymbol, remoteInd, и branch.

Примеры

Извлеките информацию о структуре для белка транспорта электронов (гема), который имеет идентификатор PDB 5CYT, считывание информации в структуру MATLAB pdbstructи сохраните информацию в файле в формате PDB electron_transport.pdb в текущей папке MATLAB.

pdbstruct = getpdb('5CYT', 'ToFile', 'electron_transport.pdb')
Представлен до R2006a