getpdb

Получите данные о структуре белка от базы данных Protein Data Bank (PDB)

Синтаксис

PDBStruct = getpdb(PDBid)
PDBStruct = getpdb(PDBid, ...'ToFile', ToFileValue, ...)
PDBStruct = getpdb(PDBid, ...'SequenceOnly', SequenceOnlyValue, ...)

Входные параметры

PDBidВектор символов или строка, задающая уникальный идентификатор для структуры белка, записывают в базе данных PDB.

Примечание

Каждая структура в базе данных PDB представлена алфавитно-цифровым идентификатором с четырьмя символами. Например, 4hhb является идентификатором для гемоглобина.

ToFileValue Вектор символов или строка, задающая имя файла или путь и имя файла для сохранения PDB-отформатированных-данных. Если вы зададите только имя файла, тот файл будет сохранен в MATLAB® Current Folder.

Совет

После того, как вы сохраните запись структуры белка на локальный PDB-отформатированный файл, можно использовать функцию pdbread, чтобы считать файл в программное обеспечение MATLAB оффлайн или использовать функцию molviewer, чтобы отобразить и управлять 3-D изображением структуры.

SequenceOnlyValue Управляет возвратом последовательности белка только. Выбором является true или false (значение по умолчанию).

Если существует одна последовательность, она возвращена как символьный массив. Если существует несколько последовательностей, они возвращены как массив ячеек.

Выходные аргументы

PDBStructСтруктура MATLAB, содержащая поле для каждой записи PDB.

Описание

База данных Protein Data Bank (PDB) является архивом экспериментально решительных 3-D биологических макромолекулярных данных о структуре. getpdb получает данные о структуре белка от базы данных Protein Data Bank (PDB), которая содержит 3-D биологические макромолекулярные данные о структуре.

PDBStruct = getpdb(PDBid) ищет базу данных PDB запись структуры белка, заданную идентификатором PDBid, и возвращает структуру MATLAB PDBStruct, который содержит поле для каждой записи PDB. Следующая таблица обобщает возможные записи PDB и соответствующие поля в структуре MATLAB PDBStruct:

Запись базы данных PDBПоле в структуре MATLAB
HEADERHeader
OBSLTEObsolete
TITLETitle
CAVEATCaveat
COMPNDCompound
SOURCESource
KEYWDSKeywords
EXPDTAExperimentData
AUTHORAuthors
REVDATRevisionDate
SPRSDESuperseded
JRNLJournal
REMARK 1Remark1
REMARK N

Примечание

N равняется 2 - 999.

Remarkn

Примечание

n равняется 2 - 999.

DBREFDBReferences
SEQADVSequenceConflicts
SEQRESSequence
FTNOTEFootnote
MODRESModifiedResidues
HETHeterogen
HETNAMHeterogenName
HETSYNHeterogenSynonym
FORMULFormula
HELIXHelix
SHEETSheet
TURNTurn
SSBONDSSBond
LINKLink
HYDBNDHydrogenBond
SLTBRGSaltBridge
CISPEPCISPeptides
SITESite
CRYST1Cryst1
ORIGXnOriginX
SCALEnScale
MTRIXnMatrix
TVECTTranslationVector
MODELModel
ATOMAtom
SIGATMAtomSD
ANISOUAnisotropicTemp
SIGUIJAnisotropicTempSD
TERTerminal
HETATMHeterogenAtom
CONECTConnectivity

PDBStruct = getpdb(PDBid, ...'PropertyName', PropertyValue, ...)  вызывает getpdb с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

PDBStruct = getpdb(PDBid, ...'ToFile', ToFileValue, ...) сохраняет данные, возвращенные от базы данных до PDB-отформатированного файла, ToFileValue.

Совет

После того, как вы сохраните запись структуры белка на локальный PDB-отформатированный файл, можно использовать функцию pdbread, чтобы считать файл в программное обеспечение MATLAB оффлайн или использовать функцию molviewer, чтобы отобразить и управлять 3-D изображением структуры.

PDBStruct = getpdb(PDBid, ...'SequenceOnly', SequenceOnlyValue, ...) управляет возвратом последовательности белка только. Выбором является true или false (значение по умолчанию). Если существует одна последовательность, она возвращена как символьный массив. Если существует несколько последовательностей, они возвращены как массив ячеек.

Поле последовательности

Поле Sequence является также структурой, содержащей информацию о последовательности в следующих подполях:

  • NumOfResidues

  • ChainID

  • ResidueNames — Содержит трехбуквенные коды для остатков последовательности.

  • Sequence — Содержит однобуквенные коды для остатков последовательности.

Примечание

Если последовательность изменила остатки, то подполе ResidueNames не может соответствовать стандартным трехбуквенным кодам аминокислоты. В этом случае подполе Sequence будет содержать измененный код остатка в положении, соответствующем измененному остатку. Измененный код остатка предоставлен в поле ModifiedResidues.

Образцовое поле

Поле Model является также структурой или массивом структур, содержащих координатную информацию. Если структура MATLAB содержит одну модель, поле Model является структурой, содержащей координатную информацию для той модели. Если структура MATLAB содержит многоуровневые модели, поле Model является массивом структур, содержащих координатную информацию для каждой модели. Поле Model содержит следующие подполя:

  • Atom

  • AtomSD

  • AnisotropicTemp

  • AnisotropicTempSD

  • Terminal

  • HeterogenAtom

Поле Atom

Поле Atom является также массивом структур, содержащих следующие подполя:

  • AtomSerNo

  • AtomName

  • altLoc

  • resName

  • chainID

  • resSeq

  • iCode

  • X

  • Y

  • Z

  • occupancy

  • tempFactor

  • segID

  • element

  • charge

  • AtomNameStruct — Содержит три подполя: chemSymbol, remoteInd и branch.

Примеры

Получите информацию о структуре для переноса электронов (гем) белок, который имеет идентификатор PDB 5CYT, считывает информации в структуру MATLAB pdbstruct и сохраняет информацию к PDB-отформатированному файлу electron_transport.pdb в Текущей папке MATLAB.

pdbstruct = getpdb('5CYT', 'ToFile', 'electron_transport.pdb')

Представлено до R2006a