exponenta event banner

pdbread

Считывание данных из файла банка данных белка (PDB)

Синтаксис

PDBStruct = pdbread(File)
PDBStruct = pdbread(File, 'ModelNum', ModelNumValue)
PDBStruct = pdbread(File,'TimeOut', TimeOutValue)

Входные аргументы

File

Одно из следующих действий:

  • Символьный вектор или строка, указывающая имя файла, путь и имя файла или URL-адрес, указывающий на файл. Указанный файл является форматированным файлом банка данных белка (PDB) (текстовый файл ASCII). Если указано только имя файла, этот файл должен находиться в пути поиска MATLAB ® или в текущей папке MATLAB.

  • Символьный массив или вектор столбца строк, содержащий текст файла в формате PDB.

Совет

Вы можете использовать getpdb функции с помощью 'ToFile' свойство для извлечения данных структуры белка из базы данных PDB и создания файла в формате PDB.

ModelNumValue

Положительное целое число, указывающее модель в файле в формате PDB.

TimeOutValueВремя ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь.

Выходные аргументы

PDBStructСтруктура MATLAB содержит поле для каждой записи PDB.

Описание

База данных банка данных белка (PDB) представляет собой архив экспериментально определенных данных о 3-D биологической макромолекулярной структуре. Дополнительные сведения о формате PDB см. в разделе:

PDBStruct = pdbread(File) считывает данные из текстового файла в формате PDB File и сохраняет данные в структуре MATLAB, PDBStruct, который содержит поле для каждой записи PDB. В следующей таблице представлены возможные записи PDB и соответствующие поля в структуре MATLAB. PDBStruct:

Запись базы данных PDBПоле в структуре MATLAB
HEADERHeader
OBSLTEObsolete
TITLETitle
CAVEATCaveat
COMPNDCompound
SOURCESource
KEYWDSKeywords
EXPDTAExperimentData
AUTHORAuthors
REVDATRevisionDate
SPRSDESuperseded
JRNLJournal
REMARK 1Remark1
REMARK N

Примечание

N равно от 2 до 999.

Remarkn

Примечание

n равно от 2 до 999.

DBREFDBReferences
SEQADVSequenceConflicts
SEQRESSequence
FTNOTEFootnote
MODRESModifiedResidues
HETHeterogen
HETNAMHeterogenName
HETSYNHeterogenSynonym
FORMULFormula
HELIXHelix
SHEETSheet
TURNTurn
SSBONDSSBond
LINKLink
HYDBNDHydrogenBond
SLTBRGSaltBridge
CISPEPCISPeptides
SITESite
CRYST1Cryst1
ORIGXnOriginX
SCALEnScale
MTRIXnMatrix
TVECTTranslationVector
MODELModel
ATOMAtom
SIGATMAtomSD
ANISOUAnisotropicTemp
SIGUIJAnisotropicTempSD
TERTerminal
HETATMHeterogenAtom
CONECTConnectivity

PDBStruct = pdbread(File, 'ModelNum', ModelNumValue) считывает только модель, указанную ModelNumValue из текстового файла в формате PDB File и сохраняет данные в структуре MATLAB PDBStruct. Если ModelNumValue не соответствует существующему номеру режима в File, то pdbread считывает информацию о координатах всех моделей.

PDBStruct = pdbread(File,'TimeOut', TimeOutValue) устанавливает время ожидания соединения (в секундах) для считывания данных из базы данных PDB.

Поле последовательности

Sequence поле также является структурой, содержащей информацию о последовательности в следующих подполях:

  • NumOfResidues

  • ChainID

  • ResidueNames - содержит трехбуквенные коды для остатков последовательности.

  • Sequence - содержит однобуквенные коды для остатков последовательности.

Примечание

Если последовательность имеет модифицированные остатки, то ResidueNames поле может не соответствовать стандартным трехбуквенным аминокислотным кодам. В этом случае Sequence поле содержит модифицированный код остатка в положении, соответствующем модифицированному остатку. Модифицированный код остатка представлен в ModifiedResidues поле.

Поле модели

Model поле также является структурой или массивом структур, содержащих информацию о координатах. Если структура MATLAB содержит одну модель, Model - это структура, содержащая информацию о координатах для этой модели. Если структура MATLAB содержит несколько моделей, Model поле представляет собой массив структур, содержащих информацию о координатах для каждой модели. Model поле содержит следующие подполя:

  • Atom

  • AtomSD

  • AnisotropicTemp

  • AnisotropicTempSD

  • Terminal

  • HeterogenAtom

Поле «Атом»

Atom поле также является массивом структур, содержащих следующие подполя:

  • AtomSerNo

  • AtomName

  • altLoc

  • resName

  • chainID

  • resSeq

  • iCode

  • X

  • Y

  • Z

  • occupancy

  • tempFactor

  • segID

  • element

  • charge

  • AtomNameStruct - Содержит три подраздела: chemSymbol, remoteInd, и branch.

Примеры

  1. Используйте getpdb функция извлечения информации о структуре из банка данных белка (PDB) для белка никотинового рецептора с идентификатором 1abt, а затем сохраните данные в файл в формате PDB nicotinic_receptor.pdb в текущей папке MATLAB.

    getpdb('1abt', 'ToFile', 'nicotinic_receptor.pdb');
  2. Считывание данных из nicotinic_receptor.pdb в структуру MATLAB pdbstruct.

    pdbstruct = pdbread('nicotinic_receptor.pdb');
  3. Считывать только вторую модель из nicotinic_receptor.pdb в структуру MATLAB pdbstruct_Model2.

    pdbstruct_Model2 = pdbread('nicotinic_receptor.pdb', 'ModelNum', 2);
  4. Просмотр информации об атомных координатах в полях модели обеих структур MATLAB pdbstruct и pdbstruct_Model2.

    pdbstruct.Model
    
    ans = 
    
    1x4 struct array with fields:
        MDLSerNo
        Atom
        Terminal
    
    pdbstruct_Model2.Model
    
    ans = 
    
        MDLSerNo: 2
            Atom: [1x1205 struct]
        Terminal: [1x2 struct]
  5. Считывание данных из URL в структуру MATLAB, gfl_pdbstruct.

    gfl_pdbstruct = pdbread('http://www.rcsb.org/pdb/files/1gfl.pdb');
Представлен до R2006a