pdbread

Считайте данные из файла Protein Data Bank (PDB)

Синтаксис

PDBStruct = pdbread(File)
PDBStruct = pdbread(File, 'ModelNum', ModelNumValue)
PDBStruct = pdbread(File,'TimeOut', TimeOutValue)

Входные параметры

File

Одно из следующих:

  • Вектор символов или строка, указывающая имя файла, путь и имя файла или URL-адрес, указывающий на файл. Файл-ссылка является файлом в формате Protein Data Bank (PDB) (текстовый файл ASCII). Если вы задаете только имя файла, этот файл должен быть в MATLAB® путь поиска файлов или в текущей папке MATLAB.

  • Символьный массив или вектор-столбец строк, содержащих текст файла PDB.

Совет

Вы можете использовать getpdb функция со 'ToFile' свойство для извлечения данных структуры белка из базы данных PDB и создания файла в формате PDB.

ModelNumValue

Положительное целое число, задающее модель в файле PDB.

TimeOutValueТайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь.

Выходные аргументы

PDBStructСтруктура MATLAB, содержащая поле для каждой записи PDB.

Описание

База данных Protein Data Bank (PDB) является архивом экспериментально определенных 3-D данных о биологической макромолекулярной структуре. Для получения дополнительной информации о формате PDB смотрите:

PDBStruct = pdbread(File) считывает данные из текстового файла PDB File и сохраняет данные в структуре MATLAB, PDBStruct, содержащее поле для каждой записи PDB. В следующей таблице представлены возможные записи PDB и соответствующие поля в структуре MATLAB PDBStruct:

Запись базы данных PDBПоле в структуре MATLAB
HEADERHeader
OBSLTEObsolete
TITLETitle
CAVEATCaveat
COMPNDCompound
SOURCESource
KEYWDSKeywords
EXPDTAExperimentData
AUTHORAuthors
REVDATRevisionDate
SPRSDESuperseded
JRNLJournal
REMARK 1Remark1
REMARK N

Примечание

N равно от 2 до 999.

Remarkn

Примечание

n равно от 2 до 999.

DBREFDBReferences
SEQADVSequenceConflicts
SEQRESSequence
FTNOTEFootnote
MODRESModifiedResidues
HETHeterogen
HETNAMHeterogenName
HETSYNHeterogenSynonym
FORMULFormula
HELIXHelix
SHEETSheet
TURNTurn
SSBONDSSBond
LINKLink
HYDBNDHydrogenBond
SLTBRGSaltBridge
CISPEPCISPeptides
SITESite
CRYST1Cryst1
ORIGXnOriginX
SCALEnScale
MTRIXnMatrix
TVECTTranslationVector
MODELModel
ATOMAtom
SIGATMAtomSD
ANISOUAnisotropicTemp
SIGUIJAnisotropicTempSD
TERTerminal
HETATMHeterogenAtom
CONECTConnectivity

PDBStruct = pdbread(File, 'ModelNum', ModelNumValue) считывает только модель, заданную ModelNumValue из текстового файла в формате PDB File и сохраняет данные в структуре MATLAB PDBStruct. Если ModelNumValue не соответствует существующему номеру режима в File, затем pdbread считывает координатную информацию всех моделей.

PDBStruct = pdbread(File,'TimeOut', TimeOutValue) устанавливает тайм-аут подключения (в секундах) для чтения данных из базы данных PDB.

Поле последовательности

The Sequence поле также является структурой, содержащей информацию о последовательности в следующих подполях:

  • NumOfResidues

  • ChainID

  • ResidueNames - Содержит трехбуквенные коды для остатков последовательности.

  • Sequence - Содержит коды одной буквы для остатков последовательности.

Примечание

Если последовательность имеет измененные остатки, то ResidueNames подполе может не соответствовать стандартным трехбуквенным аминокислотным кодам. В этом случае Sequence подполе будет содержать модифицированный код остатка в положении, соответствующем модифицированному остатку. Модифицированный код остатка приведен в ModifiedResidues поле.

Поле модели

The Model поле также является структурой или массивом структур, содержащих информацию о координатах. Если структура MATLAB содержит одну модель, Model поле является структурой, содержащей информацию о координатах для этой модели. Если структура MATLAB содержит несколько моделей, Model поле является массивом структур, содержащих информацию о координатах для каждой модели. The Model поле содержит следующие подполя:

  • Atom

  • AtomSD

  • AnisotropicTemp

  • AnisotropicTempSD

  • Terminal

  • HeterogenAtom

Поле Атома

The Atom поле также является массивом структур, содержащих следующие подполя:

  • AtomSerNo

  • AtomName

  • altLoc

  • resName

  • chainID

  • resSeq

  • iCode

  • X

  • Y

  • Z

  • occupancy

  • tempFactor

  • segID

  • element

  • charge

  • AtomNameStruct - Содержит три подполя: chemSymbol, remoteInd, и branch.

Примеры

  1. Используйте getpdb функция для извлечения информации о структуре из Protein Data Bank (PDB) для белка никотинового рецептора с идентификатором 1abt, а затем сохраните данные в файл PDB nicotinic_receptor.pdb в текущей папке MATLAB.

    getpdb('1abt', 'ToFile', 'nicotinic_receptor.pdb');
  2. Считайте данные из nicotinic_receptor.pdb файл в структуру MATLAB pdbstruct.

    pdbstruct = pdbread('nicotinic_receptor.pdb');
  3. Считайте только вторую модель из nicotinic_receptor.pdb файл в структуру MATLAB pdbstruct_Model2.

    pdbstruct_Model2 = pdbread('nicotinic_receptor.pdb', 'ModelNum', 2);
  4. Смотрите атомарную информацию о координатах в полях модели обеих структур MATLAB pdbstruct и pdbstruct_Model2.

    pdbstruct.Model
    
    ans = 
    
    1x4 struct array with fields:
        MDLSerNo
        Atom
        Terminal
    
    pdbstruct_Model2.Model
    
    ans = 
    
        MDLSerNo: 2
            Atom: [1x1205 struct]
        Terminal: [1x2 struct]
  5. Считайте данные из URL-адреса в структуру MATLAB, gfl_pdbstruct.

    gfl_pdbstruct = pdbread('http://www.rcsb.org/pdb/files/1gfl.pdb');
Представлено до R2006a