Получите данные структуры белка из базы данных Protein Data Bank (PDB)
PDBStruct
= getpdb(PDBid
)
PDBStruct
= getpdb(PDBid
,
...'ToFile', ToFileValue
, ...)
PDBStruct
= getpdb(PDBid
,
...'SequenceOnly', SequenceOnlyValue
,
...)
PDBStruct
= getpdb(PDBid
,
...'TimeOut', TimeOutValue
,
...)
PDBid | Вектор символов или строка, задающая уникальный идентификатор для записи структуры белка в базе данных PDB. Примечание Каждая структура в базе данных PDB представлена четырехсимвольным алфавитно-цифровым идентификатором. Для примера, |
ToFileValue | Вектор символов или строка, задающая имя файла или путь и имя файла для сохранения данных в формате PDB. Если вы задаете только имя файла, этот файл будет сохранен в MATLAB® Текущая папка. |
SequenceOnlyValue | Управляет возврат только белковой последовательности. Варианты true или false (по умолчанию). Если существует одна последовательность, она возвращается как символьный массив. Если существует несколько последовательностей, они возвращаются как массив ячеек. |
TimeOutValue | Тайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь. |
PDBStruct | Структура MATLAB, содержащая поле для каждой записи PDB. |
База данных Protein Data Bank (PDB) является архивом экспериментально определенных 3-D данных о биологической макромолекулярной структуре. getpdb
извлекает данные структуры белка из базы данных Protein Data Bank (PDB), которая содержит 3-D данные о биологической макромолекулярной структуре.
выполняет поиск в базе данных PDB записи структуры белка, заданной идентификатором PDBStruct
= getpdb(PDBid
)PDBid
и возвращает структуру MATLAB PDBStruct
, содержащее поле для каждой записи PDB. В следующей таблице представлены возможные записи PDB и соответствующие поля в структуре MATLAB PDBStruct
:
Запись базы данных PDB | Поле в структуре MATLAB |
---|---|
HEADER | Header |
OBSLTE | Obsolete |
TITLE | Title |
CAVEAT | Caveat |
COMPND | Compound |
SOURCE | Source |
KEYWDS | Keywords |
EXPDTA | ExperimentData |
AUTHOR | Authors |
REVDAT | RevisionDate |
SPRSDE | Superseded |
JRNL | Journal |
REMARK 1 | Remark1 |
REMARK N Примечание N равно от 2 до 999. | Remarkn Примечание n равно от 2 до 999. |
DBREF | DBReferences |
SEQADV | SequenceConflicts |
SEQRES | Sequence |
FTNOTE | Footnote |
MODRES | ModifiedResidues |
HET | Heterogen |
HETNAM | HeterogenName |
HETSYN | HeterogenSynonym |
FORMUL | Formula |
HELIX | Helix |
SHEET | Sheet |
TURN | Turn |
SSBOND | SSBond |
LINK | Link |
HYDBND | HydrogenBond |
SLTBRG | SaltBridge |
CISPEP | CISPeptides |
SITE | Site |
CRYST1 | Cryst1 |
ORIGXn | OriginX |
SCALEn | Scale |
MTRIXn | Matrix |
TVECT | TranslationVector |
MODEL | Model |
ATOM | Atom |
SIGATM | AtomSD |
ANISOU | AnisotropicTemp |
SIGUIJ | AnisotropicTempSD |
TER | Terminal |
HETATM | HeterogenAtom |
CONECT | Connectivity |
вызывает PDBStruct
= getpdb (PDBid
... 'PropertyName
', PropertyValue
, ...)getpdb
с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
сохраняет данные, возвращенные из базы данных, в файл PDB, PDBStruct
= getpdb(PDBid
,
...'ToFile', ToFileValue
, ...)ToFileValue
.
Совет
После сохранения записи структуры белка в локальный файл PDB, можно использовать pdbread
функция, чтобы считать файл в программное обеспечение MATLAB в автономном режиме или использовать molviewer
функция для отображения и управления 3-D изображением структуры.
управляет возврат только белковой последовательности. Варианты PDBStruct
= getpdb(PDBid
,
...'SequenceOnly', SequenceOnlyValue
,
...)true
или false
(по умолчанию). Если существует одна последовательность, она возвращается как символьный массив. Если существует несколько последовательностей, они возвращаются как массив ячеек.
устанавливает тайм-аут подключения (в секундах) для извлечения данных из базы данных PDB.PDBStruct
= getpdb(PDBid
,
...'TimeOut', TimeOutValue
,
...)
The Sequence
поле также является структурой, содержащей информацию о последовательности в следующих подполях:
NumOfResidues
ChainID
ResidueNames
- Содержит трехбуквенные коды для остатков последовательности.
Sequence
- Содержит коды одной буквы для остатков последовательности.
Примечание
Если последовательность имеет измененные остатки, то ResidueNames
подполе может не соответствовать стандартным трехбуквенным аминокислотным кодам. В этом случае Sequence
подполе будет содержать модифицированный код остатка в положении, соответствующем модифицированному остатку. Модифицированный код остатка приведен в ModifiedResidues
поле.
The Model
поле также является структурой или массивом структур, содержащих информацию о координатах. Если структура MATLAB содержит одну модель, Model
поле является структурой, содержащей информацию о координатах для этой модели. Если структура MATLAB содержит несколько моделей, Model
поле является массивом структур, содержащих информацию о координатах для каждой модели. The Model
поле содержит следующие подполя:
Atom
AtomSD
AnisotropicTemp
AnisotropicTempSD
Terminal
HeterogenAtom
The Atom
поле также является массивом структур, содержащих следующие подполя:
AtomSerNo
AtomName
altLoc
resName
chainID
resSeq
iCode
X
Y
Z
occupancy
tempFactor
segID
element
charge
AtomNameStruct
- Содержит три подполя: chemSymbol
, remoteInd
, и branch
.
Найдите информацию о структуре белка переноса электронов (гема), который имеет идентификатор PDB 5CYT
, считайте информацию в структуру MATLAB pdbstruct
и сохраните информацию в файл PDB electron_transport.pdb
в текущей папке MATLAB.
pdbstruct = getpdb('5CYT', 'ToFile', 'electron_transport.pdb')
getembl
| getgenbank
| getgenpept
| molviewer
| pdbdistplot
| pdbread
| pdbsuperpose
| pdbtransform
| pdbwrite