Получение данных о структуре белка из базы данных банка данных белка (PDB)
PDBStruct = getpdb(PDBid)
PDBStruct = getpdb(PDBid, ...'ToFile', ToFileValue, ...)
PDBStruct = getpdb(PDBid, ...'SequenceOnly', SequenceOnlyValue, ...)
PDBStruct = getpdb(PDBid, ...'TimeOut', TimeOutValue, ...)
PDBid | Символьный вектор или строка, указывающая уникальный идентификатор для записи структуры белка в базе данных PDB. Примечание Каждая структура в базе данных PDB представлена четырехсимвольным буквенно-цифровым идентификатором. Например, |
ToFileValue | Символьный вектор или строка, указывающая имя файла или путь и имя файла для сохранения данных в формате PDB. Если указано только имя файла, он будет сохранен в текущей папке MATLAB ®. |
SequenceOnlyValue | Управляет возвращением только белковой последовательности. Варианты: true или false (по умолчанию). Если имеется одна последовательность, она возвращается в виде символьного массива. Если существует несколько последовательностей, они возвращаются в виде массива ячеек. |
TimeOutValue | Время ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь. |
PDBStruct | Структура MATLAB содержит поле для каждой записи PDB. |
База данных банка данных белка (PDB) представляет собой архив экспериментально определенных данных о 3-D биологической макромолекулярной структуре. getpdb извлекает данные о структуре белка из базы данных банка данных белка (PDB), которая содержит 3-D данные о биологической макромолекулярной структуре.
поиск в базе данных PDB записи структуры белка, указанной идентификатором PDBStruct = getpdb(PDBid)PDBid и возвращает структуру MATLAB PDBStruct, который содержит поле для каждой записи PDB. В следующей таблице представлены возможные записи PDB и соответствующие поля в структуре MATLAB. PDBStruct:
| Запись базы данных PDB | Поле в структуре MATLAB |
|---|---|
HEADER | Header |
OBSLTE | Obsolete |
TITLE | Title |
CAVEAT | Caveat |
COMPND | Compound |
SOURCE | Source |
KEYWDS | Keywords |
EXPDTA | ExperimentData |
AUTHOR | Authors |
REVDAT | RevisionDate |
SPRSDE | Superseded |
JRNL | Journal |
REMARK 1 | Remark1 |
REMARK NПримечание N равно от 2 до 999. | RemarknПримечание n равно от 2 до 999. |
DBREF | DBReferences |
SEQADV | SequenceConflicts |
SEQRES | Sequence |
FTNOTE | Footnote |
MODRES | ModifiedResidues |
HET | Heterogen |
HETNAM | HeterogenName |
HETSYN | HeterogenSynonym |
FORMUL | Formula |
HELIX | Helix |
SHEET | Sheet |
TURN | Turn |
SSBOND | SSBond |
LINK | Link |
HYDBND | HydrogenBond |
SLTBRG | SaltBridge |
CISPEP | CISPeptides |
SITE | Site |
CRYST1 | Cryst1 |
ORIGXn | OriginX |
SCALEn | Scale |
MTRIXn | Matrix |
TVECT | TranslationVector |
MODEL | Model |
ATOM | Atom |
SIGATM | AtomSD |
ANISOU | AnisotropicTemp |
SIGUIJ | AnisotropicTempSD |
TER | Terminal |
HETATM | HeterogenAtom |
CONECT | Connectivity |
требования PDBStruct = getpdb(PDBid, ...'PropertyName', PropertyValue, ...)getpdb с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:
сохраняет данные, возвращенные из базы данных, в файл в формате PDB, PDBStruct = getpdb(PDBid, ...'ToFile', ToFileValue, ...)ToFileValue.
Совет
После сохранения записи структуры белка в локальный файл в формате PDB можно использовать pdbread для чтения файла в программное обеспечение MATLAB в автономном режиме или использования molviewer для отображения и управления 3-D изображением структуры.
контролирует только возврат белковой последовательности. Варианты: PDBStruct = getpdb(PDBid, ...'SequenceOnly', SequenceOnlyValue, ...)true или false (по умолчанию). Если имеется одна последовательность, она возвращается в виде символьного массива. Если существует несколько последовательностей, они возвращаются в виде массива ячеек.
устанавливает время ожидания подключения (в секундах) для получения данных из базы данных PDB.PDBStruct = getpdb(PDBid, ...'TimeOut', TimeOutValue, ...)
Sequence поле также является структурой, содержащей информацию о последовательности в следующих подполях:
NumOfResidues
ChainID
ResidueNames - содержит трехбуквенные коды для остатков последовательности.
Sequence - содержит однобуквенные коды для остатков последовательности.
Примечание
Если последовательность имеет модифицированные остатки, то ResidueNames поле может не соответствовать стандартным трехбуквенным аминокислотным кодам. В этом случае Sequence поле содержит модифицированный код остатка в положении, соответствующем модифицированному остатку. Модифицированный код остатка представлен в ModifiedResidues поле.
Model поле также является структурой или массивом структур, содержащих информацию о координатах. Если структура MATLAB содержит одну модель, Model - это структура, содержащая информацию о координатах для этой модели. Если структура MATLAB содержит несколько моделей, Model поле представляет собой массив структур, содержащих информацию о координатах для каждой модели. Model поле содержит следующие подполя:
Atom
AtomSD
AnisotropicTemp
AnisotropicTempSD
Terminal
HeterogenAtom
Atom поле также является массивом структур, содержащих следующие подполя:
AtomSerNo
AtomName
altLoc
resName
chainID
resSeq
iCode
X
Y
Z
occupancy
tempFactor
segID
element
charge
AtomNameStruct - Содержит три подраздела: chemSymbol, remoteInd, и branch.
Извлеките информацию о структуре для белка транспорта электронов (гема), который имеет идентификатор PDB 5CYT, считывание информации в структуру MATLAB pdbstructи сохраните информацию в файле в формате PDB electron_transport.pdb в текущей папке MATLAB.
pdbstruct = getpdb('5CYT', 'ToFile', 'electron_transport.pdb')
getembl | getgenbank | getgenpept | molviewer | pdbdistplot | pdbread | pdbsuperpose | pdbtransform | pdbwrite