Получение информации о последовательности из базы данных GenPept
Data
= getgenpept(AccessionNumber
)
getgenpept(AccessionNumber
)
Data
= getgenpept(...,
'PartialSeq', PartialSeqValue
, ...)
Data
= getgenpept(...,
'ToFile', ToFileValue
, ...)
Data
= getgenpept(...,
'FileFormat', FileFormatValue
, ...)
Data
= getgenpept(...,
'SequenceOnly', SequenceOnlyValue
, ...)
Data
= getgenpept(...,
'TimeOut, TimeOutValue
, ...)
AccessionNumber | Вектор символов, задающий уникальный алфавитно-цифровой идентификатор для записи последовательности. |
PartialSeqValue | Двухэлементный массив целых чисел, содержащий начальное и конечное положения подпоследовательности [ который задает подпоследовательность для извлечения. StartAA - целое число от 1 до EndAA ; EndAA - целое число между StartAA и длину последовательности. |
ToFileValue | Вектор символов, задающий имя файла или путь и имя файла для сохранения данных GenPept. Если вы задаете только имя файла, файл сохраняется в MATLAB® Текущая папка. |
FileFormatValue | Вектор символов, задающий формат для информации о последовательности. Варианты:
Когда |
SequenceOnlyValue | Управляет возвратом только последовательности в виде символьного массива. Варианты |
TimeOutValue | Тайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь. |
getgenpept
извлекает информацию о белковой (аминокислотной) последовательности из базы данных GenPept, которая является трансляцией нуклеотидных последовательностей в GenBank® база данных и поддерживается Национальным центром биотехнологической информации (NCBI).
Примечание
NCBI изменил имя своей белковой поисковой системы с GenPept на Entrez Protein. Однако имена функции в программном обеспечении Bioinformatics Toolbox™ (getgenpept
и genpeptread
) без изменений, представляющих все еще используемый формат отчета GenPept. Для получения дополнительной информации о данных GenPept посетите https://www.ncbi.nlm.nih.gov/home/about/policies.shtml.
ищет номер доступа в базе данных GenPept и возвращает Data
= getgenpept(AccessionNumber
)Data
, структуру MATLAB, содержащую информацию для последовательности.
Совет
Если при получении информации в формате GenPept произошла ошибка, попробуйте повторить запрос. Ошибки могут возникнуть из-за проблем с подключением к Интернету, которые не связаны с записью GenPept.
getgenpept(
отображает информацию в Командном Окне MATLAB, не возвращая данные в переменную. Отображаемая информация является только гиперссылками на URL-адреса, используемые для поиска и извлечения данных.AccessionNumber
)
getgenpept (...,
вызывает 'PropertyName
', PropertyValue
, ...)getgenpept
с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
возвращает указанную подпоследовательность в Data
= getgenpept(...,
'PartialSeq', PartialSeqValue
, ...)Sequence
поле структуры MATLAB. PartialSeqValue
- двухэлементный массив целых чисел, содержащий начальное и конечное положения подпоследовательности [
. StartAA
, EndAA
]StartAA
- целое число от 1 до EndAA
; EndAA
- целое число между StartAA
и длину последовательности.
сохраняет данные, возвращенные из базы данных GenPept, в файл. Data
= getgenpept(...,
'ToFile', ToFileValue
, ...)ToFileValue
- вектор символов, задающий имя файла или путь и имя файла для сохранения данных GenPept. Если вы задаете только имя файла, файл сохраняется в текущей папке MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого он перезаписывает содержимое существующего файла без предупреждения.
Совет
Вы можете прочитать файл в формате GenPept обратно в MATLAB с помощью genpeptread
функция.
возвращает последовательность в заданном формате. Варианты Data
= getgenpept(...,
'FileFormat', FileFormatValue
, ...)'GenPept'
или 'FASTA'
. Когда 'FASTA'
, затем Data
содержит только два поля, Header
и Sequence
. 'GenPept'
является значением по умолчанию, когда SequenceOnlyValue
является false
. 'FASTA'
является значением по умолчанию, когда SequenceOnlyValue
является true
.
возвращает только последовательность в Data
= getgenpept(...,
'SequenceOnly', SequenceOnlyValue
, ...)Data
, символьный массив. Варианты true
или false
(по умолчанию).
Примечание
Если вы используете 'SequenceOnly'
и 'ToFile'
свойства вместе, выходы всегда являются файлом в формате FASTA.
устанавливает тайм-аут подключения, чтобы получить данные из базы данных GenPept.Data
= getgenpept(...,
'TimeOut, TimeOutValue
, ...)
Чтобы извлечь последовательность для рецептора инсулина человека и сохранить ее в структуре, Seq
, в Командном Окне MATLAB введите:
Seq = getgenpept('AAA59174') Seq = LocusName: 'AAA59174' LocusSequenceLength: '1382' LocusNumberofStrands: '' LocusTopology: 'linear' LocusMoleculeType: '' LocusGenBankDivision: 'PRI' LocusModificationDate: '06-JAN-1995' Definition: 'insulin receptor precursor.' Accession: 'AAA59174' Version: 'AAA59174.1' GI: '307070' Project: [] DBSource: 'locus HUMINSR accession M10051.1' Keywords: '' Source: 'Homo sapiens (human)' SourceOrganism: [4x65 char] Reference: {[1x1 struct]} Comment: [14x67 char] Features: [40x64 char] Sequence: [1x1382 char] SearchURL: [1x104 char] RetrieveURL: [1x92 char]
Посмотрев на Features
поле структуры можно определить, что фурин-подобная область повторов является положениями, 234 через 281. Чтобы извлечь только фурин-подобные повторения, область из последовательности для рецептора инсулина человека, и хранить его в структуре, Fur
, в Командном Окне MATLAB введите:
Fur = getgenpept('AAA59174','PARTIALSEQ',[234,281]);
genpeptread
| getembl
| getgenbank
| getpdb