Получите информацию о последовательности из базы данных GenPept
Data
= getgenpept(AccessionNumber
)
getgenpept(AccessionNumber
)
Data
= getgenpept(...,
'PartialSeq', PartialSeqValue
, ...)
Data
= getgenpept(...,
'ToFile', ToFileValue
, ...)
Data
= getgenpept(...,
'FileFormat', FileFormatValue
, ...)
Data
= getgenpept(...,
'SequenceOnly', SequenceOnlyValue
, ...)
AccessionNumber | Вектор символов, задающий уникальный алфавитно-цифровой идентификатор для записи последовательности. |
PartialSeqValue | Двухэлементный массив целых чисел, содержащих запуск и конечные положения подпоследовательности , который задает подпоследовательность, чтобы получить. StartAA является целым числом между 1 и EndAA ; EndAA является целым числом между StartAA и длиной последовательности. |
ToFileValue | Вектор символов, задающий или имя файла или путь и имя файла для того, чтобы сохранить данные GenPept. Если вы задаете только имя файла, файл сохранен в MATLAB® Current Folder. |
FileFormatValue | Вектор символов, задающий формат для получения информации о последовательности. Выбор:
Когда |
SequenceOnlyValue | Управляет возвратом только последовательности как символьный массив. Выбором является |
getgenpept
получает белок (аминокислота) информация о последовательности от базы данных GenPept, которая является переводом последовательностей нуклеотида в базе данных GenBank® и сохраняется Национальным Центром информации о Биотехнологии (NCBI).
NCBI изменил название их поисковой системы белка от GenPept до Белка Entrez. Однако имена функций в программном обеспечении Bioinformatics Toolbox™ (getgenpept
и genpeptread
) являются неизменным представлением все еще используемого формата отчета GenPept. Для получения дополнительной информации о данных GenPept посетите https://www.ncbi.nlm.nih.gov/home/about/policies.shtml.
поиски инвентарного номера в базе данных GenPept и возвращают Data
= getgenpept(AccessionNumber
)Data
, структура MATLAB, содержащая информацию для последовательности.
Если ошибка происходит при получении GenPept-отформатированной информации попытайтесь повторно выполнить запрос. Ошибки могут произойти из-за проблем интернет-соединения, которые не связаны с записью GenPept.
getgenpept(
информация об отображениях в Окне Команды MATLAB, не возвращая данные в переменную. Отображенной информацией являются только гиперссылки на URL, используемые, чтобы искать и получить данные.AccessionNumber
)
вызывает getgenpept(..., 'PropertyName', PropertyValue, ...)
getgenpept
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
возвращает заданную подпоследовательность в поле Data
= getgenpept(...,
'PartialSeq', PartialSeqValue
, ...)Sequence
структуры MATLAB. PartialSeqValue
является двухэлементным массивом целых чисел, содержащих запуск и конечные положения подпоследовательности
. [StartAA, EndAA]
StartAA
является целым числом между 1 и EndAA
; EndAA
является целым числом между StartAA
и длиной последовательности.
сохраняет данные, возвращенные от базы данных GenPept до файла. Data
= getgenpept(...,
'ToFile', ToFileValue
, ...)ToFileValue
является вектором символов, задающим или имя файла или путь и имя файла для того, чтобы сохранить данные GenPept. Если вы задаете только имя файла, файл сохранен в Текущую папку MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого это перезаписывает содержимое существующего файла без предупреждения.
Можно считать GenPept-отформатированный файл назад в MATLAB с помощью функции genpeptread
.
возвращает последовательность в заданном формате. Выбором является Data
= getgenpept(...,
'FileFormat', FileFormatValue
, ...)'GenPept'
или 'FASTA'
. Когда 'FASTA'
, затем Data
содержит только два поля, Header
и Sequence
. 'GenPept'
является значением по умолчанию, когда SequenceOnlyValue
является false
. 'FASTA'
является значением по умолчанию, когда SequenceOnlyValue
является true
.
возвращает только последовательность в Data
= getgenpept(...,
'SequenceOnly', SequenceOnlyValue
, ...)Data
, символьном массиве. Выбором является true
или false
(значение по умолчанию).
Если вы используете свойства 'SequenceOnly'
и 'ToFile'
вместе, вывод всегда является FASTA-отформатированным файлом.
Чтобы получить последовательность для человеческого приемника инсулина и сохранить его в структуре, Seq
, в Окне Команды MATLAB, вводит:
Seq = getgenpept('AAA59174') Seq = LocusName: 'AAA59174' LocusSequenceLength: '1382' LocusNumberofStrands: '' LocusTopology: 'linear' LocusMoleculeType: '' LocusGenBankDivision: 'PRI' LocusModificationDate: '06-JAN-1995' Definition: 'insulin receptor precursor.' Accession: 'AAA59174' Version: 'AAA59174.1' GI: '307070' Project: [] DBSource: 'locus HUMINSR accession M10051.1' Keywords: '' Source: 'Homo sapiens (human)' SourceOrganism: [4x65 char] Reference: {[1x1 struct]} Comment: [14x67 char] Features: [40x64 char] Sequence: [1x1382 char] SearchURL: [1x104 char] RetrieveURL: [1x92 char]
Путем рассмотрения поля Features
структуры можно решить, что подобная фурину область повторений является положениями 234 - 281. Чтобы получить только подобную фурину область повторений из последовательности для человеческого приемника инсулина и сохранить его в структуре, Fur
, в Окне Команды MATLAB, вводит:
Fur = getgenpept('AAA59174','PARTIALSEQ',[234,281]);
genpeptread
| getembl
| getgenbank
| getpdb