Получение информации о последовательности из базы данных GenPept
Data = getgenpept(AccessionNumber)
getgenpept(AccessionNumber)
Data = getgenpept(...,
'PartialSeq', PartialSeqValue, ...)
Data = getgenpept(...,
'ToFile', ToFileValue, ...)
Data = getgenpept(...,
'FileFormat', FileFormatValue, ...)
Data = getgenpept(...,
'SequenceOnly', SequenceOnlyValue, ...)
Data = getgenpept(...,
'TimeOut, TimeOutValue, ...)
AccessionNumber | Вектор символов, задающий уникальный алфавитно-цифровой идентификатор для записи последовательности. |
PartialSeqValue | Двухэлементный массив целых чисел, содержащий начальное и конечное положения подпоследовательности [ который задает подпоследовательность для извлечения. StartAA - целое число от 1 до EndAA; EndAA - целое число между StartAA и длину последовательности. |
ToFileValue | Вектор символов, задающий имя файла или путь и имя файла для сохранения данных GenPept. Если вы задаете только имя файла, файл сохраняется в MATLAB® Текущая папка. |
FileFormatValue | Вектор символов, задающий формат для информации о последовательности. Варианты:
Когда |
SequenceOnlyValue | Управляет возвратом только последовательности в виде символьного массива. Варианты |
TimeOutValue | Тайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь. |
getgenpept извлекает информацию о белковой (аминокислотной) последовательности из базы данных GenPept, которая является трансляцией нуклеотидных последовательностей в GenBank® база данных и поддерживается Национальным центром биотехнологической информации (NCBI).
Примечание
NCBI изменил имя своей белковой поисковой системы с GenPept на Entrez Protein. Однако имена функции в программном обеспечении Bioinformatics Toolbox™ (getgenpept и genpeptread) без изменений, представляющих все еще используемый формат отчета GenPept. Для получения дополнительной информации о данных GenPept посетите https://www.ncbi.nlm.nih.gov/home/about/policies.shtml.
ищет номер доступа в базе данных GenPept и возвращает Data = getgenpept(AccessionNumber)Data, структуру MATLAB, содержащую информацию для последовательности.
Совет
Если при получении информации в формате GenPept произошла ошибка, попробуйте повторить запрос. Ошибки могут возникнуть из-за проблем с подключением к Интернету, которые не связаны с записью GenPept.
getgenpept( отображает информацию в Командном Окне MATLAB, не возвращая данные в переменную. Отображаемая информация является только гиперссылками на URL-адреса, используемые для поиска и извлечения данных.AccessionNumber)
getgenpept (..., вызывает 'PropertyName', PropertyValue, ...)getgenpept с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
возвращает указанную подпоследовательность в Data = getgenpept(...,
'PartialSeq', PartialSeqValue, ...)Sequence поле структуры MATLAB. PartialSeqValue - двухэлементный массив целых чисел, содержащий начальное и конечное положения подпоследовательности [. StartAA, EndAA]StartAA - целое число от 1 до EndAA; EndAA - целое число между StartAA и длину последовательности.
сохраняет данные, возвращенные из базы данных GenPept, в файл. Data = getgenpept(...,
'ToFile', ToFileValue, ...)ToFileValue - вектор символов, задающий имя файла или путь и имя файла для сохранения данных GenPept. Если вы задаете только имя файла, файл сохраняется в текущей папке MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого он перезаписывает содержимое существующего файла без предупреждения.
Совет
Вы можете прочитать файл в формате GenPept обратно в MATLAB с помощью genpeptread функция.
возвращает последовательность в заданном формате. Варианты Data = getgenpept(...,
'FileFormat', FileFormatValue, ...)'GenPept' или 'FASTA'. Когда 'FASTA', затем Data содержит только два поля, Header и Sequence. 'GenPept' является значением по умолчанию, когда SequenceOnlyValue является false. 'FASTA' является значением по умолчанию, когда SequenceOnlyValue является true.
возвращает только последовательность в Data = getgenpept(...,
'SequenceOnly', SequenceOnlyValue, ...)Data, символьный массив. Варианты true или false (по умолчанию).
Примечание
Если вы используете 'SequenceOnly' и 'ToFile' свойства вместе, выходы всегда являются файлом в формате FASTA.
устанавливает тайм-аут подключения, чтобы получить данные из базы данных GenPept.Data = getgenpept(...,
'TimeOut, TimeOutValue, ...)
Чтобы извлечь последовательность для рецептора инсулина человека и сохранить ее в структуре, Seq, в Командном Окне MATLAB введите:
Seq = getgenpept('AAA59174')
Seq =
LocusName: 'AAA59174'
LocusSequenceLength: '1382'
LocusNumberofStrands: ''
LocusTopology: 'linear'
LocusMoleculeType: ''
LocusGenBankDivision: 'PRI'
LocusModificationDate: '06-JAN-1995'
Definition: 'insulin receptor precursor.'
Accession: 'AAA59174'
Version: 'AAA59174.1'
GI: '307070'
Project: []
DBSource: 'locus HUMINSR accession M10051.1'
Keywords: ''
Source: 'Homo sapiens (human)'
SourceOrganism: [4x65 char]
Reference: {[1x1 struct]}
Comment: [14x67 char]
Features: [40x64 char]
Sequence: [1x1382 char]
SearchURL: [1x104 char]
RetrieveURL: [1x92 char]
Посмотрев на Features поле структуры можно определить, что фурин-подобная область повторов является положениями, 234 через 281. Чтобы извлечь только фурин-подобные повторения, область из последовательности для рецептора инсулина человека, и хранить его в структуре, Fur, в Командном Окне MATLAB введите:
Fur = getgenpept('AAA59174','PARTIALSEQ',[234,281]);genpeptread | getembl | getgenbank | getpdb