Получение информации о последовательности из базы данных GenPept
Data = getgenpept(AccessionNumber)
getgenpept(AccessionNumber)
Data = getgenpept(..., 'PartialSeq', PartialSeqValue, ...)
Data = getgenpept(..., 'ToFile', ToFileValue, ...)
Data = getgenpept(..., 'FileFormat', FileFormatValue, ...)
Data = getgenpept(..., 'SequenceOnly', SequenceOnlyValue, ...)
Data = getgenpept(..., 'TimeOut, TimeOutValue, ...)
AccessionNumber | Символьный вектор, указывающий уникальный буквенно-цифровой идентификатор для записи последовательности. |
PartialSeqValue | Двухэлементный массив целых чисел, содержащий начальную и конечную позиции подпоследовательности [ указывает подпоследовательность для извлечения. StartAA является целым числом от 1 до EndAA; EndAA является целым числом между StartAA и длину последовательности. |
ToFileValue | Вектор символов, указывающий либо имя файла, либо путь и имя файла для сохранения данных GenPept. Если указано только имя файла, файл сохраняется в текущей папке MATLAB ®. |
FileFormatValue | Символьный вектор, задающий формат информации о последовательности. Возможны следующие варианты:
Когда |
SequenceOnlyValue | Управляет возвращением только последовательности в виде символьного массива. Варианты: |
TimeOutValue | Время ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь. |
getgenpept извлекает информацию о белковой (аминокислотной) последовательности из базы данных GenPept, которая является трансляцией нуклеотидных последовательностей в базе данных GenBank ® и поддерживается Национальным центром биотехнологической информации (NCBI ).
Примечание
NCBI изменил название своей белковой поисковой системы с GenPept на Entrez Protein. Однако названия функций в программном обеспечении Bioinformatics Toolbox™ (getgenpept и genpeptread) являются неизменными, представляя все еще используемый формат отчета GenPept. Для получения дополнительной информации о данных GenPept посетите веб-сайт https://www.ncbi.nlm.nih.gov/home/about/policies.shtml.
ищет номер присоединения в базе данных GenPept и возвращает Data = getgenpept(AccessionNumber)Dataструктура MATLAB, содержащая информацию для последовательности.
Совет
Если при получении информации в формате GenPept возникает ошибка, попробуйте выполнить запрос повторно. Ошибки могут возникать из-за проблем подключения к Интернету, которые не связаны с записью GenPept.
getgenpept( отображает информацию в окне команд MATLAB без возврата данных переменной. Отображаемая информация представляет собой только гиперссылки на URL-адреса, используемые для поиска и извлечения данных.AccessionNumber)
getgenpept(..., ' требования PropertyName', PropertyValue, ...)getgenpept с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:
возвращает указанную подпоследовательность в Data = getgenpept(..., 'PartialSeq', PartialSeqValue, ...)Sequence поле структуры MATLAB. PartialSeqValue - двухэлементный массив целых чисел, содержащий начальную и конечную позиции подпоследовательности; [. StartAA, EndAA]StartAA является целым числом от 1 до EndAA; EndAA является целым числом между StartAA и длину последовательности.
сохраняет данные, возвращенные из базы данных GenPept, в файл. Data = getgenpept(..., 'ToFile', ToFileValue, ...)ToFileValue является вектором символов, указывающим либо имя файла, либо путь и имя файла для сохранения данных GenPept. Если указано только имя файла, файл сохраняется в текущей папке MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого содержимое существующего файла перезаписывается без предупреждения.
Совет
Вы можете прочитать файл в формате GenPept обратно в MATLAB с помощью genpeptread функция.
возвращает последовательность в указанном формате. Варианты: Data = getgenpept(..., 'FileFormat', FileFormatValue, ...)'GenPept' или 'FASTA'. Когда 'FASTA', то Data содержит только два поля, Header и Sequence. 'GenPept' является значением по умолчанию, когда SequenceOnlyValue является false. 'FASTA' является значением по умолчанию, когда SequenceOnlyValue является true.
возвращает только последовательность в Data = getgenpept(..., 'SequenceOnly', SequenceOnlyValue, ...)Data, символьный массив. Варианты: true или false (по умолчанию).
Примечание
Если вы используете 'SequenceOnly' и 'ToFile' свойства вместе, вывод всегда является файлом в формате FASTA.
устанавливает время ожидания подключения для получения данных из базы данных GenPept.Data = getgenpept(..., 'TimeOut, TimeOutValue, ...)
Чтобы извлечь последовательность для рецептора инсулина человека и сохранить ее в структуре, Seq, в окне команд MATLAB введите:
Seq = getgenpept('AAA59174')
Seq =
LocusName: 'AAA59174'
LocusSequenceLength: '1382'
LocusNumberofStrands: ''
LocusTopology: 'linear'
LocusMoleculeType: ''
LocusGenBankDivision: 'PRI'
LocusModificationDate: '06-JAN-1995'
Definition: 'insulin receptor precursor.'
Accession: 'AAA59174'
Version: 'AAA59174.1'
GI: '307070'
Project: []
DBSource: 'locus HUMINSR accession M10051.1'
Keywords: ''
Source: 'Homo sapiens (human)'
SourceOrganism: [4x65 char]
Reference: {[1x1 struct]}
Comment: [14x67 char]
Features: [40x64 char]
Sequence: [1x1382 char]
SearchURL: [1x104 char]
RetrieveURL: [1x92 char]
Глядя на Features поле структуры, можно определить, что фуриноподобный домен повторов является позициями, 234 через 281. Чтобы извлечь только фуриноподобный повторяющийся домен из последовательности рецептора инсулина человека и сохранить его в структуре, Fur, в окне команд MATLAB введите:
Fur = getgenpept('AAA59174','PARTIALSEQ',[234,281]);genpeptread | getembl | getgenbank | getpdb