exponenta event banner

getgenpept

Получение информации о последовательности из базы данных GenPept

Синтаксис

Data = getgenpept(AccessionNumber)
getgenpept(AccessionNumber)
Data = getgenpept(..., 'PartialSeq', PartialSeqValue, ...)
Data = getgenpept(..., 'ToFile', ToFileValue, ...)
Data = getgenpept(..., 'FileFormat', FileFormatValue, ...)
Data = getgenpept(..., 'SequenceOnly', SequenceOnlyValue, ...)
Data = getgenpept(..., 'TimeOut, TimeOutValue, ...)

Аргументы

AccessionNumber Символьный вектор, указывающий уникальный буквенно-цифровой идентификатор для записи последовательности.
PartialSeqValueДвухэлементный массив целых чисел, содержащий начальную и конечную позиции подпоследовательности [StartAA, EndAA] указывает подпоследовательность для извлечения. StartAA является целым числом от 1 до EndAA; EndAA является целым числом между StartAA и длину последовательности.
ToFileValue Вектор символов, указывающий либо имя файла, либо путь и имя файла для сохранения данных GenPept. Если указано только имя файла, файл сохраняется в текущей папке MATLAB ®.
FileFormatValueСимвольный вектор, задающий формат информации о последовательности. Возможны следующие варианты:
  • 'Genpept' - По умолчанию, когда SequenceOnlyValue является false.

  • 'FASTA' - По умолчанию, когда SequenceOnlyValue является true.

Когда 'FASTA', то Data содержит только два поля, Header и Sequence.

SequenceOnlyValue

Управляет возвращением только последовательности в виде символьного массива. Варианты: true или false (по умолчанию).

TimeOutValueВремя ожидания подключения в секундах, указанное как положительный скаляр. Значение по умолчанию - 5. Подробнее см. здесь.

Описание

getgenpept извлекает информацию о белковой (аминокислотной) последовательности из базы данных GenPept, которая является трансляцией нуклеотидных последовательностей в базе данных GenBank ® и поддерживается Национальным центром биотехнологической информации (NCBI ).

Примечание

NCBI изменил название своей белковой поисковой системы с GenPept на Entrez Protein. Однако названия функций в программном обеспечении Bioinformatics Toolbox™ (getgenpept и genpeptread) являются неизменными, представляя все еще используемый формат отчета GenPept. Для получения дополнительной информации о данных GenPept посетите веб-сайт https://www.ncbi.nlm.nih.gov/home/about/policies.shtml.

Data = getgenpept(AccessionNumber) ищет номер присоединения в базе данных GenPept и возвращает Dataструктура MATLAB, содержащая информацию для последовательности.

Совет

Если при получении информации в формате GenPept возникает ошибка, попробуйте выполнить запрос повторно. Ошибки могут возникать из-за проблем подключения к Интернету, которые не связаны с записью GenPept.

getgenpept(AccessionNumber) отображает информацию в окне команд MATLAB без возврата данных переменной. Отображаемая информация представляет собой только гиперссылки на URL-адреса, используемые для поиска и извлечения данных.

getgenpept(..., 'PropertyName', PropertyValue, ...) требования getgenpept с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

Data = getgenpept(..., 'PartialSeq', PartialSeqValue, ...) возвращает указанную подпоследовательность в Sequence поле структуры MATLAB. PartialSeqValue - двухэлементный массив целых чисел, содержащий начальную и конечную позиции подпоследовательности; [StartAA, EndAA]. StartAA является целым числом от 1 до EndAA; EndAA является целым числом между StartAA и длину последовательности.

Data = getgenpept(..., 'ToFile', ToFileValue, ...) сохраняет данные, возвращенные из базы данных GenPept, в файл. ToFileValue является вектором символов, указывающим либо имя файла, либо путь и имя файла для сохранения данных GenPept. Если указано только имя файла, файл сохраняется в текущей папке MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого содержимое существующего файла перезаписывается без предупреждения.

Совет

Вы можете прочитать файл в формате GenPept обратно в MATLAB с помощью genpeptread функция.

Data = getgenpept(..., 'FileFormat', FileFormatValue, ...) возвращает последовательность в указанном формате. Варианты: 'GenPept' или 'FASTA'. Когда 'FASTA', то Data содержит только два поля, Header и Sequence. 'GenPept' является значением по умолчанию, когда SequenceOnlyValue является false. 'FASTA' является значением по умолчанию, когда SequenceOnlyValue является true.

Data = getgenpept(..., 'SequenceOnly', SequenceOnlyValue, ...) возвращает только последовательность в Data, символьный массив. Варианты: true или false (по умолчанию).

Примечание

Если вы используете 'SequenceOnly' и 'ToFile' свойства вместе, вывод всегда является файлом в формате FASTA.

Data = getgenpept(..., 'TimeOut, TimeOutValue, ...) устанавливает время ожидания подключения для получения данных из базы данных GenPept.

Примеры

Пример 23. Извлечение пептидной последовательности

Чтобы извлечь последовательность для рецептора инсулина человека и сохранить ее в структуре, Seq, в окне команд MATLAB введите:

Seq = getgenpept('AAA59174')

Seq = 

                LocusName: 'AAA59174'
      LocusSequenceLength: '1382'
     LocusNumberofStrands: ''
            LocusTopology: 'linear'
        LocusMoleculeType: ''
     LocusGenBankDivision: 'PRI'
    LocusModificationDate: '06-JAN-1995'
               Definition: 'insulin receptor precursor.'
                Accession: 'AAA59174'
                  Version: 'AAA59174.1'
                       GI: '307070'
                  Project: []
                 DBSource: 'locus HUMINSR accession M10051.1'
                 Keywords: ''
                   Source: 'Homo sapiens (human)'
           SourceOrganism: [4x65 char]
                Reference: {[1x1 struct]}
                  Comment: [14x67 char]
                 Features: [40x64 char]
                 Sequence: [1x1382 char]
                SearchURL: [1x104 char]
              RetrieveURL: [1x92 char]
Пример 24. Извлечение частичной пептидной последовательности

Глядя на Features поле структуры, можно определить, что фуриноподобный домен повторов является позициями, 234 через 281. Чтобы извлечь только фуриноподобный повторяющийся домен из последовательности рецептора инсулина человека и сохранить его в структуре, Fur, в окне команд MATLAB введите:

Fur = getgenpept('AAA59174','PARTIALSEQ',[234,281]);

Вопросы совместимости

развернуть все

В R2019a изменилось поведение

См. также

| | |

Представлен до R2006a