getgenpept

Получение информации о последовательности из базы данных GenPept

Синтаксис

Data = getgenpept(AccessionNumber)
getgenpept(AccessionNumber)
Data = getgenpept(..., 'PartialSeq', PartialSeqValue, ...)
Data = getgenpept(..., 'ToFile', ToFileValue, ...)
Data = getgenpept(..., 'FileFormat', FileFormatValue, ...)
Data = getgenpept(..., 'SequenceOnly', SequenceOnlyValue, ...)
Data = getgenpept(..., 'TimeOut, TimeOutValue, ...)

Аргументы

AccessionNumber Вектор символов, задающий уникальный алфавитно-цифровой идентификатор для записи последовательности.
PartialSeqValueДвухэлементный массив целых чисел, содержащий начальное и конечное положения подпоследовательности [StartAA, EndAA] который задает подпоследовательность для извлечения. StartAA - целое число от 1 до EndAA; EndAA - целое число между StartAA и длину последовательности.
ToFileValue Вектор символов, задающий имя файла или путь и имя файла для сохранения данных GenPept. Если вы задаете только имя файла, файл сохраняется в MATLAB® Текущая папка.
FileFormatValueВектор символов, задающий формат для информации о последовательности. Варианты:
  • 'Genpept' - По умолчанию, когда SequenceOnlyValue является false.

  • 'FASTA' - По умолчанию, когда SequenceOnlyValue является true.

Когда 'FASTA', затем Data содержит только два поля, Header и Sequence.

SequenceOnlyValue

Управляет возвратом только последовательности в виде символьного массива. Варианты true или false (по умолчанию).

TimeOutValueТайм-аут подключения в секундах, задается как положительная скалярная величина. Значение по умолчанию является 5. Для получения дополнительной информации смотрите здесь.

Описание

getgenpept извлекает информацию о белковой (аминокислотной) последовательности из базы данных GenPept, которая является трансляцией нуклеотидных последовательностей в GenBank® база данных и поддерживается Национальным центром биотехнологической информации (NCBI).

Примечание

NCBI изменил имя своей белковой поисковой системы с GenPept на Entrez Protein. Однако имена функции в программном обеспечении Bioinformatics Toolbox™ (getgenpept и genpeptread) без изменений, представляющих все еще используемый формат отчета GenPept. Для получения дополнительной информации о данных GenPept посетите https://www.ncbi.nlm.nih.gov/home/about/policies.shtml.

Data = getgenpept(AccessionNumber) ищет номер доступа в базе данных GenPept и возвращает Data, структуру MATLAB, содержащую информацию для последовательности.

Совет

Если при получении информации в формате GenPept произошла ошибка, попробуйте повторить запрос. Ошибки могут возникнуть из-за проблем с подключением к Интернету, которые не связаны с записью GenPept.

getgenpept(AccessionNumber) отображает информацию в Командном Окне MATLAB, не возвращая данные в переменную. Отображаемая информация является только гиперссылками на URL-адреса, используемые для поиска и извлечения данных.

getgenpept (..., 'PropertyName', PropertyValue, ...) вызывает getgenpept с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

Data = getgenpept(..., 'PartialSeq', PartialSeqValue, ...) возвращает указанную подпоследовательность в Sequence поле структуры MATLAB. PartialSeqValue - двухэлементный массив целых чисел, содержащий начальное и конечное положения подпоследовательности [StartAA, EndAA]. StartAA - целое число от 1 до EndAA; EndAA - целое число между StartAA и длину последовательности.

Data = getgenpept(..., 'ToFile', ToFileValue, ...) сохраняет данные, возвращенные из базы данных GenPept, в файл. ToFileValue - вектор символов, задающий имя файла или путь и имя файла для сохранения данных GenPept. Если вы задаете только имя файла, файл сохраняется в текущей папке MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого он перезаписывает содержимое существующего файла без предупреждения.

Совет

Вы можете прочитать файл в формате GenPept обратно в MATLAB с помощью genpeptread функция.

Data = getgenpept(..., 'FileFormat', FileFormatValue, ...) возвращает последовательность в заданном формате. Варианты 'GenPept' или 'FASTA'. Когда 'FASTA', затем Data содержит только два поля, Header и Sequence. 'GenPept' является значением по умолчанию, когда SequenceOnlyValue является false. 'FASTA' является значением по умолчанию, когда SequenceOnlyValue является true.

Data = getgenpept(..., 'SequenceOnly', SequenceOnlyValue, ...) возвращает только последовательность в Data, символьный массив. Варианты true или false (по умолчанию).

Примечание

Если вы используете 'SequenceOnly' и 'ToFile' свойства вместе, выходы всегда являются файлом в формате FASTA.

Data = getgenpept(..., 'TimeOut, TimeOutValue, ...) устанавливает тайм-аут подключения, чтобы получить данные из базы данных GenPept.

Примеры

Пример 23. Получение пептидной последовательности

Чтобы извлечь последовательность для рецептора инсулина человека и сохранить ее в структуре, Seq, в Командном Окне MATLAB введите:

Seq = getgenpept('AAA59174')

Seq = 

                LocusName: 'AAA59174'
      LocusSequenceLength: '1382'
     LocusNumberofStrands: ''
            LocusTopology: 'linear'
        LocusMoleculeType: ''
     LocusGenBankDivision: 'PRI'
    LocusModificationDate: '06-JAN-1995'
               Definition: 'insulin receptor precursor.'
                Accession: 'AAA59174'
                  Version: 'AAA59174.1'
                       GI: '307070'
                  Project: []
                 DBSource: 'locus HUMINSR accession M10051.1'
                 Keywords: ''
                   Source: 'Homo sapiens (human)'
           SourceOrganism: [4x65 char]
                Reference: {[1x1 struct]}
                  Comment: [14x67 char]
                 Features: [40x64 char]
                 Sequence: [1x1382 char]
                SearchURL: [1x104 char]
              RetrieveURL: [1x92 char]
Пример 24. Получение частичной пептидной последовательности

Посмотрев на Features поле структуры можно определить, что фурин-подобная область повторов является положениями, 234 через 281. Чтобы извлечь только фурин-подобные повторения, область из последовательности для рецептора инсулина человека, и хранить его в структуре, Fur, в Командном Окне MATLAB введите:

Fur = getgenpept('AAA59174','PARTIALSEQ',[234,281]);

Вопросы совместимости

расширить все

Поведение изменено в R2019a

См. также

| | |

Представлено до R2006a