getgenpept

Получите информацию о последовательности из базы данных GenPept

Синтаксис

Data = getgenpept(AccessionNumber)
getgenpept(AccessionNumber)
Data = getgenpept(..., 'PartialSeq', PartialSeqValue, ...)
Data = getgenpept(..., 'ToFile', ToFileValue, ...)
Data = getgenpept(..., 'FileFormat', FileFormatValue, ...)
Data = getgenpept(..., 'SequenceOnly', SequenceOnlyValue, ...)
Data = getgenpept(..., 'TimeOut, TimeOutValue, ...)

Аргументы

AccessionNumber Вектор символов, задающий уникальный алфавитно-цифровой идентификатор для записи последовательности.
PartialSeqValueДвухэлементный массив целых чисел, содержащих положения начала и конца подпоследовательности [StartAA, EndAA] это задает подпоследовательность, чтобы получить. StartAA целое число между 1 и EndAA; EndAA целое число между StartAA и длина последовательности.
ToFileValue Вектор символов, задающий или имя файла или путь и имя файла для того, чтобы сохранить данные GenPept. Если вы задаете только имя файла, файл сохранен в MATLAB® Current Folder.
FileFormatValueВектор символов, задающий формат для получения информации о последовательности. Выбор:
  • 'Genpept' — Значение по умолчанию, когда SequenceOnlyValue false.

  • 'FASTA' — Значение по умолчанию, когда SequenceOnlyValue true.

Когда 'FASTA', затем Data содержит только два поля, Header и Sequence.

SequenceOnlyValue

Управляет возвратом только последовательности как символьный массив. Выбором является true или false (значение по умолчанию).

TimeOutValueТайм-аут связи в секундах в виде положительной скалярной величины. Значение по умолчанию равняется 5. Для получения дополнительной информации смотрите здесь.

Описание

getgenpept получает белок (аминокислота) информация о последовательности от базы данных GenPept, которая является переводом последовательностей нуклеотида в базе данных GenBank® и обеспечена Национальным Центром информации о Биотехнологии (NCBI).

Примечание

NCBI изменил название их поисковой системы белка от GenPept до Белка Entrez. Однако имена функций в программном обеспечении Bioinformatics Toolbox™ (getgenpept и genpeptread) неизменное представление все еще используемого формата отчета GenPept. Для получения дополнительной информации о данных GenPept посетите https://www.ncbi.nlm.nih.gov/home/about/policies.shtml.

Data = getgenpept(AccessionNumber) поиски инвентарного номера в базе данных GenPept и возвращают Data, структура MATLAB, содержащая информацию для последовательности.

Совет

Если ошибка происходит при получении GenPept-отформатированной информации попытайтесь повторно выполнить запрос. Ошибки могут произойти из-за проблем интернет-соединения, которые не связаны с записью GenPept.

getgenpept(AccessionNumber) информация об отображениях в командном окне MATLAB, не возвращая данные в переменную. Отображенной информацией являются только гиперссылки на URL, используемые, чтобы искать и получить данные.

getgenpept (..., 'PropertyName', PropertyValue, ...) вызовы getgenpept с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

Data = getgenpept(..., 'PartialSeq', PartialSeqValue, ...) возвращает заданную подпоследовательность в Sequence поле структуры MATLAB. PartialSeqValue двухэлементный массив целых чисел, содержащих положения начала и конца подпоследовательности [StartAA, EndAA]. StartAA целое число между 1 и EndAA; EndAA целое число между StartAA и длина последовательности.

Data = getgenpept(..., 'ToFile', ToFileValue, ...) сохраняет данные, возвращенные от базы данных GenPept до файла. ToFileValue вектор символов, задающий или имя файла или путь и имя файла для того, чтобы сохранить данные GenPept. Если вы задаете только имя файла, файл сохранен в Текущую папку MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого это перезаписывает содержимое существующего файла без предупреждения.

Совет

Можно считать GenPept-отформатированный файл назад в MATLAB с помощью genpeptread функция.

Data = getgenpept(..., 'FileFormat', FileFormatValue, ...) возвращает последовательность в заданном формате. Выбором является 'GenPept' или 'FASTA'. Когда 'FASTA', затем Data содержит только два поля, Header и Sequence. 'GenPept' значение по умолчанию когда SequenceOnlyValue false. 'FASTA' значение по умолчанию когда SequenceOnlyValue true.

Data = getgenpept(..., 'SequenceOnly', SequenceOnlyValue, ...) возвращает только последовательность в Data, символьный массив. Выбором является true или false (значение по умолчанию).

Примечание

Если вы используете 'SequenceOnly' и 'ToFile' свойства вместе, выход всегда является FASTA-отформатированным файлом.

Data = getgenpept(..., 'TimeOut, TimeOutValue, ...) устанавливает тайм-аут связи получать данные от базы данных GenPept.

Примеры

Пример 23. Получение последовательности пептида

Получать последовательность для человеческого приемника инсулина и хранить его в структуре, SeqВ Командном Окне MATLAB введите:

Seq = getgenpept('AAA59174')

Seq = 

                LocusName: 'AAA59174'
      LocusSequenceLength: '1382'
     LocusNumberofStrands: ''
            LocusTopology: 'linear'
        LocusMoleculeType: ''
     LocusGenBankDivision: 'PRI'
    LocusModificationDate: '06-JAN-1995'
               Definition: 'insulin receptor precursor.'
                Accession: 'AAA59174'
                  Version: 'AAA59174.1'
                       GI: '307070'
                  Project: []
                 DBSource: 'locus HUMINSR accession M10051.1'
                 Keywords: ''
                   Source: 'Homo sapiens (human)'
           SourceOrganism: [4x65 char]
                Reference: {[1x1 struct]}
                  Comment: [14x67 char]
                 Features: [40x64 char]
                 Sequence: [1x1382 char]
                SearchURL: [1x104 char]
              RetrieveURL: [1x92 char]
Пример 24. Получение частичной последовательности пептида

Путем рассмотрения Features поле структуры, можно решить, что подобная фурину область повторений является положениями 234 - 281. Получать только подобную фурину область повторений из последовательности для человеческого приемника инсулина и хранить его в структуре, FurВ Командном Окне MATLAB введите:

Fur = getgenpept('AAA59174','PARTIALSEQ',[234,281]);

Вопросы совместимости

развернуть все

Поведение изменяется в R2019a

Смотрите также

| | |

Представлено до R2006a
Для просмотра документации необходимо авторизоваться на сайте