getgenbank

Получите информацию о последовательности из базы данных GenBank

Синтаксис

Data = getgenbank(AccessionNumber)
getgenbank(AccessionNumber)
Data = getgenbank(..., 'PartialSeq', PartialSeqValue, ...)
Data = getgenbank(..., 'ToFile', ToFileValue, ...)
Data = getgenbank(..., 'FileFormat', FileFormatValue, ...)
Data = getgenbank(..., 'SequenceOnly', SequenceOnlyValue, ...)

Аргументы

AccessionNumber Вектор символов или строка, задающая уникальный алфавитно-цифровой идентификатор для записи последовательности.
PartialSeqValueДвухэлементный массив целых чисел, содержащих запуск и конечные положения подпоследовательности [StartBP, EndBP] это задает подпоследовательность, чтобы получить. StartBP целое число между 1 и EndBP. EndBP целое число между StartBP и длина последовательности.
ToFileValue Вектор символов или строка, задающая или имя файла или путь и имя файла для того, чтобы сохранить данные GenBank®. Если вы задаете только имя файла, файл сохранен в MATLAB® Current Folder.
FileFormatValueВектор символов или строка, задающая формат для получения информации о последовательности. Выбор:
  • 'GenBank' — Значение по умолчанию, когда SequenceOnlyValue false.

  • 'FASTA' — Значение по умолчанию, когда SequenceOnlyValue true.

Когда 'FASTA', затем Data содержит только два поля, Header и Sequence.

SequenceOnlyValue

Управляет возвратом только последовательности как символьный массив. Выбором является true или false (значение по умолчанию).

Описание

getgenbank получает информацию о нуклеотиде из базы данных GenBank. Эта база данных обеспечена Национальным Центром информации о Биотехнологии (NCBI). Для получения дополнительной информации о базе данных GenBank, смотрите

Data = getgenbank(AccessionNumber) поиски инвентарного номера в базе данных GenBank и возвращают Data, структура MATLAB, содержащая информацию для последовательности.

Совет

Если ошибка происходит при получении GenBank-отформатированной информации попытайтесь повторно выполнить запрос. Ошибки могут произойти из-за проблем интернет-соединения, которые не связаны с записью GenBank.

getgenbank(AccessionNumber) информация об отображениях в Окне Команды MATLAB, не возвращая данные в переменную. Отображенной информацией являются только гиперссылки на URL, используемые, чтобы искать и получить данные.

getgenbank (..., 'PropertyName', PropertyValue, ...) вызовы getgenbank с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

Data = getgenbank(..., 'PartialSeq', PartialSeqValue, ...) возвращает заданную подпоследовательность в Sequence поле структуры MATLAB. PartialSeqValue двухэлементный массив целых чисел, содержащих запуск и конечные положения подпоследовательности [StartBP, EndBP]. StartBP целое число между 1 и EndBP. EndBP целое число между StartBP и длина последовательности.

Data = getgenbank(..., 'ToFile', ToFileValue, ...) сохраняет данные, возвращенные от базы данных GenBank до файла. ToFileValue вектор символов или строка, задающая или имя файла или путь и имя файла для того, чтобы сохранить данные GenBank. Если вы задаете только имя файла, файл сохранен в Текущую папку MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого это перезаписывает содержимое существующего файла без предупреждения.

Совет

Можно считать GenBank-отформатированный файл назад в MATLAB с помощью genbankread функция.

Data = getgenbank(..., 'FileFormat', FileFormatValue, ...) возвращает последовательность в заданном формате. Выбором является 'GenBank' или 'FASTA'. Когда 'FASTA', затем Data содержит только два поля, Header и Sequence. 'GenBank' значение по умолчанию когда SequenceOnlyValue false. 'FASTA' значение по умолчанию когда SequenceOnlyValue true.

Data = getgenbank(..., 'SequenceOnly', SequenceOnlyValue, ...) возвращает только последовательность в Data, символьный массив. Выбором является true или false (значение по умолчанию).

Примечание

Если вы используете 'SequenceOnly' и 'ToFile' свойства вместе, выход всегда является FASTA-отформатированным файлом.

Примеры

Пример 26. Получение последовательности RNA

Получать последовательность из хромосомы 19 что коды для человеческого приемника инсулина и хранить его в структуре, SВ Командном Окне MATLAB введите:

S = getgenbank('M10051')

S = 

                LocusName: 'HUMINSR'
      LocusSequenceLength: '4723'
     LocusNumberofStrands: ''
            LocusTopology: 'linear'
        LocusMoleculeType: 'mRNA'
     LocusGenBankDivision: 'PRI'
    LocusModificationDate: '06-JAN-1995'
               Definition: 'Human insulin receptor mRNA, complete cds.'
                Accession: 'M10051'
                  Version: 'M10051.1'
                       GI: '186439'
                  Project: []
                   DBLink: []
                 Keywords: 'insulin receptor; tyrosine kinase.'
                  Segment: []
                   Source: 'Homo sapiens (human)'
           SourceOrganism: [4x65 char]
                Reference: {[1x1 struct]}
                  Comment: [14x67 char]
                 Features: [51x74 char]
                      CDS: [1x1 struct]
                 Sequence: [1x4723 char]
                SearchURL: [1x67 char]
              RetrieveURL: [1x101 char]                            
Пример 27. Получение частичной последовательности RNA

Путем рассмотрения Features поле структуры возвратилось, можно решить, что последовательность кодирования является положениями 139 - 4 287. Получать только последовательность кодирования из хромосомы 19 что коды для человеческого приемника инсулина и хранить его в структуре, CDSВ Командном Окне MATLAB введите:

CDS = getgenbank('M10051','PARTIALSEQ',[139,4287]);

Вопросы совместимости

развернуть все

Поведение изменяется в R2019a

Смотрите также

| | | |

Представлено до R2006a

Для просмотра документации необходимо авторизоваться на сайте