Получите информацию о последовательности из базы данных GenBank
Data = getgenbank(AccessionNumber)
getgenbank(AccessionNumber)
Data = getgenbank(...,
'PartialSeq', PartialSeqValue, ...)
Data = getgenbank(...,
'ToFile', ToFileValue, ...)
Data = getgenbank(...,
'FileFormat', FileFormatValue, ...)
Data = getgenbank(...,
'SequenceOnly', SequenceOnlyValue, ...)
Data = getgenbank(...,
'TimeOut', TimeOutValue, ...)
AccessionNumber | Вектор символов или строка, задающая уникальный алфавитно-цифровой идентификатор для записи последовательности. |
PartialSeqValue | Двухэлементный массив целых чисел, содержащих положения начала и конца подпоследовательности [ это задает подпоследовательность, чтобы получить. StartBP целое число между 1 и EndBP. EndBP целое число между StartBP и длина последовательности. |
ToFileValue | Вектор символов или строка, задающая или имя файла или путь и имя файла для того, чтобы сохранить данные GenBank®. Если вы задаете только имя файла, файл сохранен в MATLAB® Current Folder. |
FileFormatValue | Вектор символов или строка, задающая формат для получения информации о последовательности. Выбор:
Когда |
SequenceOnlyValue | Управляет возвратом только последовательности как символьный массив. Выбором является |
TimeOutValue | Тайм-аут связи в секундах в виде положительной скалярной величины. Значение по умолчанию равняется 5. Для получения дополнительной информации смотрите здесь. |
getgenbank получает информацию о нуклеотиде из базы данных GenBank. Эта база данных обеспечена Национальным Центром информации о Биотехнологии (NCBI). Для получения дополнительной информации о базе данных GenBank, смотрите
поиски инвентарного номера в базе данных GenBank и возвращают Data = getgenbank(AccessionNumber)Data, структура MATLAB, содержащая информацию для последовательности.
Совет
Если ошибка происходит при получении GenBank-отформатированной информации попытайтесь повторно выполнить запрос. Ошибки могут произойти из-за проблем интернет-соединения, которые не связаны с записью GenBank.
getgenbank( информация об отображениях в командном окне MATLAB, не возвращая данные в переменную. Отображенной информацией являются только гиперссылки на URL, используемые, чтобы искать и получить данные.AccessionNumber)
getgenbank (..., ' вызовы PropertyName', PropertyValue, ...)getgenbank с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
возвращает заданную подпоследовательность в Data = getgenbank(...,
'PartialSeq', PartialSeqValue, ...)Sequence поле структуры MATLAB. PartialSeqValue двухэлементный массив целых чисел, содержащих положения начала и конца подпоследовательности [. StartBP, EndBP]StartBP целое число между 1 и EndBP. EndBP целое число между StartBP и длина последовательности.
сохраняет данные, возвращенные от базы данных GenBank до файла. Data = getgenbank(...,
'ToFile', ToFileValue, ...)ToFileValue вектор символов или строка, задающая или имя файла или путь и имя файла для того, чтобы сохранить данные GenBank. Если вы задаете только имя файла, файл сохранен в Текущую папку MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого это перезаписывает содержимое существующего файла без предупреждения.
Совет
Можно считать GenBank-отформатированный файл назад в MATLAB с помощью genbankread функция.
возвращает последовательность в заданном формате. Выбором является Data = getgenbank(...,
'FileFormat', FileFormatValue, ...)'GenBank' или 'FASTA'. Когда 'FASTA', затем Data содержит только два поля, Header и Sequence. 'GenBank' значение по умолчанию когда SequenceOnlyValue false. 'FASTA' значение по умолчанию когда SequenceOnlyValue true.
возвращает только последовательность в Data = getgenbank(...,
'SequenceOnly', SequenceOnlyValue, ...)Data, символьный массив. Выбором является true или false (значение по умолчанию).
Примечание
Если вы используете 'SequenceOnly' и 'ToFile' свойства вместе, выход всегда является FASTA-отформатированным файлом.
устанавливает тайм-аут связи (в секундах) получать данные от базы данных GenBank. Data = getgenbank(...,
'TimeOut', TimeOutValue, ...)
Получать последовательность из хромосомы 19 что коды для человеческого приемника инсулина и хранить его в структуре, SВ Командном Окне MATLAB введите:
S = getgenbank('M10051')
S =
LocusName: 'HUMINSR'
LocusSequenceLength: '4723'
LocusNumberofStrands: ''
LocusTopology: 'linear'
LocusMoleculeType: 'mRNA'
LocusGenBankDivision: 'PRI'
LocusModificationDate: '06-JAN-1995'
Definition: 'Human insulin receptor mRNA, complete cds.'
Accession: 'M10051'
Version: 'M10051.1'
GI: '186439'
Project: []
DBLink: []
Keywords: 'insulin receptor; tyrosine kinase.'
Segment: []
Source: 'Homo sapiens (human)'
SourceOrganism: [4x65 char]
Reference: {[1x1 struct]}
Comment: [14x67 char]
Features: [51x74 char]
CDS: [1x1 struct]
Sequence: [1x4723 char]
SearchURL: [1x67 char]
RetrieveURL: [1x101 char] Путем рассмотрения Features поле структуры возвратилось, можно решить, что последовательность кодирования является положениями 139 - 4 287. Получать только последовательность кодирования из хромосомы 19 что коды для человеческого приемника инсулина и хранить его в структуре, CDSВ Командном Окне MATLAB введите:
CDS = getgenbank('M10051','PARTIALSEQ',[139,4287]);genbankread | getembl | getgenpept | getpdb | seqviewer