Получите информацию о последовательности из базы данных GenBank
Data
= getgenbank(AccessionNumber
)
getgenbank(AccessionNumber
)
Data
= getgenbank(...,
'PartialSeq', PartialSeqValue
, ...)
Data
= getgenbank(...,
'ToFile', ToFileValue
, ...)
Data
= getgenbank(...,
'FileFormat', FileFormatValue
, ...)
Data
= getgenbank(...,
'SequenceOnly', SequenceOnlyValue
, ...)
AccessionNumber | Вектор символов или строка, задающая уникальный алфавитно-цифровой идентификатор для записи последовательности. |
PartialSeqValue | Двухэлементный массив целых чисел, содержащих запуск и конечные положения подпоследовательности , который задает подпоследовательность, чтобы получить. StartBP является целым числом между 1 и EndBP . EndBP является целым числом между StartBP и длиной последовательности. |
ToFileValue | Вектор символов или строка, задающая или имя файла или путь и имя файла для того, чтобы сохранить данные GenBank®. Если вы задаете только имя файла, файл сохранен в MATLAB® Current Folder. |
FileFormatValue | Вектор символов или строка, задающая формат для получения информации о последовательности. Выбор:
Когда |
SequenceOnlyValue | Управляет возвратом только последовательности как символьный массив. Выбором является |
getgenbank
получает информацию о нуклеотиде из базы данных GenBank. Эта база данных сохраняется Национальным Центром информации о Биотехнологии (NCBI). Для получения дополнительной информации о базе данных GenBank, смотрите
поиски инвентарного номера в базе данных GenBank и возвращают Data
= getgenbank(AccessionNumber
)Data
, структура MATLAB, содержащая информацию для последовательности.
Если ошибка происходит при получении GenBank-отформатированной информации попытайтесь повторно выполнить запрос. Ошибки могут произойти из-за проблем интернет-соединения, которые не связаны с записью GenBank.
getgenbank(
информация об отображениях в Окне Команды MATLAB, не возвращая данные в переменную. Отображенной информацией являются только гиперссылки на URL, используемые, чтобы искать и получить данные.AccessionNumber
)
вызывает getgenbank(..., 'PropertyName', PropertyValue, ...)
getgenbank
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
возвращает заданную подпоследовательность в поле Data
= getgenbank(...,
'PartialSeq', PartialSeqValue
, ...)Sequence
структуры MATLAB. PartialSeqValue
является двухэлементным массивом целых чисел, содержащих запуск и конечные положения подпоследовательности
. [StartBP, EndBP]
StartBP
является целым числом между 1 и EndBP
. EndBP
является целым числом между StartBP
и длиной последовательности.
сохраняет данные, возвращенные от базы данных GenBank до файла. Data
= getgenbank(...,
'ToFile', ToFileValue
, ...)ToFileValue
является вектором символов или строкой, задающей или имя файла или путь и имя файла для того, чтобы сохранить данные GenBank. Если вы задаете только имя файла, файл сохранен в Текущую папку MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого это перезаписывает содержимое существующего файла без предупреждения.
Можно считать GenBank-отформатированный файл назад в MATLAB с помощью функции genbankread
.
возвращает последовательность в заданном формате. Выбором является Data
= getgenbank(...,
'FileFormat', FileFormatValue
, ...)'GenBank'
или 'FASTA'
. Когда 'FASTA'
, затем Data
содержит только два поля, Header
и Sequence
. 'GenBank'
является значением по умолчанию, когда SequenceOnlyValue
является false
. 'FASTA'
является значением по умолчанию, когда SequenceOnlyValue
является true
.
возвращает только последовательность в Data
= getgenbank(...,
'SequenceOnly', SequenceOnlyValue
, ...)Data
, символьном массиве. Выбором является true
или false
(значение по умолчанию).
Если вы используете свойства 'SequenceOnly'
и 'ToFile'
вместе, вывод всегда является FASTA-отформатированным файлом.
Чтобы получить последовательность из хромосомы 19 что коды для человеческого приемника инсулина и сохранить его в структуре, S
, в Окне Команды MATLAB, вводит:
S = getgenbank('M10051') S = LocusName: 'HUMINSR' LocusSequenceLength: '4723' LocusNumberofStrands: '' LocusTopology: 'linear' LocusMoleculeType: 'mRNA' LocusGenBankDivision: 'PRI' LocusModificationDate: '06-JAN-1995' Definition: 'Human insulin receptor mRNA, complete cds.' Accession: 'M10051' Version: 'M10051.1' GI: '186439' Project: [] DBLink: [] Keywords: 'insulin receptor; tyrosine kinase.' Segment: [] Source: 'Homo sapiens (human)' SourceOrganism: [4x65 char] Reference: {[1x1 struct]} Comment: [14x67 char] Features: [51x74 char] CDS: [1x1 struct] Sequence: [1x4723 char] SearchURL: [1x67 char] RetrieveURL: [1x101 char]
Путем рассмотрения поля Features
возвращенной структуры можно решить, что последовательность кодирования является положениями 139 - 4 287. Чтобы получить только последовательность кодирования из хромосомы 19 что коды для человеческого приемника инсулина и сохранить его в структуре, CDS
, в Окне Команды MATLAB, вводит:
CDS = getgenbank('M10051','PARTIALSEQ',[139,4287]);
genbankread
| getembl
| getgenpept
| getpdb
| seqviewer