Получите информацию о последовательности из базы данных GenBank
Data
= getgenbank(AccessionNumber
)
getgenbank(AccessionNumber
)
Data
= getgenbank(...,
'PartialSeq', PartialSeqValue
, ...)
Data
= getgenbank(...,
'ToFile', ToFileValue
, ...)
Data
= getgenbank(...,
'FileFormat', FileFormatValue
, ...)
Data
= getgenbank(...,
'SequenceOnly', SequenceOnlyValue
, ...)
AccessionNumber | Вектор символов или строка, задающая уникальный алфавитно-цифровой идентификатор для записи последовательности. |
PartialSeqValue | Двухэлементный массив целых чисел, содержащих положения начала и конца подпоследовательности [ это задает подпоследовательность, чтобы получить. StartBP целое число между 1 и EndBP . EndBP целое число между StartBP и длина последовательности. |
ToFileValue | Вектор символов или строка, задающая или имя файла или путь и имя файла для того, чтобы сохранить данные GenBank®. Если вы задаете только имя файла, файл сохранен в MATLAB® Current Folder. |
FileFormatValue | Вектор символов или строка, задающая формат для получения информации о последовательности. Выбор:
Когда |
SequenceOnlyValue | Управляет возвратом только последовательности как символьный массив. Выбором является |
getgenbank
получает информацию о нуклеотиде из базы данных GenBank. Эта база данных обеспечена Национальным Центром информации о Биотехнологии (NCBI). Для получения дополнительной информации о базе данных GenBank, смотрите
поиски инвентарного номера в базе данных GenBank и возвращают Data
= getgenbank(AccessionNumber
)Data
, структура MATLAB, содержащая информацию для последовательности.
Совет
Если ошибка происходит при получении GenBank-отформатированной информации попытайтесь повторно выполнить запрос. Ошибки могут произойти из-за проблем интернет-соединения, которые не связаны с записью GenBank.
getgenbank(
информация об отображениях в командном окне MATLAB, не возвращая данные в переменную. Отображенной информацией являются только гиперссылки на URL, используемые, чтобы искать и получить данные.AccessionNumber
)
getgenbank (..., '
вызовы PropertyName
', PropertyValue
, ...)getgenbank
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
возвращает заданную подпоследовательность в Data
= getgenbank(...,
'PartialSeq', PartialSeqValue
, ...)Sequence
поле структуры MATLAB. PartialSeqValue
двухэлементный массив целых чисел, содержащих положения начала и конца подпоследовательности [
. StartBP
, EndBP
]StartBP
целое число между 1 и EndBP
. EndBP
целое число между StartBP
и длина последовательности.
сохраняет данные, возвращенные от базы данных GenBank до файла. Data
= getgenbank(...,
'ToFile', ToFileValue
, ...)ToFileValue
вектор символов или строка, задающая или имя файла или путь и имя файла для того, чтобы сохранить данные GenBank. Если вы задаете только имя файла, файл сохранен в Текущую папку MATLAB. Функция не добавляет данные к существующему файлу. Вместо этого это перезаписывает содержимое существующего файла без предупреждения.
Совет
Можно считать GenBank-отформатированный файл назад в MATLAB с помощью genbankread
функция.
возвращает последовательность в заданном формате. Выбором является Data
= getgenbank(...,
'FileFormat', FileFormatValue
, ...)'GenBank'
или 'FASTA'
. Когда 'FASTA'
, затем Data
содержит только два поля, Header
и Sequence
. 'GenBank'
значение по умолчанию когда SequenceOnlyValue
false
. 'FASTA'
значение по умолчанию когда SequenceOnlyValue
true
.
возвращает только последовательность в Data
= getgenbank(...,
'SequenceOnly', SequenceOnlyValue
, ...)Data
, символьный массив. Выбором является true
или false
(значение по умолчанию).
Примечание
Если вы используете 'SequenceOnly'
и 'ToFile'
свойства вместе, выход всегда является FASTA-отформатированным файлом.
Получать последовательность из хромосомы 19 что коды для человеческого приемника инсулина и хранить его в структуре, S
В Командном Окне MATLAB введите:
S = getgenbank('M10051') S = LocusName: 'HUMINSR' LocusSequenceLength: '4723' LocusNumberofStrands: '' LocusTopology: 'linear' LocusMoleculeType: 'mRNA' LocusGenBankDivision: 'PRI' LocusModificationDate: '06-JAN-1995' Definition: 'Human insulin receptor mRNA, complete cds.' Accession: 'M10051' Version: 'M10051.1' GI: '186439' Project: [] DBLink: [] Keywords: 'insulin receptor; tyrosine kinase.' Segment: [] Source: 'Homo sapiens (human)' SourceOrganism: [4x65 char] Reference: {[1x1 struct]} Comment: [14x67 char] Features: [51x74 char] CDS: [1x1 struct] Sequence: [1x4723 char] SearchURL: [1x67 char] RetrieveURL: [1x101 char]
Путем рассмотрения Features
поле структуры возвратилось, можно решить, что последовательность кодирования является положениями 139 - 4 287. Получать только последовательность кодирования из хромосомы 19 что коды для человеческого приемника инсулина и хранить его в структуре, CDS
В Командном Окне MATLAB введите:
CDS = getgenbank('M10051','PARTIALSEQ',[139,4287]);
genbankread
| getembl
| getgenpept
| getpdb
| seqviewer