Преобразование нуклеотидной последовательности в аминокислотную последовательность
SeqAA = nt2aa(SeqNT)
SeqAA = nt2aa(..., 'Frame', FrameValue, ...)
SeqAA = nt2aa(..., 'GeneticCode', GeneticCodeValue, ...)
SeqAA = nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue, ...)
SeqAA = nt2aa(..., 'ACGTOnly', ACGTOnlyValue, ...)
SeqNT | Одно из следующих:
Примечание Дефисы действительны только в том случае, если кодон, которому он принадлежит, представляет собой пробел, то есть кодон содержит все дефисы. Пример: Совет Не использовать последовательность с дефисами при указании |
FrameValue | Целое число, символьный вектор или строка, задающая рамку считывания в нуклеотидной последовательности. Варианты: Если |
GeneticCodeValue | Целое число, символьный вектор или строка, указывающая номер генетического кода или имя кода из таблицы Генетический код. По умолчанию: Совет При использовании кодового имени можно усечь имя до первых двух букв имени. |
AlternativeStartCodonsValue | Контролирует трансляцию альтернативных кодонов. Варианты: |
ACGTOnlyValue | Управляет поведением неоднозначных нуклеотидных символов (
|
SeqAA | Аминокислотная последовательность, определяемая символьным вектором однобуквенных кодов. |
преобразует нуклеотидную последовательность, указанную SeqAA = nt2aa(SeqNT)SeqNT, к аминокислотной последовательности, возвращенной в SeqAA, используя стандартный генетический код.
требования SeqAA = nt2aa(SeqNT, ...'PropertyName', PropertyValue, ...)nt2aa с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:
преобразует нуклеотидную последовательность для конкретной рамки считывания в аминокислотную последовательность. Варианты: SeqAA = nt2aa(..., 'Frame', FrameValue, ...)1, 2, 3, или 'all'. По умолчанию: 1. Если FrameValue является 'all', затем вывод SeqAA является массивом ячеек 3 на 1.
определяет генетический код для использования при преобразовании нуклеотидной последовательности в аминокислотную последовательность. SeqAA = nt2aa(..., 'GeneticCode', GeneticCodeValue, ...)GeneticCodeValue может быть целым числом, символьным вектором или строкой, указывающей кодовый номер или кодовое имя из таблицы Генетический код. По умолчанию: 1 или 'Standard'. Картирование аминокислотно-нуклеотидного кодона для стандартного генетического кода показано в таблице Стандартный генетический код.
Совет
При использовании кодового имени можно усечь имя до первых двух букв имени.
контролирует трансляцию альтернативных стартовых кодонов. По умолчанию SeqAA = nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue, ...)AlternativeStartCodonsValue имеет значение trueи если первый кодон последовательности является известным альтернативным стартовым кодоном, кодон транслируется в метионин.
Если для этой опции установлено значение false, то альтернативный стартовый кодон в начале последовательности транслируется в его соответствующую аминокислоту в генетическом коде, который вы указываете, который не обязательно может быть метионином. Например, в митохондриальном генетическом коде человека AUA и AUU известны альтернативные стартовые кодоны. Для получения дополнительной информации об альтернативных стартовых кодонах посетите https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=t#SG1.
Дополнительные сведения об альтернативных стартовых кодонах см. в разделе:
Генетический код
| Кодовый номер | Кодовое имя |
|---|---|
1 | Standard |
2 | Vertebrate Mitochondrial |
3 | Yeast Mitochondrial |
4 | Mold, Protozoan, Coelenterate Mitochondrial, и Mycoplasma/Spiroplasma |
5 | Invertebrate Mitochondrial |
6 | Ciliate, Dasycladacean, и Hexamita Nuclear |
9 | Echinoderm Mitochondrial |
10 | Euplotid Nuclear |
11 | Bacterial и Plant Plastid |
12 | Alternative Yeast Nuclear |
13 | Ascidian Mitochondrial |
14 | Flatworm Mitochondrial |
15 | Blepharisma Nuclear |
16 | Chlorophycean Mitochondrial |
21 | Trematode Mitochondrial |
22 | Scenedesmus Obliquus Mitochondrial |
23 | Thraustochytrium Mitochondrial |
Стандартный генетический код
| Название аминокислоты | Аминокислотный код | Нуклеотидный кодон |
|---|---|---|
| Аланин | A | GCT GCC GCA GCG |
| Аргинин | R | CGT CGC CGA CGG AGA AGG |
| Аспарагин | N | AAT AAC |
| Аспарагиновая кислота (аспартат) | D | GAT GAC |
| Цистеин | C | TGT TGC |
| Глютамин | Q | CAA CAG |
| Глутаминовая кислота (глутамат) | E | GAA GAG |
| Глицин | G | GGT GGC GGA GGG |
| Гистидин | H | CAT CAC |
| Изолейцин | I | ATT ATC ATA |
| Лейцин | L | TTA TTG CTT CTC CTA CTG |
| Лизин | K | AAA AAG |
| Метионин | M | ATG |
| Фенилаланин | F | TTT TTC |
| Пролин | P | CCT CCC CCA CCG |
| Серин | S | TCT TCC TCA TCG AGT AGC |
| Треонин | T | ACT ACC ACA ACG |
| Триптофан | W | TGG |
| Тирозин | Y | TAT, TAC |
| Валин | V | GTT GTC GTA GTG |
| Аспарагин или аспарагиновая кислота (аспартат) | B | Случайный кодон из D и N |
| Глутамин или глутаминовая кислота (глутамат) | Z | Случайный кодон из E и Q |
| Неизвестная аминокислота (любая аминокислота) | X | Случайный кодон |
| Остановка перевода | * | TAA TAG TGA |
| Разрыв неопределенной длины | - | --- |
| Неизвестный символ (любой символ или символ, отсутствующий в таблице) | ? | ??? |
управляет поведением неоднозначных нуклеотидных символов (SeqAA = nt2aa(..., 'ACGTOnly', ACGTOnlyValue, ...)R, Y, K, M, S, W, B, D, H, V, и N) и неизвестные символы. ACGTOnlyValue может быть true (по умолчанию) или false. Если true, то ошибки функции, если присутствуют какие-либо из этих символов. Если false, то функция пытается разрешить неоднозначности. Если он не может, он возвращается X для пораженного кодона.
Используйте getgenbank функция извлечения геномной информации для митохондриона человека из базы данных GenBank ® и сохранения ее в структуре MATLAB.
mitochondria = getgenbank('NC_012920')
mitochondria =
LocusName: 'NC_012920'
LocusSequenceLength: '16569'
LocusNumberofStrands: ''
LocusTopology: 'circular'
LocusMoleculeType: 'DNA'
LocusGenBankDivision: 'PRI'
LocusModificationDate: '05-MAR-2010'
Definition: 'Homo sapiens mitochondrion, complete genome.'
Accession: 'NC_012920 AC_000021'
Version: 'NC_012920.1'
GI: '251831106'
Project: []
DBLink: 'Project:30353'
Keywords: []
Segment: []
Source: 'mitochondrion Homo sapiens (human)'
SourceOrganism: [4x65 char]
Reference: {1x7 cell}
Comment: [24x67 char]
Features: [933x74 char]
CDS: [1x13 struct]
Sequence: [1x16569 char]
SearchURL: [1x70 char]
RetrieveURL: [1x104 char]Определите название и местоположение первого гена в митохондрионе человека.
mitochondria.CDS(1).gene
ans = ND1
mitochondria.CDS(1).location
ans = 3307..4262
Извлекают последовательность для гена ND1 из нуклеотидной последовательности.
ND1gene = mitochondria.Sequence(3307:4262);
Преобразование гена ND1 в геноме митохондрий человека в аминокислотную последовательность с использованием митохондриального генетического кода позвоночных.
protein1 = nt2aa(ND1gene,'GeneticCode', 2);
Используйте getgenpept функция извлечения той же аминокислотной последовательности из базы данных GenPept.
protein2 = getgenpept('YP_003024026', 'SequenceOnly', true);
Используйте isequal функция сравнения двух аминокислотных последовательностей.
isequal (protein1, protein2)
ans =
1Используйте getgenbank функция извлечения нуклеотидной последовательности для митохондриона человека из базы данных GenBank.
mitochondria = getgenbank('NC_012920');
Определите название и местоположение второго гена в митохондрионе человека.
mitochondria.CDS(2).gene
ans = ND2
mitochondria.CDS(2).location
ans = 4470..5511
Извлекают последовательность для гена ND2 из нуклеотидной последовательности.
ND2gene = mitochondria.Sequence(4470:5511);
Преобразование гена ND2 в геноме митохондрий человека в аминокислотную последовательность с использованием митохондриального генетического кода позвоночных.
protein1 = nt2aa(ND2gene,'GeneticCode', 2);
Примечание
В ND2gene нуклеотидная последовательность, первый кодон ATT, который переводится на M, в то время как последующие ATT кодоны транслируются в I. Если установить 'AlternativeStartCodons' кому false, то первый ATT кодон переводится в I, соответствующая аминокислота в митохондриальном генетическом коде позвоночного.
Используйте getgenpept функция извлечения той же аминокислотной последовательности из базы данных GenPept.
protein2 = getgenpept('YP_003024027', 'SequenceOnly', true);
Используйте isequal функция сравнения двух аминокислотных последовательностей.
isequal (protein1, protein2)
ans =
1Если имеется последовательность с неоднозначными или неизвестными нуклеотидными символами, можно установить 'ACGTOnly' свойство для false чтобы иметь nt2aa функция пытается разрешить их:
nt2aa('agttgccgacgcgcncar','ACGTOnly', false)
ans =
SCRRAQ
aa2nt | aminolookup | baselookup | codonbias | dnds | dndsml | geneticcode | isotopicdist | revgeneticcode | seqviewer