exponenta event banner

aa2nt

Преобразование аминокислотной последовательности в нуклеотидную последовательность

Синтаксис

SeqNT = aa2nt(SeqAA)
SeqNT = aa2nt(SeqAA, ...'GeneticCode', GeneticCodeValue, ...)
SeqNT = aa2nt(SeqAA, ...'Alphabet' AlphabetValue, ...)

Входные аргументы

SeqAA

Одно из следующих:

Примеры: 'ARN' или [1 2 3]

GeneticCodeValue

Целое число, символьный вектор или строка, указывающая номер генетического кода или имя кода из таблицы Генетический код. По умолчанию: 1 или 'Standard'.

Совет

При использовании кодового имени можно усечь имя до первых двух букв имени.

AlphabetValue

Символьный вектор или строка, задающая нуклеотидный алфавит. Возможны следующие варианты:

  • 'DNA' (по умолчанию) - использует символы A, C, G, и T.

  • 'RNA' - Использует символы A, C, G, и U.

Выходные аргументы

SeqNTНуклеотидная последовательность, определяемая символьным вектором буквенных кодов.

Описание

SeqNT = aa2nt(SeqAA) преобразует аминокислотную последовательность, указанную SeqAA, к нуклеотидной последовательности, возвращенной в SeqNT, используя стандартный генетический код.

В общем, картирование от аминокислоты к нуклеотидному кодону не является картированием один к одному. Для аминокислот с множественными возможными нуклеотидными кодонами эта функция случайным образом выбирает кодон, соответствующий этой конкретной аминокислоте. Для неоднозначных символов B и Z, одна из аминокислот, соответствующих букве, выбирается случайным образом, а затем последовательность кодонов выбирается случайным образом. Для многозначного персонажа Xпоследовательность кодонов выбирается случайным образом из всех возможностей.

SeqNT = aa2nt(SeqAA, ...'PropertyName', PropertyValue, ...) требования aa2nt с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

SeqNT = aa2nt(SeqAA, ...'GeneticCode', GeneticCodeValue, ...) определяет генетический код для использования при преобразовании аминокислотной последовательности в нуклеотидную последовательность. GeneticCodeValue может быть целым числом, символьным вектором или строкой, указывающей кодовый номер или кодовое имя из таблицы Генетический код. По умолчанию: 1 или 'Standard'. Картирование аминокислотно-нуклеотидного кодона для стандартного генетического кода показано в таблице Стандартный генетический код.

Совет

При использовании кодового имени можно усечь имя до первых двух букв имени.

SeqNT = aa2nt(SeqAA, ...'Alphabet' AlphabetValue, ...) задает нуклеотидный алфавит. AlphabetValue может быть 'DNA', в котором используются символы A, C, G, и T, или 'RNA', в котором используются символы A, C, G, и U. По умолчанию: 'DNA'.

Генетический код

Кодовый номерКодовое имя
1Standard
2Vertebrate Mitochondrial
3Yeast Mitochondrial
4Mold, Protozoan, Coelenterate Mitochondrial, и Mycoplasma/Spiroplasma
5Invertebrate Mitochondrial
6Ciliate, Dasycladacean, и Hexamita Nuclear
9Echinoderm Mitochondrial
10Euplotid Nuclear
11Bacterial и Plant Plastid
12Alternative Yeast Nuclear
13Ascidian Mitochondrial
14Flatworm Mitochondrial
15Blepharisma Nuclear
16Chlorophycean Mitochondrial
21Trematode Mitochondrial
22Scenedesmus Obliquus Mitochondrial
23Thraustochytrium Mitochondrial

Стандартный генетический код

Название аминокислотыАминокислотный кодНуклеотидный кодон
Аланин AGCT GCC GCA GCG
АргининRCGT CGC CGA CGG AGA AGG
АспарагинNAAT AAC
Аспарагиновая кислота (аспартат) DGAT GAC
ЦистеинCTGT TGC
ГлютаминQCAA CAG
Глутаминовая кислота (глутамат) EGAA GAG
ГлицинGGGT GGC GGA GGG
ГистидинHCAT CAC
ИзолейцинIATT ATC ATA
ЛейцинLTTA TTG CTT CTC CTA CTG
ЛизинKAAA AAG
МетионинMATG
ФенилаланинFTTT TTC
Пролин PCCT CCC CCA CCG
СеринSTCT TCC TCA TCG AGT AGC
ТреонинTACT ACC ACA ACG
ТриптофанWTGG
ТирозинYTAT, TAC
ВалинVGTT GTC GTA GTG
Аспарагин или аспарагиновая кислота (аспартат) B Случайный кодон из D и N
Глутамин или глутаминовая кислота (глутамат) ZСлучайный кодон из E и Q
Неизвестная аминокислота (любая аминокислота) XСлучайный кодон
Остановка перевода *TAA TAG TGA
Разрыв неопределенной длины ----
Неизвестный символ (любой символ или символ, отсутствующий в таблице) ????

Примеры

свернуть все

Создать аминокислотную последовательность.

seq = randseq(20,'alphabet','amino')
seq = 
'TYNYMRQLVVDVVITNHYSV'

Преобразуйте его в нуклеотидную последовательность, используя стандартный генетический код.

aa2nt(seq)
ans = 
'ACATATAACTACATGAGACAGCTTGTAGTTGACGTTGTCATTACTAACCACTATAGCGTT'

Преобразуйте его, используя митохондриальный генетический код позвоночного.

aa2nt(seq,'GeneticCode',2)
ans = 
'ACCTATAACTACATACGCCAACTCGTAGTGGATGTAGTAATTACTAATCACTATTCGGTT'

Преобразуйте, используя эхинодермовый митохондриальный генетический код и алфавит РНК.

aa2nt(seq,'GeneticCode','ec','Alphabet','RNA')
ans = 
'ACGUAUAACUACAUGCGGCAGUUAGUUGUCGACGUCGUGAUUACGAACCAUUAUAGUGUC'
Представлен до R2006a