aa2nt

Преобразуйте аминокислотную последовательность в нуклеотидную

Синтаксис

SeqNT = aa2nt(SeqAA)
SeqNT = aa2nt(SeqAA, ...'GeneticCode', GeneticCodeValue, ...)
SeqNT = aa2nt(SeqAA, ...'Alphabet' AlphabetValue, ...)

Входные параметры

SeqAA

Одно из следующих:

Примеры: 'ARN' или [1 2 3]

GeneticCodeValue

Целое число, вектор символов или строка, задающая номер генетического кода или имя кода из таблицы Генетический код. По умолчанию это 1 или 'Standard'.

Совет

Если вы используете имя кода, можно обрезать имя до первых двух букв имени.

AlphabetValue

Вектор символов или строка, задающая нуклеотидный алфавит. Варианты:

  • 'DNA' (по умолчанию) - Использует символы A, C, G, и T.

  • 'RNA' - Использует символы A, C, G, и U.

Выходные аргументы

SeqNTНуклеотидная последовательность, заданная вектором символов буквы кодов.

Описание

SeqNT = aa2nt(SeqAA) преобразует аминокислотную последовательность, заданную как SeqAA, в нуклеотидную последовательность, возвращенную в SeqNT, с использованием стандартного генетического кода.

В целом, отображение от аминокислоты к нуклеотидному кодону не является взаимно-однозначным отображением. Для аминокислот с несколькими возможными нуклеотидными кодонами эта функция случайным образом выбирает кодон, соответствующий этой конкретной аминокислоте. Для неоднозначных символов B и Zодну из аминокислот, соответствующих букве, выбирают случайным образом, а затем случайным образом выбирают кодоновую последовательность. Для неоднозначного символа Xпоследовательность кодона выбирают случайным образом из всех возможностей.

SeqNT = aa2nt (SeqAA... 'PropertyName', PropertyValue, ...) вызывает aa2nt с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

SeqNT = aa2nt(SeqAA, ...'GeneticCode', GeneticCodeValue, ...) задает генетический код, используемый при преобразовании аминокислотной последовательности в нуклеотидную последовательность. GeneticCodeValue может быть целым числом, вектором символов или строкой, задающей номер кода или имя кода из таблицы Генетический код. По умолчанию это 1 или 'Standard'. Аминокислота к нуклеотидному кодону, отображению для Стандартного генетического кода, показана в таблице Стандартного генетического кода.

Совет

Если вы используете имя кода, можно обрезать имя до первых двух букв имени.

SeqNT = aa2nt(SeqAA, ...'Alphabet' AlphabetValue, ...) задает нуклеотидный алфавит. AlphabetValue можно 'DNA', который использует символы A, C, G, и T, или 'RNA', который использует символы A, C, G, и U. По умолчанию это 'DNA'.

Генетический код

Кодовый номерКодовое имя
1Standard
2Vertebrate Mitochondrial
3Yeast Mitochondrial
4Mold, Protozoan, Coelenterate Mitochondrial, и Mycoplasma/Spiroplasma
5Invertebrate Mitochondrial
6Ciliate, Dasycladacean, и Hexamita Nuclear
9Echinoderm Mitochondrial
10Euplotid Nuclear
11Bacterial и Plant Plastid
12Alternative Yeast Nuclear
13Ascidian Mitochondrial
14Flatworm Mitochondrial
15Blepharisma Nuclear
16Chlorophycean Mitochondrial
21Trematode Mitochondrial
22Scenedesmus Obliquus Mitochondrial
23Thraustochytrium Mitochondrial

Стандартный генетический код

Имя аминокислотыАминокислотный кодНуклеотидный кодон
Аланин AGCT GCC GCA GCG
АргининRCGT CGC CGA CGG AGA AGG
АспарагинNAAT AAC
Аспарагиновая кислота (аспартат) DGAT GAC
ЦистеинCTGT TGC
ГлютаминQCAA CAG
Глутаминовая кислота (глутамат) EGAA GAG
ГлицинGGGT GGC GGA GGG
ГистидинHCAT CAC
ИзолейцинIATT ATC ATA
ЛейцинLTTA TTG CTT CTC CTA CTG
ЛизинKAAA AAG
МетионинMATG
ФенилаланинFTTT TTC
Пролин PCCT CCC CCA CCG
СеринSTCT TCC TCA TCG AGT AGC
ТреонинTACT ACC ACA ACG
ТриптофанWTGG
ТирозинYTAT, TAC
ВалинVGTT GTC GTA GTG
Аспарагин или аспарагиновая кислота (аспартат) B Случайный кодон из D и N
Глутамин или глутаминовая кислота (глутамат) ZСлучайный кодон из E и Q
Неизвестная аминокислота (любая аминокислота) XСлучайный кодон
Остановка перевода *TAA TAG TGA
Зазор неопределенной длины ----
Неизвестный символ (любой символ или символ, не указанный в таблице) ????

Примеры

свернуть все

Создайте аминокислотную последовательность.

seq = randseq(20,'alphabet','amino')
seq = 
'TYNYMRQLVVDVVITNHYSV'

Преобразуйте его в нуклеотидную последовательность с помощью стандартного генетического кода.

aa2nt(seq)
ans = 
'ACATATAACTACATGAGACAGCTTGTAGTTGACGTTGTCATTACTAACCACTATAGCGTT'

Преобразуйте его с помощью митохондриального генетического кода позвоночных.

aa2nt(seq,'GeneticCode',2)
ans = 
'ACCTATAACTACATACGCCAACTCGTAGTGGATGTAGTAATTACTAATCACTATTCGGTT'

Преобразуйте с использованием митохондриального генетического кода Echinoderm и алфавита РНК.

aa2nt(seq,'GeneticCode','ec','Alphabet','RNA')
ans = 
'ACGUAUAACUACAUGCGGCAGUUAGUUGUCGACGUCGUGAUUACGAACCAUUAUAGUGUC'
Представлено до R2006a