aa2nt

Преобразуйте последовательность аминокислот в последовательность нуклеотида

Синтаксис

SeqNT = aa2nt(SeqAA)
SeqNT = aa2nt(SeqAA, ...'GeneticCode', GeneticCodeValue, ...)
SeqNT = aa2nt(SeqAA, ...'Alphabet' AlphabetValue, ...)

Входные параметры

SeqAA

Одно из следующего:

  • Вектор символов или строка однобуквенных кодов, задающих последовательность аминокислот. Для допустимых алфавитных кодов см. таблицу Mapping Amino Acid Letter Codes to Integers. Неизвестные символы сопоставлены с 0.

  • Вектор - строка из целых чисел, задающих последовательность аминокислот. Для допустимых целых чисел см. таблицу Mapping Amino Acid Integers to Letter Codes.

  • Структура MATLAB®, содержащая поле Sequence, которое содержит последовательность аминокислот, такой, как возвращено fastaread, getgenpept, genpeptread, getpdb или pdbread.

Примеры: 'ARN' или [1 2 3]

GeneticCodeValue

Целое число, вектор символов или строка, задающая номер генетического кода или кодовое название из таблицы Genetic Code. Значением по умолчанию является 1 или 'Standard'.

Совет

Если вы используете кодовое название, можно обрезать имя к первым двум буквам имени.

AlphabetValue

Вектор символов или строка, задающая алфавит нуклеотида. Выбор:

  • 'DNA' (значение по умолчанию) — Использование символы A, C, G и T.

  • 'RNA' — Использует символы A, C, G и U.

Выходные аргументы

SeqNTПоследовательность нуклеотида задана вектором символов алфавитных кодов.

Описание

SeqNT = aa2nt(SeqAA) преобразовывает последовательность аминокислот, заданную SeqAA, к последовательности нуклеотида, возвращенной в SeqNT, с помощью стандартного генетического кода.

В целом отображение от аминокислоты до кодона нуклеотида не является взаимно-однозначным отображением. Для аминокислот с несколькими возможными кодонами нуклеотида эта функция случайным образом выбирает кодон, соответствующий той конкретной аминокислоте. Для неоднозначных символов B и Z, одна из аминокислот, соответствующих букве, выбраны случайным образом, и затем последовательность кодона выбрана случайным образом. Для неоднозначного символьного X последовательность кодона выбрана случайным образом из всех возможностей.

SeqNT = aa2nt(SeqAA, ...'PropertyName', PropertyValue, ...) вызывает aa2nt с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

SeqNT = aa2nt(SeqAA, ...'GeneticCode', GeneticCodeValue, ...) задает генетический код, чтобы использовать при преобразовании последовательности аминокислот в последовательность нуклеотида. GeneticCodeValue может быть целым числом, вектором символов или строкой, задающей номер кода или кодовое название из таблицы Genetic Code. Значением по умолчанию является 1 или 'Standard'. Аминокислоту к отображению кодона нуклеотида для Стандартного генетического кода показывают в таблице Standard Genetic Code.

Совет

Если вы используете кодовое название, можно обрезать имя к первым двум буквам имени.

SeqNT = aa2nt(SeqAA, ...'Alphabet' AlphabetValue, ...) задает алфавит нуклеотида. AlphabetValue может быть 'DNA', который использует символы A, C, G, и T или 'RNA', который использует символы A, C, G и U. Значением по умолчанию является 'DNA'.

Генетический код

Номер кодаКодовое название
1Standard
2Vertebrate Mitochondrial
3Yeast Mitochondrial
4Mold, Protozoan, Coelenterate Mitochondrial и Mycoplasma/Spiroplasma
5Invertebrate Mitochondrial
6Ciliate, Dasycladacean и Hexamita Nuclear
9Echinoderm Mitochondrial
10Euplotid Nuclear
11Bacterial и Plant Plastid
12Alternative Yeast Nuclear
13Ascidian Mitochondrial
14Flatworm Mitochondrial
15Blepharisma Nuclear
16Chlorophycean Mitochondrial
21Trematode Mitochondrial
22Scenedesmus Obliquus Mitochondrial
23Thraustochytrium Mitochondrial

Стандартный генетический код

Имя аминокислотыКод аминокислотыКодон нуклеотида
Аланин AGCT GCC GCA GCG
АргининRCGT CGC CGA CGG AGA AGG
АспарагинNAAT AAC
Кислота аспарагиновой кислоты (Аспартат) DGAT GAC
ЦистеинCTGT TGC
GlutamineQCAA CAG
Глутаминовая кислота (Глутамат) EGAA GAG
ГлицинGGGT GGC GGA GGG
ГистидинHCAT CAC
ИзолейцинIATT ATC ATA
ЛейцинLTTA TTG CTT CTC CTA CTG
ЛизинKAAA AAG
МетионинMATG
ФенилаланинFTTT TTC
Пролин PCCT CCC CCA CCG
СеринSTCT TCC TCA TCG AGT AGC
ТреонинTACT ACC ACA ACG
ТриптофанWTGG
ТирозинYTAT, TAC
ValineVGTT GTC GTA GTG
Аспарагин или кислота Аспарагиновой кислоты (Аспартат) B Случайный кодон от D и N
Glutamine или Glutamic acid (Глутамат) ZСлучайный кодон от E и Q
Неизвестная аминокислота (любая аминокислота) XСлучайный кодон
Остановка перевода *TAA TAG TGA
Разрыв неопределенной длины ----
Неизвестный символ (любой символ или символ не в таблице) ????

Примеры

свернуть все

Создайте последовательность аминокислот.

seq = randseq(20,'alphabet','amino')
seq = 
'TYNYMRQLVVDVVITNHYSV'

Преобразуйте его в последовательность нуклеотида с помощью стандартного генетического кода.

aa2nt(seq)
ans = 
'ACATATAACTACATGAGACAGCTTGTAGTTGACGTTGTCATTACTAACCACTATAGCGTT'

Преобразуйте его с помощью Позвоночного Митохондриального генетического кода.

aa2nt(seq,'GeneticCode',2)
ans = 
'ACCTATAACTACATACGCCAACTCGTAGTGGATGTAGTAATTACTAATCACTATTCGGTT'

Преобразуйте использование Иглокожего Митохондриальный генетический код и алфавит RNA.

aa2nt(seq,'GeneticCode','ec','Alphabet','RNA')
ans = 
'ACGUAUAACUACAUGCGGCAGUUAGUUGUCGACGUCGUGAUUACGAACCAUUAUAGUGUC'

Смотрите также

| | | | | |

Представлено до R2006a