Преобразуйте последовательность нуклеотида в последовательность аминокислот
SeqAA = nt2aa(SeqNT)
SeqAA = nt2aa(...,
'Frame', FrameValue, ...)
SeqAA = nt2aa(..., 'GeneticCode', GeneticCodeValue, ...)
SeqAA = nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue,
...)
SeqAA = nt2aa(..., 'ACGTOnly', ACGTOnlyValue,
...)
SeqNT | Одно из следующего:
ПримечаниеДефисы допустимы, только если кодон, которому это принадлежит, представляет разрыв, то есть, кодон содержит все дефисы. Пример: СоветНе используйте последовательность с дефисами, если вы задаете |
FrameValue | Целое число, вектор символов или строка, задающая рамку считывания в последовательности нуклеотида. Выбором является Если |
GeneticCodeValue | Целое число, вектор символов или строка, задающая номер генетического кода или кодовое название из таблицы Genetic Code. Значением по умолчанию является СоветЕсли вы используете кодовое название, можно обрезать имя к первым двум буквам имени. |
AlternativeStartCodonsValue | Управляет переводом альтернативных кодонов. Выбором является |
ACGTOnlyValue | Управляет поведением неоднозначных символов нуклеотида (
|
SeqAA | Последовательность аминокислот задана вектором символов однобуквенных кодов. |
преобразовывает последовательность нуклеотида, заданную SeqAA = nt2aa(SeqNT)SeqNT, к последовательности аминокислот, возвращенной в SeqAA, с помощью стандартного генетического кода.
вызывает SeqAA = nt2aa(SeqNT, ...'PropertyName', PropertyValue, ...) nt2aa с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
преобразовывает последовательность нуклеотида для определенной рамки считывания к последовательности аминокислот. Выбором является SeqAA = nt2aa(...,
'Frame', FrameValue, ...)1, 2, 3 или 'all'. Значением по умолчанию является 1. Если FrameValue является 'all', то вывод SeqAA является массивом ячеек 3 на 1.
задает генетический код, чтобы использовать при преобразовании последовательности нуклеотида в последовательность аминокислот. SeqAA = nt2aa(..., 'GeneticCode', GeneticCodeValue, ...)GeneticCodeValue может быть целым числом, вектором символов или строкой, задающей номер кода или кодовое название из таблицы Genetic Code. Значением по умолчанию является 1 или 'Standard'. Аминокислоту к отображению кодона нуклеотида для Стандартного генетического кода показывают в таблице Standard Genetic Code.
Если вы используете кодовое название, можно обрезать имя к первым двум буквам имени.
управляет переводом альтернативных кодонов запуска. По умолчанию SeqAA = nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue,
...)AlternativeStartCodonsValue установлен в true, и если первый кодон последовательности является известным альтернативным кодоном запуска, кодон переводится в метионин.
Если эта опция установлена в false, то альтернативный кодон запуска в начале последовательности переводится в свою соответствующую аминокислоту в генетическом коде, который вы задаете, который не может обязательно быть метионином. Например, в человеческом митохондриальном генетическом коде, AUA и AUU, как известно, являются альтернативными кодонами запуска. Для получения дополнительной информации об альтернативных кодонах запуска посетите https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=t#SG1.
Для получения дополнительной информации об альтернативных кодонах запуска, см.:
Генетический код
| Номер кода | Кодовое название |
|---|---|
| 1 | Standard |
| 2 | Vertebrate Mitochondrial |
| 3 | Yeast Mitochondrial |
| 4 | Mold, Protozoan, Coelenterate Mitochondrial и Mycoplasma/Spiroplasma |
| 5 | Invertebrate Mitochondrial |
| 6 | Ciliate, Dasycladacean и Hexamita Nuclear |
| 9 | Echinoderm Mitochondrial |
| 10 | Euplotid Nuclear |
| 11 | Bacterial и Plant Plastid |
| 12 | Alternative Yeast Nuclear |
| 13 | Ascidian Mitochondrial |
| 14 | Flatworm Mitochondrial |
| 15 | Blepharisma Nuclear |
| 16 | Chlorophycean Mitochondrial |
| 21 | Trematode Mitochondrial |
| 22 | Scenedesmus Obliquus Mitochondrial |
| 23 | Thraustochytrium Mitochondrial |
Стандартный генетический код
| Имя аминокислоты | Код аминокислоты | Кодон нуклеотида |
|---|---|---|
| Аланин | A | GCT GCC GCA GCG |
| Аргинин | R | CGT CGC CGA CGG AGA AGG |
| Аспарагин | N | AAT AAC |
| Кислота аспарагиновой кислоты (Аспартат) | D | GAT GAC |
| Цистеин | C | TGT TGC |
| Glutamine | Q | CAA CAG |
| Глутаминовая кислота (Глутамат) | E | GAA GAG |
| Глицин | G | GGT GGC GGA GGG |
| Гистидин | H | CAT CAC |
| Изолейцин | I | ATT ATC ATA |
| Лейцин | L | TTA TTG CTT CTC CTA CTG |
| Лизин | K | AAA AAG |
| Метионин | M | ATG |
| Фенилаланин | F | TTT TTC |
| Пролин | P | CCT CCC CCA CCG |
| Серин | S | TCT TCC TCA TCG AGT AGC |
| Треонин | T | ACT ACC ACA ACG |
| Триптофан | W | TGG |
| Тирозин | Y | TAT, TAC |
| Valine | V | GTT GTC GTA GTG |
| Аспарагин или кислота Аспарагиновой кислоты (Аспартат) | B | Случайный кодон от D и N |
| Glutamine или Glutamic acid (Глутамат) | Z | Случайный кодон от E и Q |
| Неизвестная аминокислота (любая аминокислота) | X | Случайный кодон |
| Остановка перевода | * | TAA TAG TGA |
| Разрыв неопределенной длины | - | --- |
| Неизвестный символ (любой символ или символ не в таблице) | ? | ??? |
управляет поведением неоднозначных символов нуклеотида (SeqAA = nt2aa(..., 'ACGTOnly', ACGTOnlyValue,
...)R, Y, K, M, S, W, B, D, H, V и N) и неизвестных символов. ACGTOnlyValue может быть true (значение по умолчанию) или false. Если true, то функциональные ошибки, если любой из этих символов присутствует. Если false, то функция пытается разрешить неоднозначности. Если это не может, это возвратить X для затронутого кодона.
Используйте функцию getgenbank, чтобы получить геномную информацию для человеческой митохондрии от базы данных GenBank® и сохранить его в структуре MATLAB.
mitochondria = getgenbank('NC_012920')
mitochondria =
LocusName: 'NC_012920'
LocusSequenceLength: '16569'
LocusNumberofStrands: ''
LocusTopology: 'circular'
LocusMoleculeType: 'DNA'
LocusGenBankDivision: 'PRI'
LocusModificationDate: '05-MAR-2010'
Definition: 'Homo sapiens mitochondrion, complete genome.'
Accession: 'NC_012920 AC_000021'
Version: 'NC_012920.1'
GI: '251831106'
Project: []
DBLink: 'Project:30353'
Keywords: []
Segment: []
Source: 'mitochondrion Homo sapiens (human)'
SourceOrganism: [4x65 char]
Reference: {1x7 cell}
Comment: [24x67 char]
Features: [933x74 char]
CDS: [1x13 struct]
Sequence: [1x16569 char]
SearchURL: [1x70 char]
RetrieveURL: [1x104 char]Определите название и местоположение первого гена в человеческой митохондрии.
mitochondria.CDS(1).gene
ans = ND1
mitochondria.CDS(1).location
ans = 3307..4262
Извлеките последовательность для гена ND1 от последовательности нуклеотида.
ND1gene = mitochondria.Sequence(3307:4262);
Преобразуйте ген ND1 на человеческом геноме митохондрий к последовательности аминокислот с помощью Позвоночного Митохондриального генетического кода.
protein1 = nt2aa(ND1gene,'GeneticCode', 2);
Используйте функцию getgenpept, чтобы получить ту же последовательность аминокислот из базы данных GenPept.
protein2 = getgenpept('YP_003024026', 'SequenceOnly', true);
Используйте функцию isequal, чтобы сравнить эти две последовательности аминокислот.
isequal (protein1, protein2)
ans =
1Используйте функцию getgenbank, чтобы получить последовательность нуклеотида для человеческой митохондрии от базы данных GenBank.
mitochondria = getgenbank('NC_012920');
Определите название и местоположение второго гена в человеческой митохондрии.
mitochondria.CDS(2).gene
ans = ND2
mitochondria.CDS(2).location
ans = 4470..5511
Извлеките последовательность для гена ND2 от последовательности нуклеотида.
ND2gene = mitochondria.Sequence(4470:5511);
Преобразуйте ген ND2 на человеческом геноме митохондрий к последовательности аминокислот с помощью Позвоночного Митохондриального генетического кода.
protein1 = nt2aa(ND2gene,'GeneticCode', 2);
В последовательности нуклеотида ND2gene первым кодоном является ATT, который переводится в M, в то время как последующие кодоны ATT переводятся в I. Если вы устанавливаете 'AlternativeStartCodons' на false, то первый кодон ATT переводится в I, соответствующую аминокислоту в Позвоночном Митохондриальном генетическом коде.
Используйте функцию getgenpept, чтобы получить ту же последовательность аминокислот из базы данных GenPept.
protein2 = getgenpept('YP_003024027', 'SequenceOnly', true);
Используйте функцию isequal, чтобы сравнить эти две последовательности аминокислот.
isequal (protein1, protein2)
ans =
1Если у вас есть последовательность с неоднозначными или неизвестными символами нуклеотида, можно установить свойство 'ACGTOnly' на false иметь попытку функции nt2aa разрешить их:
nt2aa('agttgccgacgcgcncar','ACGTOnly', false)
ans =
SCRRAQ
aa2nt | aminolookup | baselookup | codonbias | dnds | dndsml | geneticcode | isotopicdist | revgeneticcode | seqviewer