Преобразуйте последовательность нуклеотида в последовательность аминокислот
SeqAA = nt2aa(SeqNT)
SeqAA = nt2aa(...,
'Frame', FrameValue, ...)
SeqAA = nt2aa(..., 'GeneticCode', GeneticCodeValue, ...)
SeqAA = nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue,
...)
SeqAA = nt2aa(..., 'ACGTOnly', ACGTOnlyValue,
...)
SeqNT | Одно из следующего:
Примечание Дефисы допустимы, только если кодон, которому это принадлежит, представляет разрыв, то есть, кодон содержит все дефисы. Пример: Совет Не используйте последовательность с дефисами, если вы задаете |
FrameValue | Целое число, вектор символов или строка, задающая рамку считывания в последовательности нуклеотида. Выбором является Если |
GeneticCodeValue | Целое число, вектор символов или строка, задающая номер генетического кода или кодовое название из таблицы Genetic Code. Значением по умолчанию является Совет Если вы используете кодовое название, можно обрезать имя к первым двум буквам имени. |
AlternativeStartCodonsValue | Управляет переводом альтернативных кодонов. Выбором является |
ACGTOnlyValue | Управляет поведением неоднозначных символов нуклеотида (
|
SeqAA | Последовательность аминокислот задана вектором символов однобуквенных кодов. |
преобразует последовательность нуклеотида, заданную SeqAA = nt2aa(SeqNT)SeqNT, к последовательности аминокислот, возвращенной в SeqAA, использование стандартного генетического кода.
вызовы SeqAA = nt2aa (SeqNTPropertyName ', PropertyValue, ...)nt2aa с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
преобразует последовательность нуклеотида для определенной рамки считывания к последовательности аминокислот. Выбором является SeqAA = nt2aa(...,
'Frame', FrameValue, ...)1, 2, 3, или 'all'. Значением по умолчанию является 1. Если FrameValue 'all', затем выход SeqAA массив ячеек 3 на 1.
задает генетический код, чтобы использовать при преобразовании последовательности нуклеотида в последовательность аминокислот. SeqAA = nt2aa(..., 'GeneticCode', GeneticCodeValue, ...)GeneticCodeValue может быть целое число, вектор символов или строка, задающая номер кода или кодовое название из таблицы Genetic Code. Значением по умолчанию является 1 или 'Standard'. Аминокислоту к отображению кодона нуклеотида для Стандартного генетического кода показывают в таблице Standard Genetic Code.
Совет
Если вы используете кодовое название, можно обрезать имя к первым двум буквам имени.
управляет переводом альтернативных кодонов запуска. По умолчанию, SeqAA = nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue,
...)AlternativeStartCodonsValue установлен в true, и если первый кодон последовательности является известным альтернативным кодоном запуска, кодон переводится в метионин.
Если эта опция установлена в false, затем альтернативный кодон запуска в начале последовательности переводится в свою соответствующую аминокислоту в генетическом коде, который вы задаете, который не может обязательно быть метионином. Например, в человеческом митохондриальном генетическом коде, AUA и AUU как известно, альтернативные кодоны запуска. Для получения дополнительной информации об альтернативных кодонах запуска посетите https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi? mode=t#SG1.
Для получения дополнительной информации об альтернативных кодонах запуска, см.:
Генетический код
| Номер кода | Кодовое название |
|---|---|
1 | Standard |
2 | Vertebrate Mitochondrial |
3 | Yeast Mitochondrial |
4 | Mold, Protozoan, Coelenterate Mitochondrial, и Mycoplasma/Spiroplasma |
5 | Invertebrate Mitochondrial |
6 | Ciliate, Dasycladacean, и Hexamita Nuclear |
9 | Echinoderm Mitochondrial |
10 | Euplotid Nuclear |
11 | Bacterial и Plant Plastid |
12 | Alternative Yeast Nuclear |
13 | Ascidian Mitochondrial |
14 | Flatworm Mitochondrial |
15 | Blepharisma Nuclear |
16 | Chlorophycean Mitochondrial |
21 | Trematode Mitochondrial |
22 | Scenedesmus Obliquus Mitochondrial |
23 | Thraustochytrium Mitochondrial |
Стандартный генетический код
| Имя аминокислоты | Код аминокислоты | Кодон нуклеотида |
|---|---|---|
| Аланин | A | GCT GCC GCA GCG |
| Аргинин | R | CGT CGC CGA CGG AGA AGG |
| Аспарагин | N | AAT AAC |
| Кислота аспарагиновой кислоты (Аспартат) | D | GAT GAC |
| Цистеин | C | TGT TGC |
| Glutamine | Q | CAA CAG |
| Глутаминовая кислота (Глутамат) | E | GAA GAG |
| Глицин | G | GGT GGC GGA GGG |
| Гистидин | H | CAT CAC |
| Изолейцин | I | ATT ATC ATA |
| Лейцин | L | TTA TTG CTT CTC CTA CTG |
| Лизин | K | AAA AAG |
| Метионин | M | ATG |
| Фенилаланин | F | TTT TTC |
| Пролин | P | CCT CCC CCA CCG |
| Серин | S | TCT TCC TCA TCG AGT AGC |
| Треонин | T | ACT ACC ACA ACG |
| Триптофан | W | TGG |
| Тирозин | Y | TAT, TAC |
| Valine | V | GTT GTC GTA GTG |
| Аспарагин или кислота Аспарагиновой кислоты (Аспартат) | B | Случайный кодон от D и N |
| Glutamine или Glutamic acid (Глутамат) | Z | Случайный кодон от E и Q |
| Неизвестная аминокислота (любая аминокислота) | X | Случайный кодон |
| Остановка перевода | * | TAA TAG TGA |
| Разрыв неопределенной длины | - | --- |
| Неизвестный символ (любой символ или символ не в таблице) | ? | ??? |
управляет поведением неоднозначных символов нуклеотида (SeqAA = nt2aa(..., 'ACGTOnly', ACGTOnlyValue,
...)RYKMSWBDHV, и N) и неизвестные символы. ACGTOnlyValue может быть true (значение по умолчанию) или false. Если true, затем функциональные ошибки, если какой-либо из этих символов присутствует. Если false, затем функция пытается разрешить неоднозначности. Если это не может, это возвратить X для затронутого кодона.
Используйте getgenbank функция, чтобы получить геномную информацию для человеческой митохондрии от GenBank® база данных и хранилище это в структуре MATLAB.
mitochondria = getgenbank('NC_012920')
mitochondria =
LocusName: 'NC_012920'
LocusSequenceLength: '16569'
LocusNumberofStrands: ''
LocusTopology: 'circular'
LocusMoleculeType: 'DNA'
LocusGenBankDivision: 'PRI'
LocusModificationDate: '05-MAR-2010'
Definition: 'Homo sapiens mitochondrion, complete genome.'
Accession: 'NC_012920 AC_000021'
Version: 'NC_012920.1'
GI: '251831106'
Project: []
DBLink: 'Project:30353'
Keywords: []
Segment: []
Source: 'mitochondrion Homo sapiens (human)'
SourceOrganism: [4x65 char]
Reference: {1x7 cell}
Comment: [24x67 char]
Features: [933x74 char]
CDS: [1x13 struct]
Sequence: [1x16569 char]
SearchURL: [1x70 char]
RetrieveURL: [1x104 char]Определите название и местоположение первого гена в человеческой митохондрии.
mitochondria.CDS(1).gene
ans = ND1
mitochondria.CDS(1).location
ans = 3307..4262
Извлеките последовательность для гена ND1 от последовательности нуклеотида.
ND1gene = mitochondria.Sequence(3307:4262);
Преобразуйте ген ND1 на человеческом геноме митохондрий к последовательности аминокислот с помощью Позвоночного Митохондриального генетического кода.
protein1 = nt2aa(ND1gene,'GeneticCode', 2);
Используйте getgenpept функция, чтобы получить ту же последовательность аминокислот из базы данных GenPept.
protein2 = getgenpept('YP_003024026', 'SequenceOnly', true);
Используйте isequal функция, чтобы сравнить эти две последовательности аминокислот.
isequal (protein1, protein2)
ans =
1Используйте getgenbank функция, чтобы получить последовательность нуклеотида для человеческой митохондрии от базы данных GenBank.
mitochondria = getgenbank('NC_012920');
Определите название и местоположение второго гена в человеческой митохондрии.
mitochondria.CDS(2).gene
ans = ND2
mitochondria.CDS(2).location
ans = 4470..5511
Извлеките последовательность для гена ND2 от последовательности нуклеотида.
ND2gene = mitochondria.Sequence(4470:5511);
Преобразуйте ген ND2 на человеческом геноме митохондрий к последовательности аминокислот с помощью Позвоночного Митохондриального генетического кода.
protein1 = nt2aa(ND2gene,'GeneticCode', 2);
Примечание
В ND2gene последовательность нуклеотида, первым кодоном является ATT, который переводится в M, в то время как последующий ATT кодоны переводятся в I. Если вы устанавливаете 'AlternativeStartCodons' к false, затем первый ATT кодон переводится в I, соответствующая аминокислота в Позвоночном Митохондриальном генетическом коде.
Используйте getgenpept функция, чтобы получить ту же последовательность аминокислот из базы данных GenPept.
protein2 = getgenpept('YP_003024027', 'SequenceOnly', true);
Используйте isequal функция, чтобы сравнить эти две последовательности аминокислот.
isequal (protein1, protein2)
ans =
1Если у вас есть последовательность с неоднозначными или неизвестными символами нуклеотида, можно установить 'ACGTOnly' свойство к false иметь nt2aa функционируйте пытаются разрешить их:
nt2aa('agttgccgacgcgcncar','ACGTOnly', false)
ans =
SCRRAQ
aa2nt | aminolookup | baselookup | codonbias | dnds | dndsml | geneticcode | isotopicdist | revgeneticcode | seqviewer