Преобразуйте последовательность нуклеотида в последовательность аминокислот
SeqAA
= nt2aa(SeqNT
)
SeqAA
= nt2aa(...,
'Frame', FrameValue
, ...)
SeqAA
= nt2aa(..., 'GeneticCode', GeneticCodeValue
, ...)
SeqAA
= nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue
,
...)
SeqAA
= nt2aa(..., 'ACGTOnly', ACGTOnlyValue
,
...)
SeqNT | Одно из следующего:
Примечание Дефисы допустимы, только если кодон, которому это принадлежит, представляет разрыв, то есть, кодон содержит все дефисы. Пример: Совет Не используйте последовательность с дефисами, если вы задаете |
FrameValue | Целое число, вектор символов или строка, задающая рамку считывания в последовательности нуклеотида. Выбором является Если |
GeneticCodeValue | Целое число, вектор символов или строка, задающая номер генетического кода или кодовое название из таблицы Genetic Code. Значением по умолчанию является Совет Если вы используете кодовое название, можно обрезать имя к первым двум буквам имени. |
AlternativeStartCodonsValue | Управляет переводом альтернативных кодонов. Выбором является |
ACGTOnlyValue | Управляет поведением неоднозначных символов нуклеотида (
|
SeqAA | Последовательность аминокислот задана вектором символов однобуквенных кодов. |
преобразует последовательность нуклеотида, заданную SeqAA
= nt2aa(SeqNT
)SeqNT
, к последовательности аминокислот, возвращенной в SeqAA
, использование стандартного генетического кода.
вызовы SeqAA
= nt2aa (SeqNT
PropertyName
', PropertyValue
, ...)nt2aa
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
преобразует последовательность нуклеотида для определенной рамки считывания к последовательности аминокислот. Выбором является SeqAA
= nt2aa(...,
'Frame', FrameValue
, ...)1
, 2, 3
, или
'all'
. Значением по умолчанию является 1
. Если FrameValue
'all'
, затем выход SeqAA
массив ячеек 3 на 1.
задает генетический код, чтобы использовать при преобразовании последовательности нуклеотида в последовательность аминокислот. SeqAA
= nt2aa(..., 'GeneticCode', GeneticCodeValue
, ...)GeneticCodeValue
может быть целое число, вектор символов или строка, задающая номер кода или кодовое название из таблицы Genetic Code. Значением по умолчанию является 1
или 'Standard'
. Аминокислоту к отображению кодона нуклеотида для Стандартного генетического кода показывают в таблице Standard Genetic Code.
Совет
Если вы используете кодовое название, можно обрезать имя к первым двум буквам имени.
управляет переводом альтернативных кодонов запуска. По умолчанию, SeqAA
= nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue
,
...)AlternativeStartCodonsValue
установлен в true
, и если первый кодон последовательности является известным альтернативным кодоном запуска, кодон переводится в метионин.
Если эта опция установлена в false
, затем альтернативный кодон запуска в начале последовательности переводится в свою соответствующую аминокислоту в генетическом коде, который вы задаете, который не может обязательно быть метионином. Например, в человеческом митохондриальном генетическом коде, AUA
и AUU
как известно, альтернативные кодоны запуска. Для получения дополнительной информации об альтернативных кодонах запуска посетите https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi? mode=t#SG1.
Для получения дополнительной информации об альтернативных кодонах запуска, см.:
Генетический код
Номер кода | Кодовое название |
---|---|
1
| Standard |
2
| Vertebrate Mitochondrial |
3
| Yeast Mitochondrial |
4
| Mold , Protozoan , Coelenterate Mitochondrial , и Mycoplasma/Spiroplasma |
5
| Invertebrate Mitochondrial |
6
| Ciliate , Dasycladacean , и Hexamita Nuclear |
9
| Echinoderm Mitochondrial |
10
| Euplotid Nuclear |
11
| Bacterial и Plant Plastid |
12
| Alternative Yeast Nuclear |
13
| Ascidian Mitochondrial |
14
| Flatworm Mitochondrial |
15
| Blepharisma Nuclear |
16
| Chlorophycean Mitochondrial |
21
| Trematode Mitochondrial |
22
| Scenedesmus Obliquus Mitochondrial |
23
| Thraustochytrium Mitochondrial |
Стандартный генетический код
Имя аминокислоты | Код аминокислоты | Кодон нуклеотида |
---|---|---|
Аланин | A | GCT GCC GCA GCG |
Аргинин | R | CGT CGC CGA CGG AGA AGG |
Аспарагин | N | AAT AAC |
Кислота аспарагиновой кислоты (Аспартат) | D | GAT GAC |
Цистеин | C | TGT TGC |
Glutamine | Q | CAA CAG |
Глутаминовая кислота (Глутамат) | E | GAA GAG |
Глицин | G | GGT GGC GGA GGG |
Гистидин | H | CAT CAC |
Изолейцин | I | ATT ATC ATA |
Лейцин | L | TTA TTG CTT CTC CTA CTG |
Лизин | K | AAA AAG |
Метионин | M | ATG |
Фенилаланин | F | TTT TTC |
Пролин | P | CCT CCC CCA CCG |
Серин | S | TCT TCC TCA TCG AGT AGC |
Треонин | T | ACT ACC ACA ACG |
Триптофан | W | TGG |
Тирозин | Y | TAT, TAC |
Valine | V | GTT GTC GTA GTG |
Аспарагин или кислота Аспарагиновой кислоты (Аспартат) | B | Случайный кодон от D и N |
Glutamine или Glutamic acid (Глутамат) | Z | Случайный кодон от E и Q |
Неизвестная аминокислота (любая аминокислота) | X | Случайный кодон |
Остановка перевода | * | TAA TAG TGA |
Разрыв неопределенной длины | - | --- |
Неизвестный символ (любой символ или символ не в таблице) | ? | ??? |
управляет поведением неоднозначных символов нуклеотида (SeqAA
= nt2aa(..., 'ACGTOnly', ACGTOnlyValue
,
...)R
Y
K
M
S
W
B
D
H
V
, и N
) и неизвестные символы. ACGTOnlyValue
может быть true
(значение по умолчанию) или false
. Если true
, затем функциональные ошибки, если какой-либо из этих символов присутствует. Если false
, затем функция пытается разрешить неоднозначности. Если это не может, это возвратить X
для затронутого кодона.
Используйте getgenbank
функция, чтобы получить геномную информацию для человеческой митохондрии от базы данных GenBank® и сохранить его в структуре MATLAB.
mitochondria = getgenbank('NC_012920')
mitochondria = LocusName: 'NC_012920' LocusSequenceLength: '16569' LocusNumberofStrands: '' LocusTopology: 'circular' LocusMoleculeType: 'DNA' LocusGenBankDivision: 'PRI' LocusModificationDate: '05-MAR-2010' Definition: 'Homo sapiens mitochondrion, complete genome.' Accession: 'NC_012920 AC_000021' Version: 'NC_012920.1' GI: '251831106' Project: [] DBLink: 'Project:30353' Keywords: [] Segment: [] Source: 'mitochondrion Homo sapiens (human)' SourceOrganism: [4x65 char] Reference: {1x7 cell} Comment: [24x67 char] Features: [933x74 char] CDS: [1x13 struct] Sequence: [1x16569 char] SearchURL: [1x70 char] RetrieveURL: [1x104 char]
Определите название и местоположение первого гена в человеческой митохондрии.
mitochondria.CDS(1).gene
ans = ND1
mitochondria.CDS(1).location
ans = 3307..4262
Извлеките последовательность для гена ND1 от последовательности нуклеотида.
ND1gene = mitochondria.Sequence(3307:4262);
Преобразуйте ген ND1 на человеческом геноме митохондрий к последовательности аминокислот с помощью Позвоночного Митохондриального генетического кода.
protein1 = nt2aa(ND1gene,'GeneticCode', 2);
Используйте getgenpept
функция, чтобы получить ту же последовательность аминокислот из базы данных GenPept.
protein2 = getgenpept('YP_003024026', 'SequenceOnly', true);
Используйте isequal
функция, чтобы сравнить эти две последовательности аминокислот.
isequal (protein1, protein2) ans = 1
Используйте getgenbank
функция, чтобы получить последовательность нуклеотида для человеческой митохондрии от базы данных GenBank.
mitochondria = getgenbank('NC_012920');
Определите название и местоположение второго гена в человеческой митохондрии.
mitochondria.CDS(2).gene
ans = ND2
mitochondria.CDS(2).location
ans = 4470..5511
Извлеките последовательность для гена ND2 от последовательности нуклеотида.
ND2gene = mitochondria.Sequence(4470:5511);
Преобразуйте ген ND2 на человеческом геноме митохондрий к последовательности аминокислот с помощью Позвоночного Митохондриального генетического кода.
protein1 = nt2aa(ND2gene,'GeneticCode', 2);
Примечание
В ND2gene
последовательность нуклеотида, первым кодоном является ATT
, который переводится в M
, в то время как последующий ATT
кодоны переводятся в I
. Если вы устанавливаете 'AlternativeStartCodons'
к false
, затем первый ATT
кодон переводится в I
, соответствующая аминокислота в Позвоночном Митохондриальном генетическом коде.
Используйте getgenpept
функция, чтобы получить ту же последовательность аминокислот из базы данных GenPept.
protein2 = getgenpept('YP_003024027', 'SequenceOnly', true);
Используйте isequal
функция, чтобы сравнить эти две последовательности аминокислот.
isequal (protein1, protein2) ans = 1
Если у вас есть последовательность с неоднозначными или неизвестными символами нуклеотида, можно установить 'ACGTOnly'
свойство к false
иметь nt2aa
функционируйте пытаются разрешить их:
nt2aa('agttgccgacgcgcncar','ACGTOnly', false) ans = SCRRAQ
aa2nt
| aminolookup
| baselookup
| codonbias
| dnds
| dndsml
| geneticcode
| isotopicdist
| revgeneticcode
| seqviewer