Преобразование нуклеотидной последовательности в аминокислотную
SeqAA
= nt2aa(SeqNT
)
SeqAA
= nt2aa(...,
'Frame', FrameValue
, ...)
SeqAA
= nt2aa(..., 'GeneticCode', GeneticCodeValue
, ...)
SeqAA
= nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue
,
...)
SeqAA
= nt2aa(..., 'ACGTOnly', ACGTOnlyValue
,
...)
SeqNT | Одно из следующих:
Примечание Дефисы действительны только в том случае, если кодон, которому он принадлежит, представляет зазор, то есть кодон содержит все дефисы. Пример: Совет Не используйте последовательность с дефисами, если вы задаете |
FrameValue | Целое число, вектор символов или строка, задающая систему координат чтения в нуклеотидной последовательности. Варианты Если |
GeneticCodeValue | Целое число, вектор символов или строка, задающая номер генетического кода или имя кода из таблицы Генетический код. По умолчанию это Совет Если вы используете имя кода, можно обрезать имя до первых двух букв имени. |
AlternativeStartCodonsValue | Управляет трансляцией альтернативных кодонов. Варианты |
ACGTOnlyValue | Управляет поведением неоднозначных нуклеотидных символов (
|
SeqAA | Аминокислотная последовательность, заданная вектором символов однобуквенных кодов. |
преобразует нуклеотидную последовательность, заданную как SeqAA
= nt2aa(SeqNT
)SeqNT
, к аминокислотной последовательности, возвращенной в SeqAA
, с использованием стандартного генетического кода.
вызывает SeqAA
= nt2aa (SeqNT
... 'PropertyName
', PropertyValue
, ...)nt2aa
с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
преобразует нуклеотидную последовательность для определенной системы координат считывания в аминокислотную последовательность. Варианты SeqAA
= nt2aa(...,
'Frame', FrameValue
, ...)1
, 2
, 3
, или 'all'
. По умолчанию это 1
. Если FrameValue
является 'all'
, затем выход SeqAA
- массив ячеек 3 на 1.
задает генетический код, используемый при преобразовании нуклеотидной последовательности в аминокислотную последовательность. SeqAA
= nt2aa(..., 'GeneticCode', GeneticCodeValue
, ...)GeneticCodeValue
может быть целым числом, вектором символов или строкой, задающей номер кода или имя кода из таблицы Генетический код. По умолчанию это 1
или 'Standard'
. Аминокислота к нуклеотидному кодону, отображению для Стандартного генетического кода, показана в таблице Стандартного генетического кода.
Совет
Если вы используете имя кода, можно обрезать имя до первых двух букв имени.
управляет трансляцией альтернативных стартовых кодонов. По умолчанию SeqAA
= nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue
,
...)AlternativeStartCodonsValue
установлено в true
и если первый кодон последовательности является известным альтернативным стартовым кодоном, кодон переводят в метионин.
Если для этой опции задано значение false
затем альтернативный стартовый кодон в начале последовательности переводится на соответствующую ему аминокислоту в указанном вами генетическом коде, который не обязательно может быть метионином. Для примера в генетическом коде митохондрий человека AUA
и AUU
известно, что это альтернативные стартовые кодоны. Для получения дополнительной информации об альтернативных стартовых кодонах посетите https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=t#SG1.
Для получения дополнительной информации об альтернативных стартовых кодонах смотрите:
Генетический код
Кодовый номер | Кодовое имя |
---|---|
1 | Standard |
2 | Vertebrate Mitochondrial |
3 | Yeast Mitochondrial |
4 | Mold , Protozoan , Coelenterate Mitochondrial , и Mycoplasma/Spiroplasma |
5 | Invertebrate Mitochondrial |
6 | Ciliate , Dasycladacean , и Hexamita Nuclear |
9 | Echinoderm Mitochondrial |
10 | Euplotid Nuclear |
11 | Bacterial и Plant Plastid |
12 | Alternative Yeast Nuclear |
13 | Ascidian Mitochondrial |
14 | Flatworm Mitochondrial |
15 | Blepharisma Nuclear |
16 | Chlorophycean Mitochondrial |
21 | Trematode Mitochondrial |
22 | Scenedesmus Obliquus Mitochondrial |
23 | Thraustochytrium Mitochondrial |
Стандартный генетический код
Имя аминокислоты | Аминокислотный код | Нуклеотидный кодон |
---|---|---|
Аланин | A | GCT GCC GCA GCG |
Аргинин | R | CGT CGC CGA CGG AGA AGG |
Аспарагин | N | AAT AAC |
Аспарагиновая кислота (аспартат) | D | GAT GAC |
Цистеин | C | TGT TGC |
Глютамин | Q | CAA CAG |
Глутаминовая кислота (глутамат) | E | GAA GAG |
Глицин | G | GGT GGC GGA GGG |
Гистидин | H | CAT CAC |
Изолейцин | I | ATT ATC ATA |
Лейцин | L | TTA TTG CTT CTC CTA CTG |
Лизин | K | AAA AAG |
Метионин | M | ATG |
Фенилаланин | F | TTT TTC |
Пролин | P | CCT CCC CCA CCG |
Серин | S | TCT TCC TCA TCG AGT AGC |
Треонин | T | ACT ACC ACA ACG |
Триптофан | W | TGG |
Тирозин | Y | TAT, TAC |
Валин | V | GTT GTC GTA GTG |
Аспарагин или аспарагиновая кислота (аспартат) | B | Случайный кодон из D и N |
Глутамин или глутаминовая кислота (глутамат) | Z | Случайный кодон из E и Q |
Неизвестная аминокислота (любая аминокислота) | X | Случайный кодон |
Остановка перевода | * | TAA TAG TGA |
Зазор неопределенной длины | - | --- |
Неизвестный символ (любой символ или символ, не указанный в таблице) | ? | ??? |
управляет поведением неоднозначных нуклеотидных символов (SeqAA
= nt2aa(..., 'ACGTOnly', ACGTOnlyValue
,
...)R
, Y
, K
, M
, S
, W
, B
, D
, H
, V
, и N
) и неизвестные символы. ACGTOnlyValue
можно true
(по умолчанию) или false
. Если true
, тогда ошибки функции, если какой-либо из этих символов присутствует. Если false
, тогда функция пытается разрешить неоднозначности. Если это невозможно, возвращается X
для затронутого кодона.
Используйте getgenbank
функция для извлечения геномной информации для митохондрий человека из GenBank® и храните его в структуре MATLAB.
mitochondria = getgenbank('NC_012920')
mitochondria = LocusName: 'NC_012920' LocusSequenceLength: '16569' LocusNumberofStrands: '' LocusTopology: 'circular' LocusMoleculeType: 'DNA' LocusGenBankDivision: 'PRI' LocusModificationDate: '05-MAR-2010' Definition: 'Homo sapiens mitochondrion, complete genome.' Accession: 'NC_012920 AC_000021' Version: 'NC_012920.1' GI: '251831106' Project: [] DBLink: 'Project:30353' Keywords: [] Segment: [] Source: 'mitochondrion Homo sapiens (human)' SourceOrganism: [4x65 char] Reference: {1x7 cell} Comment: [24x67 char] Features: [933x74 char] CDS: [1x13 struct] Sequence: [1x16569 char] SearchURL: [1x70 char] RetrieveURL: [1x104 char]
Определите имя и местоположение первого гена в митохондрионе человека.
mitochondria.CDS(1).gene
ans = ND1
mitochondria.CDS(1).location
ans = 3307..4262
Извлеките последовательность для гена ND1 из нуклеотидной последовательности.
ND1gene = mitochondria.Sequence(3307:4262);
Преобразуйте ген ND1 на геноме митохондрий человека в аминокислотную последовательность с помощью митохондриального генетического кода позвоночных.
protein1 = nt2aa(ND1gene,'GeneticCode', 2);
Используйте getgenpept
функция для извлечения той же аминокислотной последовательности из базы данных GenPept.
protein2 = getgenpept('YP_003024026', 'SequenceOnly', true);
Используйте isequal
функция для сравнения двух аминокислотных последовательностей.
isequal (protein1, protein2) ans = 1
Используйте getgenbank
функция для извлечения нуклеотидной последовательности для митохондриона человека из базы данных GenBank.
mitochondria = getgenbank('NC_012920');
Определите имя и местоположение второго гена в митохондрионе человека.
mitochondria.CDS(2).gene
ans = ND2
mitochondria.CDS(2).location
ans = 4470..5511
Извлеките последовательность для гена ND2 из нуклеотидной последовательности.
ND2gene = mitochondria.Sequence(4470:5511);
Преобразуйте ген ND2 на геноме митохондрий человека в аминокислотную последовательность с помощью митохондриального генетического кода позвоночных.
protein1 = nt2aa(ND2gene,'GeneticCode', 2);
Примечание
В ND2gene
нуклеотидная последовательность, первый кодон ATT
, который переведен на M
, в то время как последующие ATT
кодоны переведены в I
. Если вы задаете 'AlternativeStartCodons'
на false
, затем первый ATT
кодон переведен в I
, соответствующая аминокислота в митохондриальном генетическом коде позвоночных.
Используйте getgenpept
функция для извлечения той же аминокислотной последовательности из базы данных GenPept.
protein2 = getgenpept('YP_003024027', 'SequenceOnly', true);
Используйте isequal
функция для сравнения двух аминокислотных последовательностей.
isequal (protein1, protein2) ans = 1
Если у вас есть последовательность с неоднозначными или неизвестными нуклеотидными символами, можно задать 'ACGTOnly'
свойство к false
иметь nt2aa
функция пытается разрешить их:
nt2aa('agttgccgacgcgcncar','ACGTOnly', false) ans = SCRRAQ
aa2nt
| aminolookup
| baselookup
| codonbias
| dnds
| dndsml
| geneticcode
| isotopicdist
| revgeneticcode
| seqviewer