exponenta event banner

nt2aa

Преобразование нуклеотидной последовательности в аминокислотную последовательность

Синтаксис

SeqAA = nt2aa(SeqNT)
SeqAA = nt2aa(..., 'Frame', FrameValue, ...)
SeqAA = nt2aa(..., 'GeneticCode', GeneticCodeValue, ...)
SeqAA = nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue, ...)
SeqAA = nt2aa(..., 'ACGTOnly', ACGTOnlyValue, ...)

Входные аргументы

SeqNT

Одно из следующих:

Примечание

Дефисы действительны только в том случае, если кодон, которому он принадлежит, представляет собой пробел, то есть кодон содержит все дефисы. Пример: ACT---TGA

Совет

Не использовать последовательность с дефисами при указании 'all' для FrameValue.

FrameValue

Целое число, символьный вектор или строка, задающая рамку считывания в нуклеотидной последовательности. Варианты: 1, 2, 3, или 'all'. По умолчанию: 1.

Если FrameValue является 'all', то SeqAA является массивом ячеек 3 на 1.

GeneticCodeValue

Целое число, символьный вектор или строка, указывающая номер генетического кода или имя кода из таблицы Генетический код. По умолчанию: 1 или 'Standard'.

Совет

При использовании кодового имени можно усечь имя до первых двух букв имени.

AlternativeStartCodonsValue

Контролирует трансляцию альтернативных кодонов. Варианты: true (по умолчанию) или false.

ACGTOnlyValue

Управляет поведением неоднозначных нуклеотидных символов (R, Y, K, M, S, W, B, D, H, V, и N) и неизвестные символы. ACGTOnlyValue может быть true (по умолчанию) или false.

  • Если true, то ошибки функции, если присутствуют какие-либо из этих символов.

  • Если false, то функция пытается разрешить неоднозначности. Если он не может, он возвращается X для пораженного кодона.

Выходные аргументы

SeqAAАминокислотная последовательность, определяемая символьным вектором однобуквенных кодов.

Описание

SeqAA = nt2aa(SeqNT) преобразует нуклеотидную последовательность, указанную SeqNT, к аминокислотной последовательности, возвращенной в SeqAA, используя стандартный генетический код.

SeqAA = nt2aa(SeqNT, ...'PropertyName', PropertyValue, ...) требования nt2aa с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

SeqAA = nt2aa(..., 'Frame', FrameValue, ...) преобразует нуклеотидную последовательность для конкретной рамки считывания в аминокислотную последовательность. Варианты: 1, 2, 3, или 'all'. По умолчанию: 1. Если FrameValue является 'all', затем вывод SeqAA является массивом ячеек 3 на 1.

SeqAA = nt2aa(..., 'GeneticCode', GeneticCodeValue, ...) определяет генетический код для использования при преобразовании нуклеотидной последовательности в аминокислотную последовательность. GeneticCodeValue может быть целым числом, символьным вектором или строкой, указывающей кодовый номер или кодовое имя из таблицы Генетический код. По умолчанию: 1 или 'Standard'. Картирование аминокислотно-нуклеотидного кодона для стандартного генетического кода показано в таблице Стандартный генетический код.

Совет

При использовании кодового имени можно усечь имя до первых двух букв имени.

SeqAA = nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue, ...) контролирует трансляцию альтернативных стартовых кодонов. По умолчанию AlternativeStartCodonsValue имеет значение trueи если первый кодон последовательности является известным альтернативным стартовым кодоном, кодон транслируется в метионин.

Если для этой опции установлено значение false, то альтернативный стартовый кодон в начале последовательности транслируется в его соответствующую аминокислоту в генетическом коде, который вы указываете, который не обязательно может быть метионином. Например, в митохондриальном генетическом коде человека AUA и AUU известны альтернативные стартовые кодоны. Для получения дополнительной информации об альтернативных стартовых кодонах посетите https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=t#SG1.

Дополнительные сведения об альтернативных стартовых кодонах см. в разделе:

Генетический код

Кодовый номерКодовое имя
1Standard
2Vertebrate Mitochondrial
3Yeast Mitochondrial
4Mold, Protozoan, Coelenterate Mitochondrial, и Mycoplasma/Spiroplasma
5Invertebrate Mitochondrial
6Ciliate, Dasycladacean, и Hexamita Nuclear
9Echinoderm Mitochondrial
10Euplotid Nuclear
11Bacterial и Plant Plastid
12Alternative Yeast Nuclear
13Ascidian Mitochondrial
14Flatworm Mitochondrial
15Blepharisma Nuclear
16Chlorophycean Mitochondrial
21Trematode Mitochondrial
22Scenedesmus Obliquus Mitochondrial
23Thraustochytrium Mitochondrial

Стандартный генетический код

Название аминокислотыАминокислотный кодНуклеотидный кодон
Аланин AGCT GCC GCA GCG
АргининRCGT CGC CGA CGG AGA AGG
АспарагинNAAT AAC
Аспарагиновая кислота (аспартат) DGAT GAC
ЦистеинCTGT TGC
ГлютаминQCAA CAG
Глутаминовая кислота (глутамат) EGAA GAG
ГлицинGGGT GGC GGA GGG
ГистидинHCAT CAC
ИзолейцинIATT ATC ATA
ЛейцинLTTA TTG CTT CTC CTA CTG
ЛизинKAAA AAG
МетионинMATG
ФенилаланинFTTT TTC
Пролин PCCT CCC CCA CCG
СеринSTCT TCC TCA TCG AGT AGC
ТреонинTACT ACC ACA ACG
ТриптофанWTGG
ТирозинYTAT, TAC
ВалинVGTT GTC GTA GTG
Аспарагин или аспарагиновая кислота (аспартат) B Случайный кодон из D и N
Глутамин или глутаминовая кислота (глутамат) ZСлучайный кодон из E и Q
Неизвестная аминокислота (любая аминокислота) XСлучайный кодон
Остановка перевода *TAA TAG TGA
Разрыв неопределенной длины ----
Неизвестный символ (любой символ или символ, отсутствующий в таблице) ????

SeqAA = nt2aa(..., 'ACGTOnly', ACGTOnlyValue, ...) управляет поведением неоднозначных нуклеотидных символов (R, Y, K, M, S, W, B, D, H, V, и N) и неизвестные символы. ACGTOnlyValue может быть true (по умолчанию) или false. Если true, то ошибки функции, если присутствуют какие-либо из этих символов. Если false, то функция пытается разрешить неоднозначности. Если он не может, он возвращается X для пораженного кодона.

Примеры

Пример 48. Преобразование гена ND1
  1. Используйте getgenbank функция извлечения геномной информации для митохондриона человека из базы данных GenBank ® и сохранения ее в структуре MATLAB.

    mitochondria = getgenbank('NC_012920')
    
    mitochondria = 
    
                    LocusName: 'NC_012920'
          LocusSequenceLength: '16569'
         LocusNumberofStrands: ''
                LocusTopology: 'circular'
            LocusMoleculeType: 'DNA'
         LocusGenBankDivision: 'PRI'
        LocusModificationDate: '05-MAR-2010'
                   Definition: 'Homo sapiens mitochondrion, complete genome.'
                    Accession: 'NC_012920 AC_000021'
                      Version: 'NC_012920.1'
                           GI: '251831106'
                      Project: []
                       DBLink: 'Project:30353'
                     Keywords: []
                      Segment: []
                       Source: 'mitochondrion Homo sapiens (human)'
               SourceOrganism: [4x65 char]
                    Reference: {1x7 cell}
                      Comment: [24x67 char]
                     Features: [933x74 char]
                          CDS: [1x13 struct]
                     Sequence: [1x16569 char]
                    SearchURL: [1x70 char]
                  RetrieveURL: [1x104 char]
  2. Определите название и местоположение первого гена в митохондрионе человека.

    mitochondria.CDS(1).gene
    
    ans =
    
    ND1
    mitochondria.CDS(1).location
    ans =
    
    3307..4262
  3. Извлекают последовательность для гена ND1 из нуклеотидной последовательности.

    ND1gene = mitochondria.Sequence(3307:4262);
    
  4. Преобразование гена ND1 в геноме митохондрий человека в аминокислотную последовательность с использованием митохондриального генетического кода позвоночных.

    protein1 = nt2aa(ND1gene,'GeneticCode', 2);
    
  5. Используйте getgenpept функция извлечения той же аминокислотной последовательности из базы данных GenPept.

    protein2 = getgenpept('YP_003024026', 'SequenceOnly', true);
    
  6. Используйте isequal функция сравнения двух аминокислотных последовательностей.

    isequal (protein1, protein2)
    
    ans =
    
         1
Пример 49. Преобразование гена ND2
  1. Используйте getgenbank функция извлечения нуклеотидной последовательности для митохондриона человека из базы данных GenBank.

    mitochondria = getgenbank('NC_012920');
    
  2. Определите название и местоположение второго гена в митохондрионе человека.

    mitochondria.CDS(2).gene
    
    ans =
    
    ND2
    mitochondria.CDS(2).location
    ans =
    
    4470..5511
  3. Извлекают последовательность для гена ND2 из нуклеотидной последовательности.

    ND2gene = mitochondria.Sequence(4470:5511);
    
  4. Преобразование гена ND2 в геноме митохондрий человека в аминокислотную последовательность с использованием митохондриального генетического кода позвоночных.

    protein1 = nt2aa(ND2gene,'GeneticCode', 2);
    

    Примечание

    В ND2gene нуклеотидная последовательность, первый кодон ATT, который переводится на M, в то время как последующие ATT кодоны транслируются в I. Если установить 'AlternativeStartCodons' кому false, то первый ATT кодон переводится в I, соответствующая аминокислота в митохондриальном генетическом коде позвоночного.

  5. Используйте getgenpept функция извлечения той же аминокислотной последовательности из базы данных GenPept.

    protein2 = getgenpept('YP_003024027', 'SequenceOnly', true);
    
  6. Используйте isequal функция сравнения двух аминокислотных последовательностей.

    isequal (protein1, protein2)
    
    ans =
    
         1
Пример 50. Преобразование последовательности с неоднозначными символами

Если имеется последовательность с неоднозначными или неизвестными нуклеотидными символами, можно установить 'ACGTOnly' свойство для false чтобы иметь nt2aa функция пытается разрешить их:

nt2aa('agttgccgacgcgcncar','ACGTOnly', false)

ans =

SCRRAQ
Представлен до R2006a