nt2aa

Преобразование нуклеотидной последовательности в аминокислотную

Синтаксис

SeqAA = nt2aa(SeqNT)
SeqAA = nt2aa(..., 'Frame', FrameValue, ...)
SeqAA = nt2aa(..., 'GeneticCode', GeneticCodeValue, ...)
SeqAA = nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue, ...)
SeqAA = nt2aa(..., 'ACGTOnly', ACGTOnlyValue, ...)

Входные параметры

SeqNT

Одно из следующих:

Примечание

Дефисы действительны только в том случае, если кодон, которому он принадлежит, представляет зазор, то есть кодон содержит все дефисы. Пример: ACT---TGA

Совет

Не используйте последовательность с дефисами, если вы задаете 'all' для FrameValue.

FrameValue

Целое число, вектор символов или строка, задающая систему координат чтения в нуклеотидной последовательности. Варианты 1, 2, 3, или 'all'. По умолчанию это 1.

Если FrameValue является 'all', затем SeqAA - массив ячеек 3 на 1.

GeneticCodeValue

Целое число, вектор символов или строка, задающая номер генетического кода или имя кода из таблицы Генетический код. По умолчанию это 1 или 'Standard'.

Совет

Если вы используете имя кода, можно обрезать имя до первых двух букв имени.

AlternativeStartCodonsValue

Управляет трансляцией альтернативных кодонов. Варианты true (по умолчанию) или false.

ACGTOnlyValue

Управляет поведением неоднозначных нуклеотидных символов (R, Y, K, M, S, W, B, D, H, V, и N) и неизвестные символы. ACGTOnlyValue можно true (по умолчанию) или false.

  • Если true, тогда ошибки функции, если какой-либо из этих символов присутствует.

  • Если false, тогда функция пытается разрешить неоднозначности. Если это невозможно, возвращается X для затронутого кодона.

Выходные аргументы

SeqAAАминокислотная последовательность, заданная вектором символов однобуквенных кодов.

Описание

SeqAA = nt2aa(SeqNT) преобразует нуклеотидную последовательность, заданную как SeqNT, к аминокислотной последовательности, возвращенной в SeqAA, с использованием стандартного генетического кода.

SeqAA = nt2aa (SeqNT... 'PropertyName', PropertyValue, ...) вызывает nt2aa с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

SeqAA = nt2aa(..., 'Frame', FrameValue, ...) преобразует нуклеотидную последовательность для определенной системы координат считывания в аминокислотную последовательность. Варианты 1, 2, 3, или 'all'. По умолчанию это 1. Если FrameValue является 'all', затем выход SeqAA - массив ячеек 3 на 1.

SeqAA = nt2aa(..., 'GeneticCode', GeneticCodeValue, ...) задает генетический код, используемый при преобразовании нуклеотидной последовательности в аминокислотную последовательность. GeneticCodeValue может быть целым числом, вектором символов или строкой, задающей номер кода или имя кода из таблицы Генетический код. По умолчанию это 1 или 'Standard'. Аминокислота к нуклеотидному кодону, отображению для Стандартного генетического кода, показана в таблице Стандартного генетического кода.

Совет

Если вы используете имя кода, можно обрезать имя до первых двух букв имени.

SeqAA = nt2aa(..., 'AlternativeStartCodons', AlternativeStartCodonsValue, ...) управляет трансляцией альтернативных стартовых кодонов. По умолчанию AlternativeStartCodonsValue установлено в trueи если первый кодон последовательности является известным альтернативным стартовым кодоном, кодон переводят в метионин.

Если для этой опции задано значение falseзатем альтернативный стартовый кодон в начале последовательности переводится на соответствующую ему аминокислоту в указанном вами генетическом коде, который не обязательно может быть метионином. Для примера в генетическом коде митохондрий человека AUA и AUU известно, что это альтернативные стартовые кодоны. Для получения дополнительной информации об альтернативных стартовых кодонах посетите https://www.ncbi.nlm.nih.gov/Taxonomy/Utils/wprintgc.cgi?mode=t#SG1.

Для получения дополнительной информации об альтернативных стартовых кодонах смотрите:

Генетический код

Кодовый номерКодовое имя
1Standard
2Vertebrate Mitochondrial
3Yeast Mitochondrial
4Mold, Protozoan, Coelenterate Mitochondrial, и Mycoplasma/Spiroplasma
5Invertebrate Mitochondrial
6Ciliate, Dasycladacean, и Hexamita Nuclear
9Echinoderm Mitochondrial
10Euplotid Nuclear
11Bacterial и Plant Plastid
12Alternative Yeast Nuclear
13Ascidian Mitochondrial
14Flatworm Mitochondrial
15Blepharisma Nuclear
16Chlorophycean Mitochondrial
21Trematode Mitochondrial
22Scenedesmus Obliquus Mitochondrial
23Thraustochytrium Mitochondrial

Стандартный генетический код

Имя аминокислотыАминокислотный кодНуклеотидный кодон
Аланин AGCT GCC GCA GCG
АргининRCGT CGC CGA CGG AGA AGG
АспарагинNAAT AAC
Аспарагиновая кислота (аспартат) DGAT GAC
ЦистеинCTGT TGC
ГлютаминQCAA CAG
Глутаминовая кислота (глутамат) EGAA GAG
ГлицинGGGT GGC GGA GGG
ГистидинHCAT CAC
ИзолейцинIATT ATC ATA
ЛейцинLTTA TTG CTT CTC CTA CTG
ЛизинKAAA AAG
МетионинMATG
ФенилаланинFTTT TTC
Пролин PCCT CCC CCA CCG
СеринSTCT TCC TCA TCG AGT AGC
ТреонинTACT ACC ACA ACG
ТриптофанWTGG
ТирозинYTAT, TAC
ВалинVGTT GTC GTA GTG
Аспарагин или аспарагиновая кислота (аспартат) B Случайный кодон из D и N
Глутамин или глутаминовая кислота (глутамат) ZСлучайный кодон из E и Q
Неизвестная аминокислота (любая аминокислота) XСлучайный кодон
Остановка перевода *TAA TAG TGA
Зазор неопределенной длины ----
Неизвестный символ (любой символ или символ, не указанный в таблице) ????

SeqAA = nt2aa(..., 'ACGTOnly', ACGTOnlyValue, ...) управляет поведением неоднозначных нуклеотидных символов (R, Y, K, M, S, W, B, D, H, V, и N) и неизвестные символы. ACGTOnlyValue можно true (по умолчанию) или false. Если true, тогда ошибки функции, если какой-либо из этих символов присутствует. Если false, тогда функция пытается разрешить неоднозначности. Если это невозможно, возвращается X для затронутого кодона.

Примеры

Пример 48. Преобразование гена ND1
  1. Используйте getgenbank функция для извлечения геномной информации для митохондрий человека из GenBank® и храните его в структуре MATLAB.

    mitochondria = getgenbank('NC_012920')
    
    mitochondria = 
    
                    LocusName: 'NC_012920'
          LocusSequenceLength: '16569'
         LocusNumberofStrands: ''
                LocusTopology: 'circular'
            LocusMoleculeType: 'DNA'
         LocusGenBankDivision: 'PRI'
        LocusModificationDate: '05-MAR-2010'
                   Definition: 'Homo sapiens mitochondrion, complete genome.'
                    Accession: 'NC_012920 AC_000021'
                      Version: 'NC_012920.1'
                           GI: '251831106'
                      Project: []
                       DBLink: 'Project:30353'
                     Keywords: []
                      Segment: []
                       Source: 'mitochondrion Homo sapiens (human)'
               SourceOrganism: [4x65 char]
                    Reference: {1x7 cell}
                      Comment: [24x67 char]
                     Features: [933x74 char]
                          CDS: [1x13 struct]
                     Sequence: [1x16569 char]
                    SearchURL: [1x70 char]
                  RetrieveURL: [1x104 char]
  2. Определите имя и местоположение первого гена в митохондрионе человека.

    mitochondria.CDS(1).gene
    
    ans =
    
    ND1
    mitochondria.CDS(1).location
    ans =
    
    3307..4262
  3. Извлеките последовательность для гена ND1 из нуклеотидной последовательности.

    ND1gene = mitochondria.Sequence(3307:4262);
    
  4. Преобразуйте ген ND1 на геноме митохондрий человека в аминокислотную последовательность с помощью митохондриального генетического кода позвоночных.

    protein1 = nt2aa(ND1gene,'GeneticCode', 2);
    
  5. Используйте getgenpept функция для извлечения той же аминокислотной последовательности из базы данных GenPept.

    protein2 = getgenpept('YP_003024026', 'SequenceOnly', true);
    
  6. Используйте isequal функция для сравнения двух аминокислотных последовательностей.

    isequal (protein1, protein2)
    
    ans =
    
         1
Пример 49. Преобразование гена ND2
  1. Используйте getgenbank функция для извлечения нуклеотидной последовательности для митохондриона человека из базы данных GenBank.

    mitochondria = getgenbank('NC_012920');
    
  2. Определите имя и местоположение второго гена в митохондрионе человека.

    mitochondria.CDS(2).gene
    
    ans =
    
    ND2
    mitochondria.CDS(2).location
    ans =
    
    4470..5511
  3. Извлеките последовательность для гена ND2 из нуклеотидной последовательности.

    ND2gene = mitochondria.Sequence(4470:5511);
    
  4. Преобразуйте ген ND2 на геноме митохондрий человека в аминокислотную последовательность с помощью митохондриального генетического кода позвоночных.

    protein1 = nt2aa(ND2gene,'GeneticCode', 2);
    

    Примечание

    В ND2gene нуклеотидная последовательность, первый кодон ATT, который переведен на M, в то время как последующие ATT кодоны переведены в I. Если вы задаете 'AlternativeStartCodons' на false, затем первый ATT кодон переведен в I, соответствующая аминокислота в митохондриальном генетическом коде позвоночных.

  5. Используйте getgenpept функция для извлечения той же аминокислотной последовательности из базы данных GenPept.

    protein2 = getgenpept('YP_003024027', 'SequenceOnly', true);
    
  6. Используйте isequal функция для сравнения двух аминокислотных последовательностей.

    isequal (protein1, protein2)
    
    ans =
    
         1
Пример 50. Преобразование последовательности с неоднозначными символами

Если у вас есть последовательность с неоднозначными или неизвестными нуклеотидными символами, можно задать 'ACGTOnly' свойство к false иметь nt2aa функция пытается разрешить их:

nt2aa('agttgccgacgcgcncar','ACGTOnly', false)

ans =

SCRRAQ
Представлено до R2006a