codonbias

Вычислите частоту кодона для каждой аминокислоты, закодированной в нуклеотидной последовательности

Синтаксис

CodonFreq = codonbias(SeqNT)
CodonFreq = codonbias(SeqNT, ...'GeneticCode', GeneticCodeValue, ...)
CodonFreq = codonbias(SeqNT, ...'Frame', FrameValue, ...)
CodonFreq = codonbias(SeqNT, ...'Reverse', ReverseValue, ...)
CodonFreq = codonbias(SeqNT, ...'Ambiguous', AmbiguousValue, ...)
CodonFreq = codonbias(SeqNT, ...'Pie', PieValue, ...)

Входные параметры

SeqNT

Одно из следующих:

  • Вектор символов или строка, задающая нуклеотидную последовательность

  • Вектор-строка из целых чисел, задающий нуклеотидную последовательность

  • MATLAB® структура, содержащая Sequence поле, которое содержит нуклеотидную последовательность, такую как возвращенная fastaread, fastqread, emblread, getembl, genbankread, или getgenbank

Допустимые символы включают A, C, G, T, и U.

codonbias не считает неоднозначных нуклеотидов или погрешностей.

GeneticCodeValue

Целое число, вектор символов или строка, задающая номер генетического кода или имя кода из таблицы Генетический код. По умолчанию это 1 или 'Standard'.

Совет

Если вы используете имя кода, можно обрезать имя до первых двух букв имени.

FrameValue

Целое число, задающее систему координат считывания в нуклеотидной последовательности. Варианты 1 (по умолчанию), 2, или 3.

ReverseValueУправляет возвратом частоты кодона для обратной последовательности комплемента нуклеотидной последовательности, заданной SeqNT. Варианты true или false (по умолчанию).
AmbiguousValue

Вектор символов или строка, определяющая, как лечить кодоны, содержащие неоднозначные нуклеотидные символы (R, Y, K, M, S, W, B, D, H, V, или N). Варианты:

  • 'ignore' (по умолчанию) - пропускает кодоны, содержащие неоднозначные символы

  • 'prorate' - Подсчитывает кодоны, содержащие неоднозначные символы, и распределяет их пропорционально в соответствующих полях кодонов. Для примера счетчики для кодона ART распределены равномерно между AAT и AGT поля.

  • 'warn' - Пропускает кодоны, содержащие неоднозначные символы, и отображает предупреждение.

PieValueУправляет созданием рисунка из 20 круговых диаграмм, по одной для каждой аминокислоты. Варианты true или false (по умолчанию).

Выходные аргументы

CodonFreqСтруктура MATLAB, содержащая поле для каждой аминокислоты, каждая из которых содержит соответствующие частоты кодона в процентах.

Описание

Многие аминокислоты кодируются двумя или более кодонами нуклеиновых кислот. Однако вероятность того, что конкретный кодон (из всех возможных кодонов для аминокислоты) используется для кодирования аминокислоты, изменяется между последовательностями. Знание частоты каждого кодона в кодирующей белок последовательности для каждой аминокислоты является полезной статистикой.

CodonFreq = codonbias(SeqNT) вычисляет частоту кодона в процентах для каждой аминокислоты, закодированной в SeqNT, нуклеотидную последовательность и возвращает результаты в CodonFreqструктуру MATLAB, содержащую поле для каждой аминокислоты.

CodonFreq = codonbias (SeqNT... 'PropertyName', PropertyValue, ...) вызывает codonbias с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

CodonFreq = codonbias(SeqNT, ...'GeneticCode', GeneticCodeValue, ...) задает генетический код. Варианты для GenetidCodeValue - целое число, вектор символов или строка, задающая номер кода или имя кода из таблицы Генетический код. Если вы используете имя кода, можно обрезать имя до первых двух символов имени. По умолчанию это 1 или 'Standard'.

Совет

Если вы используете имя кода, можно обрезать имя до первых двух букв имени.

CodonFreq = codonbias(SeqNT, ...'Frame', FrameValue, ...) вычисляет частоту кодона в системе координат считывания, заданном FrameValue, который можно 1 (по умолчанию), 2, или 3.

CodonFreq = codonbias(SeqNT, ...'Reverse', ReverseValue, ...) управляет возвратом частоты кодона для обратного дополнения нуклеотидной последовательности, заданной SeqNT. Варианты true или false (по умолчанию).

CodonFreq = codonbias(SeqNT, ...'Ambiguous', AmbiguousValue, ...) задает, как лечить кодоны, содержащие неоднозначные нуклеотидные символы. Варианты 'ignore' (по умолчанию), 'prorate', и 'warn'.

CodonFreq = codonbias(SeqNT, ...'Pie', PieValue, ...) управляет созданием рисунка из 20 круговых диаграмм, по одной для каждой аминокислоты. Варианты true или false (по умолчанию).

Генетический код

Кодовый номерКодовое имя
1Standard
2Vertebrate Mitochondrial
3Yeast Mitochondrial
4Mold, Protozoan, Coelenterate Mitochondrial, и Mycoplasma/Spiroplasma
5Invertebrate Mitochondrial
6Ciliate, Dasycladacean, и Hexamita Nuclear
9Echinoderm Mitochondrial
10Euplotid Nuclear
11Bacterial и Plant Plastid
12Alternative Yeast Nuclear
13Ascidian Mitochondrial
14Flatworm Mitochondrial
15Blepharisma Nuclear
16Chlorophycean Mitochondrial
21Trematode Mitochondrial
22Scenedesmus Obliquus Mitochondrial
23Thraustochytrium Mitochondrial

Примеры

свернуть все

Импорт нуклеотидной последовательности из GenBank® база данных в программное обеспечение MATLAB. Например, извлеките последовательность ДНК, которая кодирует рецептор инсулина человека.

S = getgenbank('M10051');

Вычислите частоту кодона для каждой аминокислоты, кодируемой последовательностью ДНК, и затем постройте график результатов.

cb = codonbias(S.Sequence,'PIE',true)

Получите частоту кодона для аланиновой (А) аминокислоты.

cb.Ala
ans = 

    Codon: {'GCA' "GCC' "GCG' 'GCT'}
     Freq: [0.1600 0.3867 0.2533 02000]   

См. также

| | |

Представлено до R2006a