exponenta event banner

codonbias

Вычислить частоту кодонов для каждой аминокислоты, кодированной в нуклеотидной последовательности

Синтаксис

CodonFreq = codonbias(SeqNT)
CodonFreq = codonbias(SeqNT, ...'GeneticCode', GeneticCodeValue, ...)
CodonFreq = codonbias(SeqNT, ...'Frame', FrameValue, ...)
CodonFreq = codonbias(SeqNT, ...'Reverse', ReverseValue, ...)
CodonFreq = codonbias(SeqNT, ...'Ambiguous', AmbiguousValue, ...)
CodonFreq = codonbias(SeqNT, ...'Pie', PieValue, ...)

Входные аргументы

SeqNT

Одно из следующих:

  • Символьный вектор или строка, задающая нуклеотидную последовательность

  • Вектор ряда целых чисел, указывающий нуклеотидную последовательность

  • Структура MATLAB ®, содержащая Sequence поле, которое содержит нуклеотидную последовательность, такую как возвращенная fastaread, fastqread, emblread, getembl, genbankread, или getgenbank

Допустимые символы: A, C, G, T, и U.

codonbias не считает неоднозначные нуклеотиды или промежутки.

GeneticCodeValue

Целое число, символьный вектор или строка, указывающая номер генетического кода или имя кода из таблицы Генетический код. По умолчанию: 1 или 'Standard'.

Совет

При использовании кодового имени можно усечь имя до первых двух букв имени.

FrameValue

Целое число, определяющее рамку считывания в нуклеотидной последовательности. Варианты: 1 (по умолчанию), 2, или 3.

ReverseValueКонтролирует возврат частоты кодона для обратной последовательности комплемента нуклеотидной последовательности, указанной SeqNT. Варианты: true или false (по умолчанию).
AmbiguousValue

Символьный вектор или строка, указывающая, как обрабатывать кодоны, содержащие неоднозначные нуклеотидные символы (R, Y, K, M, S, W, B, D, H, V, или N). Возможны следующие варианты:

  • 'ignore' (по умолчанию) - пропускает кодоны, содержащие неоднозначные символы

  • 'prorate' - подсчитывает кодоны, содержащие неоднозначные символы, и пропорционально распределяет их в соответствующих полях кодонов. Например, счетчики для кодона ART распределены равномерно между AAT и AGT поля.

  • 'warn' - пропускает кодоны, содержащие неоднозначные символы, и отображает предупреждение.

PieValueКонтролирует создание фигуры в 20 круговых диаграмм, по одной на каждую аминокислоту. Варианты: true или false (по умолчанию).

Выходные аргументы

CodonFreqСтруктура MATLAB, содержащая поле для каждой аминокислоты, каждая из которых содержит связанные частоты кодонов в процентах.

Описание

Многие аминокислоты кодируются двумя или более кодонами нуклеиновых кислот. Однако вероятность того, что специфический кодон (из всех возможных кодонов для аминокислоты) используется для кодирования аминокислоты, варьируется между последовательностями. Знание частоты каждого кодона в белковой кодирующей последовательности для каждой аминокислоты является полезной статистикой.

CodonFreq = codonbias(SeqNT) вычисляет частоту кодона в процентах для каждой аминокислоты, кодированной для SeqNTнуклеотидная последовательность и возвращает результаты в CodonFreqструктура MATLAB, содержащая поле для каждой аминокислоты.

CodonFreq = codonbias(SeqNT, ...'PropertyName', PropertyValue, ...) требования codonbias с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

CodonFreq = codonbias(SeqNT, ...'GeneticCode', GeneticCodeValue, ...) указывает генетический код. Варианты для GenetidCodeValue - целое число, символьный вектор или строка, указывающая кодовый номер или кодовое имя из таблицы Генетический код. При использовании кодового имени можно усечь имя до первых двух символов имени. По умолчанию: 1 или 'Standard'.

Совет

При использовании кодового имени можно усечь имя до первых двух букв имени.

CodonFreq = codonbias(SeqNT, ...'Frame', FrameValue, ...) вычисляет частоту кодона в кадре считывания, указанном FrameValue, который может быть 1 (по умолчанию), 2, или 3.

CodonFreq = codonbias(SeqNT, ...'Reverse', ReverseValue, ...) контролирует возврат частоты кодона для обратного комплемента нуклеотидной последовательности, указанной SeqNT. Варианты: true или false (по умолчанию).

CodonFreq = codonbias(SeqNT, ...'Ambiguous', AmbiguousValue, ...) определяет способ обработки кодонов, содержащих неоднозначные нуклеотидные символы. Варианты: 'ignore' (по умолчанию), 'prorate', и 'warn'.

CodonFreq = codonbias(SeqNT, ...'Pie', PieValue, ...) контролирует создание фигуры в 20 круговых диаграмм, по одной на каждую аминокислоту. Варианты: true или false (по умолчанию).

Генетический код

Кодовый номерКодовое имя
1Standard
2Vertebrate Mitochondrial
3Yeast Mitochondrial
4Mold, Protozoan, Coelenterate Mitochondrial, и Mycoplasma/Spiroplasma
5Invertebrate Mitochondrial
6Ciliate, Dasycladacean, и Hexamita Nuclear
9Echinoderm Mitochondrial
10Euplotid Nuclear
11Bacterial и Plant Plastid
12Alternative Yeast Nuclear
13Ascidian Mitochondrial
14Flatworm Mitochondrial
15Blepharisma Nuclear
16Chlorophycean Mitochondrial
21Trematode Mitochondrial
22Scenedesmus Obliquus Mitochondrial
23Thraustochytrium Mitochondrial

Примеры

свернуть все

Импорт нуклеотидной последовательности из базы данных GenBank ® в программное обеспечение MATLAB. Например, извлекают последовательность ДНК, которая кодирует инсулиновый рецептор человека.

S = getgenbank('M10051');

Вычислите частоту кодонов для каждой аминокислоты, кодированной последовательностью ДНК, и затем постройте график результатов.

cb = codonbias(S.Sequence,'PIE',true)

Получить частоту кодонов для аминокислоты аланина (А).

cb.Ala
ans = 

    Codon: {'GCA' "GCC' "GCG' 'GCT'}
     Freq: [0.1600 0.3867 0.2533 02000]   

См. также

| | |

Представлен до R2006a