codonbias

Вычислите частоту кодона для каждой аминокислоты, закодированной для в последовательности нуклеотида

Синтаксис

CodonFreq = codonbias(SeqNT)
CodonFreq = codonbias(SeqNT, ...'GeneticCode', GeneticCodeValue, ...)
CodonFreq = codonbias(SeqNT, ...'Frame', FrameValue, ...)
CodonFreq = codonbias(SeqNT, ...'Reverse', ReverseValue, ...)
CodonFreq = codonbias(SeqNT, ...'Ambiguous', AmbiguousValue, ...)
CodonFreq = codonbias(SeqNT, ...'Pie', PieValue, ...)

Входные параметры

SeqNT

Одно из следующего:

  • Вектор символов или строка, задающая последовательность нуклеотида

  • Вектор-строка из целых чисел, задающих последовательность нуклеотида

  • MATLAB® структура, содержащая Sequence поле, которое содержит последовательность нуклеотида, такой, как возвращено fastaread, fastqread, emblread, getembl, genbankread, или getgenbank

Допустимые символы включают ACGT, и U.

codonbias не считает неоднозначные нуклеотиды или разрывы.

GeneticCodeValue

Целое число, вектор символов или строка, задающая номер генетического кода или кодовое название из таблицы Genetic Code. Значением по умолчанию является 1 или 'Standard'.

Совет

Если вы используете кодовое название, можно обрезать имя к первым двум буквам имени.

FrameValue

Целое число, задающее рамку считывания в последовательности нуклеотида. Выбором является 1 (значение по умолчанию), 2, или 3.

ReverseValueУправляет возвратом частоты кодона для противоположной дополнительной последовательности последовательности нуклеотида, заданной SeqNT. Выбором является true или false (значение по умолчанию).
AmbiguousValue

Вектор символов или строка, задающая, как обработать кодоны, содержащие неоднозначные символы нуклеотида (RYKMSWBDHV, или N). Выбор:

  • 'ignore' (значение по умолчанию) — Кодоны пропусков, содержащие неоднозначные символы

  • 'prorate' — Кодоны количеств, содержащие неоднозначные символы и, распределяют их пропорционально в соответствующих полях кодона. Например, счета для кодона ART распределяются равномерно между AAT и AGT поля .

  • 'warn' — Кодоны пропусков, содержащие неоднозначные символы и, выводят предупреждение.

PieValueУправляет созданием фигуры 20 круговых диаграмм, один для каждой аминокислоты. Выбором является true или false (значение по умолчанию).

Выходные аргументы

CodonFreqСтруктура MATLAB, содержащая поле для каждой аминокислоты, каждый из которых содержит связанные частоты кодона как проценты.

Описание

Много аминокислот закодированы двумя или больше кодонами нуклеиновой кислоты. Однако вероятность, что определенный кодон (от всех возможных кодонов для аминокислоты) используется, чтобы закодировать аминокислоту, варьируется между последовательностями. Знание частоты каждого кодона в последовательности кодирования белка для каждой аминокислоты является полезной статистической величиной.

CodonFreq = codonbias(SeqNT) вычисляет частоту кодона в проценте для каждой аминокислоты, закодированной для в SeqNT, последовательность нуклеотида, и возвращает результаты в CodonFreq, структура MATLAB, содержащая поле для каждой аминокислоты.

CodonFreq = codonbias (SeqNTPropertyName ', PropertyValue, ...) вызовы codonbias с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

CodonFreq = codonbias(SeqNT, ...'GeneticCode', GeneticCodeValue, ...) задает генетический код. Выбор для GenetidCodeValue целое число, вектор символов или строка, задающая номер кода или кодовое название из таблицы Genetic Code. Если вы используете кодовое название, можно обрезать имя к первым двум символам имени. Значением по умолчанию является 1 или 'Standard'.

Совет

Если вы используете кодовое название, можно обрезать имя к первым двум буквам имени.

CodonFreq = codonbias(SeqNT, ...'Frame', FrameValue, ...) вычисляет частоту кодона в рамке считывания, заданной FrameValue, который может быть 1 (значение по умолчанию), 2, или 3.

CodonFreq = codonbias(SeqNT, ...'Reverse', ReverseValue, ...) управляет возвратом частоты кодона для противоположного дополнения последовательности нуклеотида, заданной SeqNT. Выбором является true или false (значение по умолчанию).

CodonFreq = codonbias(SeqNT, ...'Ambiguous', AmbiguousValue, ...) задает, как обработать кодоны, содержащие неоднозначные символы нуклеотида. Выбором является 'ignore' (значение по умолчанию), 'prorate', и 'warn'.

CodonFreq = codonbias(SeqNT, ...'Pie', PieValue, ...) управляет созданием фигуры 20 круговых диаграмм, один для каждой аминокислоты. Выбором является true или false (значение по умолчанию).

Генетический код

Номер кодаКодовое название
1Standard
2Vertebrate Mitochondrial
3Yeast Mitochondrial
4Mold, Protozoan, Coelenterate Mitochondrial, и Mycoplasma/Spiroplasma
5Invertebrate Mitochondrial
6Ciliate, Dasycladacean, и Hexamita Nuclear
9Echinoderm Mitochondrial
10Euplotid Nuclear
11Bacterial и Plant Plastid
12Alternative Yeast Nuclear
13Ascidian Mitochondrial
14Flatworm Mitochondrial
15Blepharisma Nuclear
16Chlorophycean Mitochondrial
21Trematode Mitochondrial
22Scenedesmus Obliquus Mitochondrial
23Thraustochytrium Mitochondrial

Примеры

свернуть все

Импортируйте последовательность нуклеотида из GenBank® база данных в программное обеспечение MATLAB. Например, получите последовательность ДНК что коды для человеческого приемника инсулина.

S = getgenbank('M10051');

Вычислите частоту кодона для каждой аминокислоты, закодированной для последовательностью ДНК, и затем постройте результаты.

cb = codonbias(S.Sequence,'PIE',true)

Получите частоту кодона для аланина (A) аминокислота.

cb.Ala
ans = 

    Codon: {'GCA' "GCC' "GCG' 'GCT'}
     Freq: [0.1600 0.3867 0.2533 02000]   

Смотрите также

| | |

Представлено до R2006a