codoncount

Количество кодонов в нуклеотидной последовательности

Синтаксис

Codons = codoncount(SeqNT)
[Codons, CodonArray] = codoncount(SeqNT)
... = codoncount(SeqNT, ...'Frame', FrameValue, ...)
... = codoncount(SeqNT, ...'Reverse', ReverseValue, ...)
... = codoncount(SeqNT, ...'Ambiguous', AmbiguousValue, ...)
... = codoncount(SeqNT, ...'Figure', FigureValue, ...)
... = codoncount(SeqNT, ...'GeneticCode', GeneticCodeValue, ...)

Входные параметры

SeqNT

Одно из следующих:

Примеры: 'ACGT' или [1 2 3 4]

FrameValue

Целое число, задающее систему координат считывания в нуклеотидной последовательности. Варианты 1 (по умолчанию), 2, или 3.

ReverseValue

Управляет возвратом количества кодонов для обратной последовательности комплемента нуклеотидной последовательности, заданной SeqNT. Варианты true или false (по умолчанию).

AmbiguousValue

Вектор символов или строка, определяющая, как лечить кодоны, содержащие неоднозначные нуклеотидные символы (R, Y, K, M, S, W, B, D, H, V, или N). Варианты:

  • 'ignore' (по умолчанию) - пропускает кодоны, содержащие неоднозначные символы

  • 'bundle' - Подсчитывает кодоны, содержащие неоднозначные символы, и сообщает общее количество в Ambiguous поле Codons структура output.

  • 'prorate' - подсчитывает кодоны, содержащие неоднозначные символы, и распределяет их пропорционально в соответствующих полях кодонов, содержащих стандартные нуклеотидные символы. Для примера счетчики для кодона ART распределены равномерно между AAT и AGT поля.

  • 'warn' - Пропускает кодоны, содержащие неоднозначные символы, и отображает предупреждение.

FigureValue

Управляет отображением тепловой карты счетчиков кодонов. Варианты true или false (по умолчанию).

GeneticCodeValue

Целое число, вектор символов или строка, задающая номер генетического кода или имя кода из таблицы Генетический код. По умолчанию это 1 или 'Standard'. Можно также задать 'None'.

Совет

Если вы используете имя кода, можно обрезать имя до первых двух букв имени.

Выходные аргументы

CodonsСтруктура MATLAB, содержащая поля для 64 возможных кодонов (AAA, AAC, AAG..., TTG, TTT), которые содержат счетчики кодонов в SeqNT.
CodonArrayМассив 4 на 4 на 4, содержащий сырые данные количества для каждого кодона. Три размерности соответствуют трем позициям в кодоне, и индексы к каждому элементу представлены 1 = A, 2 = C, 3 = G, и 4 = T. Для примера элемент (2,3,4) в массиве содержится количество CGT кодоны.

Описание

Codons = codoncount(SeqNT) считает кодоны в SeqNT, нуклеотидную последовательность, и возвращает количество кодонов в Codons, структура MATLAB, содержащая поля для 64 возможных кодонов (AAA, AAC, AAG..., TTG, TTT).

  • Для последовательностей, которые имеют кодоны, содержащие символ Uэти кодоны добавляются к соответствующим кодонам, содержащим T.

  • Если последовательность содержит погрешности, обозначенные дефисом (-), тогда кодоны, содержащие погрешности, игнорируются.

  • Если последовательность содержит неопознанные символы, кодоны, содержащие эти символы, игнорируются, и появляется следующее предупреждающее сообщение:

    Warning: Unknown symbols appear in the sequence. These will be ignored.

[Codons, CodonArray] = codoncount(SeqNT) возвращает CodonArray, массив 4 на 4 на 4, содержащий сырые данные количества для каждого кодона. Три размерности соответствуют трем позициям в кодоне, и индексы к каждому элементу представлены 1 = A, 2 = C, 3 = G, и 4 = T. Для примера элемент (2,3,4) в массиве содержится количество CGT кодоны.

... = codoncount (SeqNT... 'PropertyName', PropertyValue, ...) вызывает codoncount с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

... = codoncount(SeqNT, ...'Frame', FrameValue, ...) подсчитывает кодоны в системе координат считывания, заданном как FrameValue, который можно 1 (по умолчанию), 2, или 3.

... = codoncount(SeqNT, ...'Reverse', ReverseValue, ...) управляет возвратом количества кодонов для обратной последовательности дополнения SeqNT. Варианты true или false (по умолчанию).

... = codoncount(SeqNT, ...'Ambiguous', AmbiguousValue, ...) задает, как лечить кодоны, содержащие неоднозначные нуклеотидные символы. Варианты:

  • 'ignore' (по умолчанию)

  • 'bundle'

  • 'prorate'

  • 'warn'

... = codoncount(SeqNT, ...'Figure', FigureValue, ...) управляет отображением тепловой карты счетчиков кодонов. Варианты true или false (по умолчанию).

... = codoncount(SeqNT, ...'GeneticCode', GeneticCodeValue, ...) управляет наложением сетки на рисунок тепловой карты. Сетка группирует синонимические кодоны согласно GeneticCodeValue.

Примеры

свернуть все

seq = randseq(1000);
codons = codoncount(seq)
codons = struct with fields:
    AAA: 11
    AAC: 5
    AAG: 8
    AAT: 6
    ACA: 6
    ACC: 7
    ACG: 4
    ACT: 7
    AGA: 6
    AGC: 9
    AGG: 5
    AGT: 2
    ATA: 6
    ATC: 4
    ATG: 4
    ATT: 6
    CAA: 3
    CAC: 5
    CAG: 7
    CAT: 10
    CCA: 5
    CCC: 4
    CCG: 8
    CCT: 5
    CGA: 7
    CGC: 6
    CGG: 5
    CGT: 5
    CTA: 4
    CTC: 7
    CTG: 4
    CTT: 5
    GAA: 5
    GAC: 6
    GAG: 5
    GAT: 4
    GCA: 3
    GCC: 2
    GCG: 8
    GCT: 5
    GGA: 6
    GGC: 7
    GGG: 10
    GGT: 4
    GTA: 2
    GTC: 6
    GTG: 5
    GTT: 2
    TAA: 2
    TAC: 4
    TAG: 1
    TAT: 4
    TCA: 6
    TCC: 2
    TCG: 5
    TCT: 5
    TGA: 4
    TGC: 1
    TGG: 5
    TGT: 8
    TTA: 6
    TTC: 1
    TTG: 8
    TTT: 5

Подсчитайте кодоны во второй системе координат для обратного дополнения последовательности.

r2codons = codoncount(seq,'Frame',2,'Reverse',true)
r2codons = struct with fields:
    AAA: 5
    AAC: 2
    AAG: 5
    AAT: 6
    ACA: 8
    ACC: 4
    ACG: 5
    ACT: 2
    AGA: 5
    AGC: 5
    AGG: 5
    AGT: 7
    ATA: 4
    ATC: 4
    ATG: 10
    ATT: 6
    CAA: 8
    CAC: 5
    CAG: 4
    CAT: 4
    CCA: 5
    CCC: 10
    CCG: 5
    CCT: 5
    CGA: 5
    CGC: 8
    CGG: 8
    CGT: 4
    CTA: 1
    CTC: 5
    CTG: 7
    CTT: 8
    GAA: 1
    GAC: 6
    GAG: 7
    GAT: 4
    GCA: 1
    GCC: 7
    GCG: 6
    GCT: 9
    GGA: 2
    GGC: 2
    GGG: 4
    GGT: 7
    GTA: 4
    GTC: 6
    GTG: 5
    GTT: 5
    TAA: 6
    TAC: 2
    TAG: 4
    TAT: 6
    TCA: 4
    TCC: 6
    TCG: 7
    TCT: 6
    TGA: 6
    TGC: 3
    TGG: 5
    TGT: 6
    TTA: 2
    TTC: 5
    TTG: 3
    TTT: 11

Создайте тепловую карту кодонов и наложите сетку, которая группирует синонимические кодоны согласно стандартному генетическому коду.

codoncount(seq,'Figure', true);
AAA - 11     AAC -  5     AAG -  8     AAT -  6     
ACA -  6     ACC -  7     ACG -  4     ACT -  7     
AGA -  6     AGC -  9     AGG -  5     AGT -  2     
ATA -  6     ATC -  4     ATG -  4     ATT -  6     
CAA -  3     CAC -  5     CAG -  7     CAT - 10     
CCA -  5     CCC -  4     CCG -  8     CCT -  5     
CGA -  7     CGC -  6     CGG -  5     CGT -  5     
CTA -  4     CTC -  7     CTG -  4     CTT -  5     
GAA -  5     GAC -  6     GAG -  5     GAT -  4     
GCA -  3     GCC -  2     GCG -  8     GCT -  5     
GGA -  6     GGC -  7     GGG - 10     GGT -  4     
GTA -  2     GTC -  6     GTG -  5     GTT -  2     
TAA -  2     TAC -  4     TAG -  1     TAT -  4     
TCA -  6     TCC -  2     TCG -  5     TCT -  5     
TGA -  4     TGC -  1     TGG -  5     TGT -  8     
TTA -  6     TTC -  1     TTG -  8     TTT -  5     

Figure contains an axes. The axes contains 67 objects of type image, text, line.

Представлено до R2006a