exponenta event banner

codoncount

Подсчет кодонов в нуклеотидной последовательности

Синтаксис

Codons = codoncount(SeqNT)
[Codons, CodonArray] = codoncount(SeqNT)
... = codoncount(SeqNT, ...'Frame', FrameValue, ...)
... = codoncount(SeqNT, ...'Reverse', ReverseValue, ...)
... = codoncount(SeqNT, ...'Ambiguous', AmbiguousValue, ...)
... = codoncount(SeqNT, ...'Figure', FigureValue, ...)
... = codoncount(SeqNT, ...'GeneticCode', GeneticCodeValue, ...)

Входные аргументы

SeqNT

Одно из следующих:

Примеры: 'ACGT' или [1 2 3 4]

FrameValue

Целое число, определяющее рамку считывания в нуклеотидной последовательности. Варианты: 1 (по умолчанию), 2, или 3.

ReverseValue

Контролирует возврат количества кодонов для обратной последовательности комплемента нуклеотидной последовательности, указанной SeqNT. Варианты: true или false (по умолчанию).

AmbiguousValue

Символьный вектор или строка, указывающая, как обрабатывать кодоны, содержащие неоднозначные нуклеотидные символы (R, Y, K, M, S, W, B, D, H, V, или N). Возможны следующие варианты:

  • 'ignore' (по умолчанию) - пропускает кодоны, содержащие неоднозначные символы

  • 'bundle' - подсчитывает кодоны, содержащие неоднозначные символы, и сообщает общее количество в Ambiguous области Codons структура вывода.

  • 'prorate' - подсчитывает кодоны, содержащие неоднозначные символы, и распределяет их пропорционально в соответствующих полях кодонов, содержащих стандартные нуклеотидные символы. Например, счетчики для кодона ART распределены равномерно между AAT и AGT поля.

  • 'warn' - пропускает кодоны, содержащие неоднозначные символы, и отображает предупреждение.

FigureValue

Управляет отображением тепловой карты количества кодонов. Варианты: true или false (по умолчанию).

GeneticCodeValue

Целое число, символьный вектор или строка, указывающая номер генетического кода или имя кода из таблицы Генетический код. По умолчанию: 1 или 'Standard'. Можно также указать 'None'.

Совет

При использовании кодового имени можно усечь имя до первых двух букв имени.

Выходные аргументы

CodonsСтруктура MATLAB, содержащая поля для 64 возможных кодонов (AAA, AAC, AAG, ..., TTG, TTT), которые содержат количество кодонов в SeqNT.
CodonArrayМассив 4 на 4, содержащий необработанные данные подсчета для каждого кодона. Три измерения соответствуют трем положениям в кодоне, и индексы для каждого элемента представлены 1 = A, 2 = C, 3 = G, и 4 = T. Например, элемент (2,3,4) в массиве содержит количество CGT кодоны.

Описание

Codons = codoncount(SeqNT) подсчитывает кодоны в SeqNTнуклеотидная последовательность и возвращает количество кодонов в Codonsструктура MATLAB, содержащая поля для 64 возможных кодонов (AAA, AAC, AAG, ..., TTG, TTT).

  • Для последовательностей, которые имеют кодоны, содержащие символ U, эти кодоны добавляют к соответствующим кодонам, содержащим T.

  • Если последовательность содержит пробелы, обозначенные дефисом (-), то кодоны, содержащие промежутки, игнорируются.

  • Если последовательность содержит нераспознанные символы, то кодоны, содержащие эти символы, игнорируются, и появляется следующее предупреждающее сообщение:

    Warning: Unknown symbols appear in the sequence. These will be ignored.

[Codons, CodonArray] = codoncount(SeqNT) прибыль CodonArray, множество 4 на 4 на 4, содержащее сырые данные количества для каждого кодона. Три измерения соответствуют трем положениям в кодоне, и индексы для каждого элемента представлены 1 = A, 2 = C, 3 = G, и 4 = T. Например, элемент (2,3,4) в массиве содержит количество CGT кодоны.

... = codoncount(SeqNT, ...'PropertyName', PropertyValue, ...) требования codoncount с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

... = codoncount(SeqNT, ...'Frame', FrameValue, ...) подсчитывает кодоны в рамке считывания, указанной FrameValue, который может быть 1 (по умолчанию), 2, или 3.

... = codoncount(SeqNT, ...'Reverse', ReverseValue, ...) контролирует возврат количества кодонов для обратной комплементной последовательности SeqNT. Варианты: true или false (по умолчанию).

... = codoncount(SeqNT, ...'Ambiguous', AmbiguousValue, ...) определяет способ обработки кодонов, содержащих неоднозначные нуклеотидные символы. Возможны следующие варианты:

  • 'ignore' (по умолчанию)

  • 'bundle'

  • 'prorate'

  • 'warn'

... = codoncount(SeqNT, ...'Figure', FigureValue, ...) управляет отображением тепловой карты количества кодонов. Варианты: true или false (по умолчанию).

... = codoncount(SeqNT, ...'GeneticCode', GeneticCodeValue, ...) управляет наложением сетки на рисунке тепловой карты. Сетка группирует синонимичные кодоны по GeneticCodeValue.

Примеры

свернуть все

seq = randseq(1000);
codons = codoncount(seq)
codons = struct with fields:
    AAA: 11
    AAC: 5
    AAG: 8
    AAT: 6
    ACA: 6
    ACC: 7
    ACG: 4
    ACT: 7
    AGA: 6
    AGC: 9
    AGG: 5
    AGT: 2
    ATA: 6
    ATC: 4
    ATG: 4
    ATT: 6
    CAA: 3
    CAC: 5
    CAG: 7
    CAT: 10
    CCA: 5
    CCC: 4
    CCG: 8
    CCT: 5
    CGA: 7
    CGC: 6
    CGG: 5
    CGT: 5
    CTA: 4
    CTC: 7
    CTG: 4
    CTT: 5
    GAA: 5
    GAC: 6
    GAG: 5
    GAT: 4
    GCA: 3
    GCC: 2
    GCG: 8
    GCT: 5
    GGA: 6
    GGC: 7
    GGG: 10
    GGT: 4
    GTA: 2
    GTC: 6
    GTG: 5
    GTT: 2
    TAA: 2
    TAC: 4
    TAG: 1
    TAT: 4
    TCA: 6
    TCC: 2
    TCG: 5
    TCT: 5
    TGA: 4
    TGC: 1
    TGG: 5
    TGT: 8
    TTA: 6
    TTC: 1
    TTG: 8
    TTT: 5

Подсчитывают кодоны во втором кадре для обратного дополнения последовательности.

r2codons = codoncount(seq,'Frame',2,'Reverse',true)
r2codons = struct with fields:
    AAA: 5
    AAC: 2
    AAG: 5
    AAT: 6
    ACA: 8
    ACC: 4
    ACG: 5
    ACT: 2
    AGA: 5
    AGC: 5
    AGG: 5
    AGT: 7
    ATA: 4
    ATC: 4
    ATG: 10
    ATT: 6
    CAA: 8
    CAC: 5
    CAG: 4
    CAT: 4
    CCA: 5
    CCC: 10
    CCG: 5
    CCT: 5
    CGA: 5
    CGC: 8
    CGG: 8
    CGT: 4
    CTA: 1
    CTC: 5
    CTG: 7
    CTT: 8
    GAA: 1
    GAC: 6
    GAG: 7
    GAT: 4
    GCA: 1
    GCC: 7
    GCG: 6
    GCT: 9
    GGA: 2
    GGC: 2
    GGG: 4
    GGT: 7
    GTA: 4
    GTC: 6
    GTG: 5
    GTT: 5
    TAA: 6
    TAC: 2
    TAG: 4
    TAT: 6
    TCA: 4
    TCC: 6
    TCG: 7
    TCT: 6
    TGA: 6
    TGC: 3
    TGG: 5
    TGT: 6
    TTA: 2
    TTC: 5
    TTG: 3
    TTT: 11

Создайте тепловую карту кодонов и наложите сетку, которая группирует синонимичные кодоны согласно стандартному генетическому коду.

codoncount(seq,'Figure', true);
AAA - 11     AAC -  5     AAG -  8     AAT -  6     
ACA -  6     ACC -  7     ACG -  4     ACT -  7     
AGA -  6     AGC -  9     AGG -  5     AGT -  2     
ATA -  6     ATC -  4     ATG -  4     ATT -  6     
CAA -  3     CAC -  5     CAG -  7     CAT - 10     
CCA -  5     CCC -  4     CCG -  8     CCT -  5     
CGA -  7     CGC -  6     CGG -  5     CGT -  5     
CTA -  4     CTC -  7     CTG -  4     CTT -  5     
GAA -  5     GAC -  6     GAG -  5     GAT -  4     
GCA -  3     GCC -  2     GCG -  8     GCT -  5     
GGA -  6     GGC -  7     GGG - 10     GGT -  4     
GTA -  2     GTC -  6     GTG -  5     GTT -  2     
TAA -  2     TAC -  4     TAG -  1     TAT -  4     
TCA -  6     TCC -  2     TCG -  5     TCT -  5     
TGA -  4     TGC -  1     TGG -  5     TGT -  8     
TTA -  6     TTC -  1     TTG -  8     TTT -  5     

Figure contains an axes. The axes contains 67 objects of type image, text, line.

Представлен до R2006a