codoncount

Считайте кодоны в последовательности нуклеотида

Синтаксис

Codons = codoncount(SeqNT)
[Codons, CodonArray] = codoncount(SeqNT)
... = codoncount(SeqNT, ...'Frame', FrameValue, ...)
... = codoncount(SeqNT, ...'Reverse', ReverseValue, ...)
... = codoncount(SeqNT, ...'Ambiguous', AmbiguousValue, ...)
... = codoncount(SeqNT, ...'Figure', FigureValue, ...)
... = codoncount(SeqNT, ...'GeneticCode', GeneticCodeValue, ...)

Входные параметры

SeqNT

Одно из следующего:

Примеры: 'ACGT' или [1 2 3 4]

FrameValue

Целое число, задающее рамку считывания в последовательности нуклеотида. Выбором является 1 (значение по умолчанию), 2 или 3.

ReverseValue

Средства управления возврат кодона значат противоположную дополнительную последовательность последовательности нуклеотида, заданной SeqNT. Выбором является true или false (значение по умолчанию).

AmbiguousValue

Вектор символов или строка, задающая, как обработать кодоны, содержащие неоднозначные символы нуклеотида (R, Y, K, M, S, W, B, D, H, V или N). Выбор:

  • 'ignore' (значение по умолчанию) — Кодоны пропусков, содержащие неоднозначные символы

  • 'bundle' — Кодоны количеств, содержащие неоднозначные символы и отчеты общее количество в поле Ambiguous Codons структура вывода.

  • 'prorate' — Кодоны количеств, содержащие неоднозначные символы и, распределяют их пропорционально в соответствующих полях кодона, содержащих стандартные символы нуклеотида. Например, счета для кодона ART распределяются равномерно между полями AAT и AGT.

  • 'warn' — Кодоны пропусков, содержащие неоднозначные символы и, выводят предупреждение.

FigureValue

Управляет отображением карты тепла количеств кодона. Выбором является true или false (значение по умолчанию).

GeneticCodeValue

Целое число, вектор символов или строка, задающая номер генетического кода или кодовое название из таблицы Genetic Code. Значением по умолчанию является 1 или 'Standard'. Можно также задать 'None'.

Совет

Если вы используете кодовое название, можно обрезать имя к первым двум буквам имени.

Выходные аргументы

CodonsСтруктура MATLAB, содержащая поля для 64 возможных кодонов (AAA, AAC, AAG..., TTG, TTT), которые содержат количества кодона в SeqNT.
CodonArray4 массивом 4 на 4, содержащим необработанные данные о количестве для каждого кодона. Три измерения соответствуют этим трем положениям в кодоне, и индексы к каждому элементу представлены 1 = A, 2 = C, 3 = G и 4 = T. Например, элемент (2,3,4) в массиве содержит количество кодонов CGT.

Описание

Codons = codoncount(SeqNT) считает кодоны в SeqNT, последовательности нуклеотида, и возвращает количества кодона в Codons, структура MATLAB, содержащая поля для 64 возможных кодонов (AAA, AAC, AAG..., TTG, TTT).

  • Для последовательностей, которые имеют кодоны, содержащие символьный U, эти кодоны добавляются к соответствующим кодонам, содержащим T.

  • Если последовательность содержит разрывы, обозначенные дефисом (-), то кодоны, содержащие разрывы, проигнорированы.

  • Если последовательность содержит нераспознанные символы, то кодоны, содержащие эти символы, проигнорированы, и следующее предупреждающее сообщение появляется:

    Warning: Unknown symbols appear in the sequence. These will be ignored.

[Codons, CodonArray] = codoncount(SeqNT) возвращает CodonArray, 4 массивом 4 на 4, содержащим необработанные данные о количестве для каждого кодона. Три измерения соответствуют этим трем положениям в кодоне, и индексы к каждому элементу представлены 1 = A, 2 = C, 3 = G и 4 = T. Например, элемент (2,3,4) в массиве содержит количество кодонов CGT.

... = codoncount(SeqNT, ...'PropertyName', PropertyValue, ...) вызывает codoncount с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

... = codoncount(SeqNT, ...'Frame', FrameValue, ...) считает кодоны в рамке считывания заданными FrameValue, который может быть 1 (значение по умолчанию), 2 или 3.

... = codoncount(SeqNT, ...'Reverse', ReverseValue, ...) средства управления возврат кодона значат противоположную дополнительную последовательность SeqNT. Выбором является true или false (значение по умолчанию).

... = codoncount(SeqNT, ...'Ambiguous', AmbiguousValue, ...) задает, как обработать кодоны, содержащие неоднозначные символы нуклеотида. Выбор:

  • 'ignore' (значение по умолчанию)

  • 'bundle'

  • 'prorate'

  • 'warn'

... = codoncount(SeqNT, ...'Figure', FigureValue, ...) управляет отображением карты тепла количеств кодона. Выбором является true или false (значение по умолчанию).

... = codoncount(SeqNT, ...'GeneticCode', GeneticCodeValue, ...) управляет наложением сетки на фигуре карты тепла. Сетка группирует синонимичные кодоны согласно GeneticCodeValue.

Примеры

свернуть все

seq = randseq(1000);
codons = codoncount(seq)
codons = struct with fields:
    AAA: 11
    AAC: 5
    AAG: 8
    AAT: 6
    ACA: 6
    ACC: 7
    ACG: 4
    ACT: 7
    AGA: 6
    AGC: 9
    AGG: 5
    AGT: 2
    ATA: 6
    ATC: 4
    ATG: 4
    ATT: 6
    CAA: 3
    CAC: 5
    CAG: 7
    CAT: 10
    CCA: 5
    CCC: 4
    CCG: 8
    CCT: 5
    CGA: 7
    CGC: 6
    CGG: 5
    CGT: 5
    CTA: 4
    CTC: 7
    CTG: 4
    CTT: 5
    GAA: 5
    GAC: 6
    GAG: 5
    GAT: 4
    GCA: 3
    GCC: 2
    GCG: 8
    GCT: 5
    GGA: 6
    GGC: 7
    GGG: 10
    GGT: 4
    GTA: 2
    GTC: 6
    GTG: 5
    GTT: 2
    TAA: 2
    TAC: 4
    TAG: 1
    TAT: 4
    TCA: 6
    TCC: 2
    TCG: 5
    TCT: 5
    TGA: 4
    TGC: 1
    TGG: 5
    TGT: 8
    TTA: 6
    TTC: 1
    TTG: 8
    TTT: 5

Считайте кодоны во втором кадре для противоположного дополнения последовательности.

r2codons = codoncount(seq,'Frame',2,'Reverse',true)
r2codons = struct with fields:
    AAA: 5
    AAC: 2
    AAG: 5
    AAT: 6
    ACA: 8
    ACC: 4
    ACG: 5
    ACT: 2
    AGA: 5
    AGC: 5
    AGG: 5
    AGT: 7
    ATA: 4
    ATC: 4
    ATG: 10
    ATT: 6
    CAA: 8
    CAC: 5
    CAG: 4
    CAT: 4
    CCA: 5
    CCC: 10
    CCG: 5
    CCT: 5
    CGA: 5
    CGC: 8
    CGG: 8
    CGT: 4
    CTA: 1
    CTC: 5
    CTG: 7
    CTT: 8
    GAA: 1
    GAC: 6
    GAG: 7
    GAT: 4
    GCA: 1
    GCC: 7
    GCG: 6
    GCT: 9
    GGA: 2
    GGC: 2
    GGG: 4
    GGT: 7
    GTA: 4
    GTC: 6
    GTG: 5
    GTT: 5
    TAA: 6
    TAC: 2
    TAG: 4
    TAT: 6
    TCA: 4
    TCC: 6
    TCG: 7
    TCT: 6
    TGA: 6
    TGC: 3
    TGG: 5
    TGT: 6
    TTA: 2
    TTC: 5
    TTG: 3
    TTT: 11

Создайте карту тепла кодонов и наложите сетку, которая группирует синонимичные кодоны согласно стандартному генетическому коду.

codoncount(seq,'Figure', true);
AAA - 11     AAC -  5     AAG -  8     AAT -  6     
ACA -  6     ACC -  7     ACG -  4     ACT -  7     
AGA -  6     AGC -  9     AGG -  5     AGT -  2     
ATA -  6     ATC -  4     ATG -  4     ATT -  6     
CAA -  3     CAC -  5     CAG -  7     CAT - 10     
CCA -  5     CCC -  4     CCG -  8     CCT -  5     
CGA -  7     CGC -  6     CGG -  5     CGT -  5     
CTA -  4     CTC -  7     CTG -  4     CTT -  5     
GAA -  5     GAC -  6     GAG -  5     GAT -  4     
GCA -  3     GCC -  2     GCG -  8     GCT -  5     
GGA -  6     GGC -  7     GGG - 10     GGT -  4     
GTA -  2     GTC -  6     GTG -  5     GTT -  2     
TAA -  2     TAC -  4     TAG -  1     TAT -  4     
TCA -  6     TCC -  2     TCG -  5     TCT -  5     
TGA -  4     TGC -  1     TGG -  5     TGT -  8     
TTA -  6     TTC -  1     TTG -  8     TTT -  5     

Представлено до R2006a