exponenta event banner

dimercount

Подсчет димеров в нуклеотидной последовательности

Синтаксис

Dimers = dimercount(SeqNT)
[Dimers, Percent] = dimercount(SeqNT)
... = dimercount(SeqNT, 'Ambiguous', AmbiguousValue)
... = dimercount(SeqNT, 'Chart', ChartValue)

Входные аргументы

SeqNT

Одно из следующих:

Примеры: 'ACGT' или [1 2 3 4]

AmbiguousValue

Символьный вектор или строка, указывающая, как обрабатывать димеры, содержащие неоднозначные нуклеотидные символы (R, Y, K, M, S, W, B, D, H, V, или N). Возможны следующие варианты:

  • 'ignore' (по умолчанию) - пропускает димеры, содержащие неоднозначные символы

  • 'bundle' - подсчитывает димеры, содержащие неоднозначные символы, и сообщает общее количество в Ambiguous области Dimers структура вывода.

  • 'prorate' - подсчитывает димеры, содержащие неоднозначные символы, и распределяет их пропорционально в соответствующих димерных полях, содержащих стандартные нуклеотидные символы. Например, счетчики для димера AR распределены равномерно между AA и AG поля.

  • 'warn' - пропускает димеры, содержащие неоднозначные символы, и отображает предупреждение.

ChartValue Символьный вектор или строка, указывающая тип диаграммы. Варианты: 'pie' или 'bar'.

Выходные аргументы

DimersСтруктура MATLAB, содержащая поля AA, AC, AG, AT, CA, CC, CG, CT, GA, GC, GG, GT, TA, TC, TG, и TT, которые содержат количество димеров в SeqNT.
PercentМатрица 4 на 4 с относительными пропорциями димеров в SeqNT. Строки соответствуют A, C, G, и T в первом элементе димера, и колонки соответствуют A, C, G, и T во втором элементе димера.

Описание

Dimers = dimercount(SeqNT) подсчитывает нуклеотидные димеры в SeqNTнуклеотидная последовательность и возвращает количество димеров в Dimers, структура MATLAB, содержащая поля AA, AC, AG, AT, CA, CC, CG, CT, GA, GC, GG, GT, TA, TC, TG, и TT.

  • Для последовательностей, имеющих димеры с символом U, эти димеры добавляют к соответствующим димерам, содержащим T.

  • Если последовательность содержит пробелы, обозначенные дефисом (-), промежутки игнорируются, и два символа с каждой стороны промежутка считаются димером.

  • Если последовательность содержит нераспознанные символы, димеры, содержащие эти символы, игнорируются, и появляется следующее предупреждение:

    Warning: Unknown symbols appear in the sequence. These will be ignored.

[Dimers, Percent] = dimercount(SeqNT) прибыль Percentматрица 4 на 4 с относительными пропорциями димеров в SeqNT. Строки соответствуют A, C, G, и T в первом элементе димера, и колонки соответствуют A, C, G, и T во втором элементе димера.

... = dimercount(SeqNT, 'Ambiguous', AmbiguousValue) определяет способ обработки димеров, содержащих неоднозначные нуклеотидные символы. Возможны следующие варианты:

  • 'ignore' (по умолчанию)

  • 'bundle'

  • 'prorate'

  • 'warn'

... = dimercount(SeqNT, 'Chart', ChartValue) создает диаграмму, показывающую относительные пропорции димеров. ChartValue может быть 'pie' или 'bar'.

Примеры

свернуть все

seq = randseq(100)
seq = 
'TTATGACGTTATTCTACTTTGATTGTGCGAGACAATGCTACCTTACCGGTCGGAACTCGATCGGTTGAACTCTATCACGCCTGGTCTTCGAAGTTAGCAC'
[Dimers, Percent] = dimercount(seq)
Dimers = struct with fields:
    AA: 4
    AC: 9
    AG: 3
    AT: 6
    CA: 3
    CC: 3
    CG: 8
    CT: 9
    GA: 8
    GC: 4
    GG: 4
    GT: 6
    TA: 7
    TC: 8
    TG: 7
    TT: 10

Percent = 4×4

    0.0404    0.0909    0.0303    0.0606
    0.0303    0.0303    0.0808    0.0909
    0.0808    0.0404    0.0404    0.0606
    0.0707    0.0808    0.0707    0.1010

Представлен до R2006a