dimercount

Отсчет димеров в нуклеотидной последовательности

Синтаксис

Dimers = dimercount(SeqNT)
[Dimers, Percent] = dimercount(SeqNT)
... = dimercount(SeqNT, 'Ambiguous', AmbiguousValue)
... = dimercount(SeqNT, 'Chart', ChartValue)

Входные параметры

SeqNT

Одно из следующих:

Примеры: 'ACGT' или [1 2 3 4]

AmbiguousValue

Вектор символов или строка, определяющая, как лечить димеры, содержащие неоднозначные нуклеотидные символы (R, Y, K, M, S, W, B, D, H, V, или N). Варианты:

  • 'ignore' (по умолчанию) - пропускает димеры, содержащие неоднозначные символы

  • 'bundle' - Подсчитывает димеры, содержащие неоднозначные символы, и сообщает общее количество в Ambiguous поле Dimers структура output.

  • 'prorate' - Считает димеры, содержащие неоднозначные символы, и распределяет их пропорционально в соответствующих полях димера, содержащих стандартные нуклеотидные символы. Для примера отсчеты для димера AR распределены равномерно между AA и AG поля.

  • 'warn' - Пропускает димеры, содержащие неоднозначные символы, и отображает предупреждение.

ChartValue Вектор символов или строка, задающая тип графика. Варианты 'pie' или 'bar'.

Выходные аргументы

DimersСтруктура MATLAB, содержащая поля AA, AC, AG, AT, CA, CC, CG, CT, GA, GC, GG, GT, TA, TC, TG, и TT, которые содержат счетчики димера в SeqNT.
PercentМатрица 4 на 4 с относительными пропорциями димеров в SeqNT. Строки соответствуют A, C, G, и T в первом элементе димера и столбцы соответствуют A, C, G, и T во втором элементе димера.

Описание

Dimers = dimercount(SeqNT) считает нуклеотидные димеры в SeqNT, нуклеотидную последовательность, и возвращает количество димеров в Dimers, структуру MATLAB, содержащую поля AA, AC, AG, AT, CA, CC, CG, CT, GA, GC, GG, GT, TA, TC, TG, и TT.

  • Для последовательностей, которые имеют димеры с символом Uэти димеры добавляют к соответствующим димерам, содержащим T.

  • Если последовательность содержит погрешности, обозначенные дефисом (-), погрешности игнорируются, и два символа с обеих сторон зазора считаются димером.

  • Если последовательность содержит непризнанные символы, димеры, содержащие эти символы, игнорируются, и появляется следующее предупреждающее сообщение:

    Warning: Unknown symbols appear in the sequence. These will be ignored.

[Dimers, Percent] = dimercount(SeqNT) возвращает Percentматрица 4 на 4 с относительными пропорциями димеров в SeqNT. Строки соответствуют A, C, G, и T в первом элементе димера и столбцы соответствуют A, C, G, и T во втором элементе димера.

... = dimercount(SeqNT, 'Ambiguous', AmbiguousValue) определяет, как лечить димеры, содержащие неоднозначные нуклеотидные символы. Варианты:

  • 'ignore' (по умолчанию)

  • 'bundle'

  • 'prorate'

  • 'warn'

... = dimercount(SeqNT, 'Chart', ChartValue) создает график, показывающую относительные пропорции димеров. ChartValue можно 'pie' или 'bar'.

Примеры

свернуть все

seq = randseq(100)
seq = 
'TTATGACGTTATTCTACTTTGATTGTGCGAGACAATGCTACCTTACCGGTCGGAACTCGATCGGTTGAACTCTATCACGCCTGGTCTTCGAAGTTAGCAC'
[Dimers, Percent] = dimercount(seq)
Dimers = struct with fields:
    AA: 4
    AC: 9
    AG: 3
    AT: 6
    CA: 3
    CC: 3
    CG: 8
    CT: 9
    GA: 8
    GC: 4
    GG: 4
    GT: 6
    TA: 7
    TC: 8
    TG: 7
    TT: 10

Percent = 4×4

    0.0404    0.0909    0.0303    0.0606
    0.0303    0.0303    0.0808    0.0909
    0.0808    0.0404    0.0404    0.0606
    0.0707    0.0808    0.0707    0.1010

Представлено до R2006a