dimercount

Считайте димеры в последовательности нуклеотида

Синтаксис

Dimers = dimercount(SeqNT)
[Dimers, Percent] = dimercount(SeqNT)
... = dimercount(SeqNT, 'Ambiguous', AmbiguousValue)
... = dimercount(SeqNT, 'Chart', ChartValue)

Входные параметры

SeqNT

Одно из следующего:

Примеры: 'ACGT' или [1 2 3 4]

AmbiguousValue

Вектор символов или строка, задающая, как обработать димеры, содержащие неоднозначные символы нуклеотида (RYKMSWBDHV, или N). Выбор:

  • 'ignore' (значение по умолчанию) — Димеры пропусков, содержащие неоднозначные символы

  • 'bundle' — Димеры количеств, содержащие неоднозначные символы и отчеты общее количество в Ambiguous поле Dimers вывод структуры.

  • 'prorate' — Димеры количеств, содержащие неоднозначные символы и, распределяют их пропорционально в соответствующих полях димера, содержащих стандартные символы нуклеотида. Например, счета для димера AR распределяются равномерно между AA и AG поля .

  • 'warn' — Димеры пропусков, содержащие неоднозначные символы и, выводят предупреждение.

ChartValue Вектор символов или строка, задающая тип диаграммы. Выбором является 'pie' или 'bar'.

Выходные аргументы

DimersСтруктура MATLAB, содержащая поля AA, AC, AG, AT, CAcc , CGct , GA, GC, GG&gttA , TC, TG, и TT, которые содержат количества димера в SeqNT.
PercentМатрица 4 на 4 с относительными пропорциями димеров в SeqNT. Строки соответствуют ACG, и T в первом элементе димера и столбцах соответствуют ACG, и T во втором элементе димера.

Описание

Dimers = dimercount(SeqNT) считает димеры нуклеотида в SeqNT, последовательность нуклеотида, и возвращает количества димера в Dimers, структура MATLAB, содержащая поля AA, AC, AG, AT, CAcc , CGct , GA, GC, GG&gttA , TC, TG, и TT.

  • Для последовательностей, которые имеют димеры с символьным U, эти димеры добавляются к соответствующим димерам, содержащим T.

  • Если последовательность содержит разрывы, обозначенные дефисом (-), разрывы проигнорированы, и эти два символа по обе стороны от разрыва считаются как димер.

  • Если последовательность содержит нераспознанные символы, то димеры, содержащие эти символы, проигнорированы, и следующее предупреждающее сообщение появляется:

    Warning: Unknown symbols appear in the sequence. These will be ignored.

[Dimers, Percent] = dimercount(SeqNT) возвращает Percent, матрица 4 на 4 с относительными пропорциями димеров в SeqNT. Строки соответствуют ACG, и T в первом элементе димера и столбцах соответствуют ACG, и T во втором элементе димера.

... = dimercount(SeqNT, 'Ambiguous', AmbiguousValue) задает, как обработать димеры, содержащие неоднозначные символы нуклеотида. Выбор:

  • 'ignore' (значение по умолчанию)

  • 'bundle'

  • 'prorate'

  • 'warn'

... = dimercount(SeqNT, 'Chart', ChartValue) создает график, показывающий относительные пропорции димеров. ChartValue может быть 'pie' или 'bar'.

Примеры

свернуть все

seq = randseq(100)
seq = 
'TTATGACGTTATTCTACTTTGATTGTGCGAGACAATGCTACCTTACCGGTCGGAACTCGATCGGTTGAACTCTATCACGCCTGGTCTTCGAAGTTAGCAC'
[Dimers, Percent] = dimercount(seq)
Dimers = struct with fields:
    AA: 4
    AC: 9
    AG: 3
    AT: 6
    CA: 3
    CC: 3
    CG: 8
    CT: 9
    GA: 8
    GC: 4
    GG: 4
    GT: 6
    TA: 7
    TC: 8
    TG: 7
    TT: 10

Percent = 4×4

    0.0404    0.0909    0.0303    0.0606
    0.0303    0.0303    0.0808    0.0909
    0.0808    0.0404    0.0404    0.0606
    0.0707    0.0808    0.0707    0.1010

Смотрите также

| | | | |

Представлено до R2006a