basecount

Считайте нуклеотиды в последовательности

Синтаксис

NTStruct = basecount(SeqNT)
NTStruct = basecount(SeqNT, ...'Ambiguous', AmbiguousValue, ...)
NTStruct = basecount(SeqNT, ...'Gaps', GapsValue, ...)
NTStruct = basecount(SeqNT, ...'Chart', ChartValue, ...)

Входные параметры

SeqNT

Одно из следующего:

AmbiguousValue

Вектор символов или строка, задающая, как обработать неоднозначные символы нуклеотида (R, Y, K, M, S, W, B, D, H, V или N). Выбор:

  • 'ignore' (значение по умолчанию) — Пропуски неоднозначные символы

  • 'bundle' — Считает неоднозначные символы и сообщает об общем количестве в поле Ambiguous.

  • 'prorate' — Считает неоднозначные символы и распределяет их пропорционально в соответствующих полях. Например, счета для символьного R распределяются равномерно между полями A и G.

  • 'individual' — Считает неоднозначные символы и сообщает о них в отдельных полях.

  • 'warn' — Пропускает неоднозначные символы и выводит предупреждение.

GapsValue

Задает, считаются ли разрывы, обозначенные дефисом (-), или игнорируются. Выбором является true или false (значение по умолчанию).

ChartValue

Вектор символов или строка, задающая тип диаграммы. Выбором является 'pie' или 'bar'.

Выходные аргументы

NTStructСтруктура MATLAB 1 на 1, содержащая поля A, C, G и T.

Описание

NTStruct = basecount(SeqNT) считает количество каждого типа основы в SeqNT, последовательности нуклеотида, и возвращает количества в NTStruct, структура MATLAB 1 на 1, содержащая поля A, C, G и T.

  • Символьный U добавляется к полю T.

  • Неоднозначные символы нуклеотида (R, Y, K, M, S, W, B, D, H, V, или N), и разрывы, обозначенные дефисом (-), проигнорированы по умолчанию.

  • Нераспознанные символы проигнорированы и вызывают следующее предупреждающее сообщение.

    Warning: Unknown symbols appear in the sequence. These will be ignored.

NTStruct = basecount(SeqNT, ...'PropertyName', PropertyValue, ...) вызывает basecount с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

NTStruct = basecount(SeqNT, ...'Ambiguous', AmbiguousValue, ...) задает, как обработать неоднозначные символы нуклеотида (R, Y, K, M, S, W, B, D, H, V или N). Выбор:

  • 'ignore' (значение по умолчанию)

  • 'bundle'

  • 'prorate'

  • 'individual'

  • 'warn'

NTStruct = basecount(SeqNT, ...'Gaps', GapsValue, ...) задает, считаются ли разрывы, обозначенные дефисом (-), или игнорируются. Выбором является true или false (значение по умолчанию).

NTStruct = basecount(SeqNT, ...'Chart', ChartValue, ...) создает график, показывающий относительные пропорции нуклеотидов. ChartValue может быть 'pie' или 'bar'.

Примеры

свернуть все

Считайте основы в последовательности DNA и возвратите результаты в структуре.

bases = basecount('TAGCTGGCCAAGCGAGCTTG')
bases = struct with fields:
    A: 4
    C: 5
    G: 7
    T: 4

Получите счет для аденозина (A) основы.

bases.A
ans = 4

Считайте основы в последовательности DNA, содержащей неоднозначные символы (R, Y, K, M, S, W, B, D, H, V, или N), перечисляя каждого из них в отдельном поле.

basecount('ABCDGGCCAAGCGAGCTTG','Ambiguous','individual')
ans = struct with fields:
    A: 4
    C: 5
    G: 6
    T: 2
    R: 0
    Y: 0
    K: 0
    M: 0
    S: 0
    W: 0
    B: 1
    D: 1
    H: 0
    V: 0
    N: 0

Представлено до R2006a