basecount

Подсчет нуклеотидов в последовательности

Синтаксис

NTStruct = basecount(SeqNT)
NTStruct = basecount(SeqNT, ...'Ambiguous', AmbiguousValue, ...)
NTStruct = basecount(SeqNT, ...'Gaps', GapsValue, ...)
NTStruct = basecount(SeqNT, ...'Chart', ChartValue, ...)

Входные параметры

SeqNT

Одно из следующих:

AmbiguousValue

Вектор символов или строка, определяющая, как лечить неоднозначные нуклеотидные символы (R, Y, K, M, S, W, B, D, H, V, или N). Варианты:

  • 'ignore' (по умолчанию) - Пропускает неоднозначные символы

  • 'bundle' - Подсчитывает неоднозначные символы и сообщает общее количество в Ambiguous поле.

  • 'prorate' - Считает неоднозначные символы и распределяет их пропорционально в соответствующих полях. Для примера счетчики для символа R распределены равномерно между A и G поля.

  • 'individual' - Считает неоднозначные символы и сообщает о них в отдельных полях.

  • 'warn' - Пропускает неоднозначные символы и отображает предупреждение.

GapsValue

Определяет, будут ли погрешности, обозначенные дефисом (-), считаются или игнорируются. Варианты true или false (по умолчанию).

ChartValue

Вектор символов или строка, задающая тип графика. Варианты 'pie' или 'bar'.

Выходные аргументы

NTStructСтруктура MATLAB 1 на 1, содержащая поля A, C, G, и T.

Описание

NTStruct = basecount(SeqNT) подсчитывает количество каждого типа основы в SeqNT, нуклеотидную последовательность и возвращает счетчики в NTStruct, структура MATLAB 1 на 1, содержащая поля A, C, G, и T.

  • Область символа U добавляется к T поле.

  • Неоднозначные нуклеотидные символы (R, Y, K, M, S, W, B, D, H, V, или N) и погрешности, обозначенные дефисом (-), по умолчанию игнорируются.

  • Непризнанные символы игнорируются и вызывают следующее предупреждающее сообщение.

    Warning: Unknown symbols appear in the sequence. These will be ignored.

NTStruct = basecount (SeqNT... 'PropertyName', PropertyValue, ...) вызывает basecount с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

NTStruct = basecount(SeqNT, ...'Ambiguous', AmbiguousValue, ...) задает, как лечить неоднозначные нуклеотидные символы (R, Y, K, M, S, W, B, D, H, V, или N). Варианты:

  • 'ignore' (по умолчанию)

  • 'bundle'

  • 'prorate'

  • 'individual'

  • 'warn'

NTStruct = basecount(SeqNT, ...'Gaps', GapsValue, ...) определяет, будут ли погрешности, обозначенные дефисом (-), считаются или игнорируются. Варианты true или false (по умолчанию).

NTStruct = basecount(SeqNT, ...'Chart', ChartValue, ...) создает график, показывающую относительные пропорции нуклеотидов. ChartValue можно 'pie' или 'bar'.

Примеры

свернуть все

Подсчитайте основы в последовательности ДНК и верните результаты в структуре.

bases = basecount('TAGCTGGCCAAGCGAGCTTG')
bases = struct with fields:
    A: 4
    C: 5
    G: 7
    T: 4

Получите количество для основ аденозина (А).

bases.A
ans = 4

Отсчитывайте основы в последовательности ДНК, содержащей неоднозначные символы (R, Y, K, M, S, W, B, D, H, V или N), перечисляя каждый из них в отдельном поле.

basecount('ABCDGGCCAAGCGAGCTTG','Ambiguous','individual')
ans = struct with fields:
    A: 4
    C: 5
    G: 6
    T: 2
    R: 0
    Y: 0
    K: 0
    M: 0
    S: 0
    W: 0
    B: 1
    D: 1
    H: 0
    V: 0
    N: 0

Представлено до R2006a