exponenta event banner

basecount

Подсчет нуклеотидов в последовательности

Синтаксис

NTStruct = basecount(SeqNT)
NTStruct = basecount(SeqNT, ...'Ambiguous', AmbiguousValue, ...)
NTStruct = basecount(SeqNT, ...'Gaps', GapsValue, ...)
NTStruct = basecount(SeqNT, ...'Chart', ChartValue, ...)

Входные аргументы

SeqNT

Одно из следующих:

AmbiguousValue

Символьный вектор или строка, определяющая способ обработки неоднозначных нуклеотидных символов (R, Y, K, M, S, W, B, D, H, V, или N). Возможны следующие варианты:

  • 'ignore' (по умолчанию) - пропускает неоднозначные символы

  • 'bundle' - Подсчитывает неоднозначные символы и сообщает общее количество в Ambiguous поле.

  • 'prorate' - подсчитывает неоднозначные символы и пропорционально распределяет их в соответствующих полях. Например, количество символов R распределены равномерно между A и G поля.

  • 'individual' - подсчитывает неоднозначные символы и сообщает их в отдельных полях.

  • 'warn' - пропускает неоднозначные символы и выводит предупреждение.

GapsValue

Указывает, должны ли разрывы указываться дефисом (-), подсчитываются или игнорируются. Варианты: true или false (по умолчанию).

ChartValue

Символьный вектор или строка, указывающая тип диаграммы. Варианты: 'pie' или 'bar'.

Выходные аргументы

NTStructСтруктура MATLAB 1 к 1, содержащая поля A, C, G, и T.

Описание

NTStruct = basecount(SeqNT) подсчитывает количество баз каждого типа в SeqNT, нуклеотидную последовательность и возвращает количество в NTStruct, структура MATLAB 1 к 1, содержащая поля A, C, G, и T.

  • Характер U добавляется к T поле.

  • Многозначные нуклеотидные символы (R, Y, K, M, S, W, B, D, H, V, или N) и зазоры, обозначенные дефисом (-), игнорируются по умолчанию.

  • Нераспознанные символы игнорируются и вызывают следующее предупреждение.

    Warning: Unknown symbols appear in the sequence. These will be ignored.

NTStruct = basecount(SeqNT, ...'PropertyName', PropertyValue, ...) требования basecount с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

NTStruct = basecount(SeqNT, ...'Ambiguous', AmbiguousValue, ...) определяет способ обработки неоднозначных нуклеотидных символов (R, Y, K, M, S, W, B, D, H, V, или N). Возможны следующие варианты:

  • 'ignore' (по умолчанию)

  • 'bundle'

  • 'prorate'

  • 'individual'

  • 'warn'

NTStruct = basecount(SeqNT, ...'Gaps', GapsValue, ...) указывает, должны ли разрывы указываться дефисом (-), подсчитываются или игнорируются. Варианты: true или false (по умолчанию).

NTStruct = basecount(SeqNT, ...'Chart', ChartValue, ...) создает диаграмму, показывающую относительные пропорции нуклеотидов. ChartValue может быть 'pie' или 'bar'.

Примеры

свернуть все

Подсчитайте основания в последовательности ДНК и верните результаты в структуру.

bases = basecount('TAGCTGGCCAAGCGAGCTTG')
bases = struct with fields:
    A: 4
    C: 5
    G: 7
    T: 4

Вычислите количество аденозиновых (А) оснований.

bases.A
ans = 4

Подсчитать основания в последовательности ДНК, содержащей неоднозначные символы (R, Y, K, M, S, W, B, D, H, V или N), перечислив каждый из них в отдельном поле.

basecount('ABCDGGCCAAGCGAGCTTG','Ambiguous','individual')
ans = struct with fields:
    A: 4
    C: 5
    G: 6
    T: 2
    R: 0
    Y: 0
    K: 0
    M: 0
    S: 0
    W: 0
    B: 1
    D: 1
    H: 0
    V: 0
    N: 0

Представлен до R2006a