int2nt

Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление

Синтаксис

SeqChar = int2nt(SeqInt)
SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...)
SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...)
SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...)

Входные параметры

SeqInt Вектор-строка из целых чисел, задающий нуклеотидную последовательность. Для допустимых целых чисел смотрите таблицу Сопоставление нуклеотидных целых чисел с буквенными кодами. Целые числа произвольно присваиваются буквам IUB/IUPAC.
AlphabetValue Вектор символов или строка, задающая нуклеотидный алфавит. Варианты:
  • 'DNA' (по умолчанию) - Использует символы A, C, G, и T.

  • 'RNA' - Использует символы A, C, G, и U.

UnknownValue Символ для представления неизвестных нуклеотидов, то есть 0 или целые числа ≥ 17. Выбор представляет собой любой символ, кроме нуклеотидных символов A, C, G, T, и U и неоднозначные нуклеотидные символы N, R, Y, K, M, S, W, B, D, H, и V. По умолчанию это *.
CaseValue Вектор символов или строка, задающая верхний или нижний регистр. Варианты 'upper' (по умолчанию) или 'lower'.

Выходные аргументы

SeqCharНуклеотидная последовательность, заданная вектором символов кодов.

Описание

SeqChar = int2nt(SeqInt) преобразует SeqInt, вектор-строка целых чисел, задающих нуклеотидную последовательность, для SeqChar, вектор символов кодов, задающих ту же нуклеотидную последовательность. Действительные коды см. в таблице Сопоставление нуклеотидных целых чисел с буквенными кодами.

Отображение нуклеотидных целых чисел с буквенными кодами

НуклеотидЦелое числоКод
Аденозин 1A
Цитидин 2C
Гуанин 3G
Тимидин 4T
Уридин (если 'Alphabet' установлено на 'RNA') 4U
Пурин (A или G) 5R
Пиримидин (T или C) 6Y
Кето (G или T) 7K
Амино (A или C) 8M
Сильное взаимодействие (связи 3 H) (G или C) 9S
Слабое взаимодействие (связи 2 H) (A или T) 10W
Не A (C или G или T)11B
Не C (A или G или T)12D
Не G (A или C или T)13H
Не T или U (A или C или G)14V
Любой нуклеотид (A или C или G или T или U) 15N
Зазор неопределенной длины16-
Неизвестно (любое целое число не в таблице) 0 или ≥ 17* (по умолчанию)

SeqChar = int2nt (SeqInt... PropertyName', PropertyValue, ...) вызывает int2nt с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...) задает нуклеотидный алфавит. AlphabetValue можно 'DNA', который использует символы A, C, G, и T, или 'RNA', который использует символы A, C, G, и U. По умолчанию это 'DNA'.

SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...) задает символ для представления неизвестных нуклеотидов, то есть 0 или целые числа ≥ 17. UnknownValue может быть любым символом, кроме нуклеотидных символов A, C, G, T, и U и неоднозначные нуклеотидные символы N, R, Y, K, M, S, W, B, D, H, и V. По умолчанию это *.

SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...) задает верхний или нижний регистр. CaseValue можно 'upper' (по умолчанию) или 'lower'.

Примеры

  • Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление.

    s = int2nt([1 2 4 3 2 4 1 3 2])
    
    s =
    ACTGCTAGC
    
  • Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление и задайте # как символ для неизвестных чисел 17 и больше.

    si = [1 2 4 20 2 4 40 3 2];
    s = int2nt(si, 'unknown', '#')
    
    s =
    ACT#CT#GC
    

См. также

| | |

Представлено до R2006a