Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление
SeqChar = int2nt(SeqInt)
SeqChar = int2nt(SeqInt,
...'Alphabet', AlphabetValue, ...)
SeqChar = int2nt(SeqInt,
...'Unknown', UnknownValue, ...)
SeqChar = int2nt(SeqInt,
...'Case', CaseValue, ...)
SeqInt | Вектор-строка из целых чисел, задающий нуклеотидную последовательность. Для допустимых целых чисел смотрите таблицу Сопоставление нуклеотидных целых чисел с буквенными кодами. Целые числа произвольно присваиваются буквам IUB/IUPAC. |
AlphabetValue | Вектор символов или строка, задающая нуклеотидный алфавит. Варианты:
|
UnknownValue | Символ для представления неизвестных нуклеотидов, то есть 0 или целые числа ≥ 17. Выбор представляет собой любой символ, кроме нуклеотидных символов A, C, G, T, и U и неоднозначные нуклеотидные символы N, R, Y, K, M, S, W, B, D, H, и V. По умолчанию это *. |
CaseValue | Вектор символов или строка, задающая верхний или нижний регистр. Варианты 'upper' (по умолчанию) или 'lower'. |
SeqChar | Нуклеотидная последовательность, заданная вектором символов кодов. |
преобразует SeqChar = int2nt(SeqInt)SeqInt, вектор-строка целых чисел, задающих нуклеотидную последовательность, для SeqChar, вектор символов кодов, задающих ту же нуклеотидную последовательность. Действительные коды см. в таблице Сопоставление нуклеотидных целых чисел с буквенными кодами.
Отображение нуклеотидных целых чисел с буквенными кодами
| Нуклеотид | Целое число | Код |
|---|---|---|
| Аденозин | 1 | A |
| Цитидин | 2 | C |
| Гуанин | 3 | G |
| Тимидин | 4 | T |
Уридин (если 'Alphabet' установлено на 'RNA') | 4 | U |
Пурин (A или G) | 5 | R |
Пиримидин (T или C) | 6 | Y |
Кето (G или T) | 7 | K |
Амино (A или C) | 8 | M |
Сильное взаимодействие (связи 3 H) (G или C) | 9 | S |
Слабое взаимодействие (связи 2 H) (A или T) | 10 | W |
Не A (C или G или T) | 11 | B |
Не C (A или G или T) | 12 | D |
Не G (A или C или T) | 13 | H |
Не T или U (A или C или G) | 14 | V |
Любой нуклеотид (A или C или G или T или U) | 15 | N |
| Зазор неопределенной длины | 16 | - |
| Неизвестно (любое целое число не в таблице) | 0 или ≥ 17 | * (по умолчанию) |
вызывает SeqChar = int2nt (SeqInt... PropertyName', PropertyValue, ...)int2nt с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
задает нуклеотидный алфавит. SeqChar = int2nt(SeqInt,
...'Alphabet', AlphabetValue, ...)AlphabetValue можно 'DNA', который использует символы A, C, G, и T, или 'RNA', который использует символы A, C, G, и U. По умолчанию это 'DNA'.
задает символ для представления неизвестных нуклеотидов, то есть SeqChar = int2nt(SeqInt,
...'Unknown', UnknownValue, ...)0 или целые числа ≥ 17. UnknownValue может быть любым символом, кроме нуклеотидных символов A, C, G, T, и U и неоднозначные нуклеотидные символы N, R, Y, K, M, S, W, B, D, H, и V. По умолчанию это *.
задает верхний или нижний регистр. SeqChar = int2nt(SeqInt,
...'Case', CaseValue, ...)CaseValue можно 'upper' (по умолчанию) или 'lower'.
Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление.
s = int2nt([1 2 4 3 2 4 1 3 2]) s = ACTGCTAGC
Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление и задайте # как символ для неизвестных чисел 17 и больше.
si = [1 2 4 20 2 4 40 3 2]; s = int2nt(si, 'unknown', '#') s = ACT#CT#GC
aa2int | baselookup | int2aa | nt2int