Преобразование нуклеотидной последовательности из целочисленного в буквенное представление
SeqChar = int2nt(SeqInt)
SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...)
SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...)
SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...)
SeqInt | Вектор ряда целых чисел, определяющих нуклеотидную последовательность. Допустимые целые числа см. в таблице Отображение нуклеотидных целых чисел в буквенные коды. Целые числа произвольно присваиваются буквам IUB/IUPAC. |
AlphabetValue | Символьный вектор или строка, задающая нуклеотидный алфавит. Возможны следующие варианты:
|
UnknownValue | Символ для представления неизвестных нуклеотидов, то есть 0 или целые числа ≥ 17. Выбор - это любой символ, отличный от нуклеотидных символов. A, C, G, T, и U и многозначные нуклеотидные символы N, R, Y, K, M, S, W, B, D, H, и V. По умолчанию: *. |
CaseValue | Символьный вектор или строка, задающая верхний или нижний регистр. Варианты: 'upper' (по умолчанию) или 'lower'. |
SeqChar | Нуклеотидная последовательность, определенная символьным вектором кодов. |
новообращенные SeqChar = int2nt(SeqInt)SeqInt, вектор ряда целых чисел, указывающий нуклеотидную последовательность, SeqChar, символьный вектор кодов, указывающий одну и ту же нуклеотидную последовательность. Допустимые коды см. в таблице Отображение нуклеотидных целых чисел в буквенные коды.
Отображение нуклеотидных целых чисел на буквенные коды
| Нуклеотид | Целое число | Кодекс |
|---|---|---|
| Аденозин | 1 | A |
| Цитидин | 2 | C |
| Гуанин | 3 | G |
| Тимидин | 4 | T |
Уридин (если 'Alphabet' установить в значение 'RNA') | 4 | U |
Пурине (A или G) | 5 | R |
Пиримидин (T или C) | 6 | Y |
Кето (G или T) | 7 | K |
Амино (A или C) | 8 | M |
Сильное взаимодействие (связи 3Н) (G или C) | 9 | S |
Слабое взаимодействие (связи 2Н) (A или T) | 10 | W |
Нет A (C или G или T) | 11 | B |
Нет C (A или G или T) | 12 | D |
Нет G (A или C или T) | 13 | H |
Нет T или U (A или C или G) | 14 | V |
Любой нуклеотид (A или C или G или T или U) | 15 | N |
| Разрыв неопределенной длины | 16 | - |
| Неизвестно (любое целое число, отсутствующее в таблице) | 0 или ≥ 17 | * (по умолчанию) |
требования SeqChar = int2nt(SeqInt, ...PropertyName', PropertyValue, ...)int2nt с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:
задает нуклеотидный алфавит. SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...)AlphabetValue может быть 'DNA', в котором используются символы A, C, G, и T, или 'RNA', в котором используются символы A, C, G, и U. По умолчанию: 'DNA'.
указывает символ для представления неизвестных нуклеотидов, то есть SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...)0 или целые числа ≥ 17. UnknownValue может быть любым символом, отличным от нуклеотидных символов A, C, G, T, и U и многозначные нуклеотидные символы N, R, Y, K, M, S, W, B, D, H, и V. По умолчанию: *.
указывает верхний или нижний регистр. SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...)CaseValue может быть 'upper' (по умолчанию) или 'lower'.
Преобразование нуклеотидной последовательности из целочисленного в буквенное представление.
s = int2nt([1 2 4 3 2 4 1 3 2]) s = ACTGCTAGC
Преобразование нуклеотидной последовательности из целочисленного в буквенное представление и определение # в качестве символа для неизвестных номеров 17 и больше.
si = [1 2 4 20 2 4 40 3 2]; s = int2nt(si, 'unknown', '#') s = ACT#CT#GC
aa2int | baselookup | int2aa | nt2int