Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление
SeqChar
= int2nt(SeqInt
)
SeqChar
= int2nt(SeqInt
,
...'Alphabet', AlphabetValue
, ...)
SeqChar
= int2nt(SeqInt
,
...'Unknown', UnknownValue
, ...)
SeqChar
= int2nt(SeqInt
,
...'Case', CaseValue
, ...)
SeqInt | Вектор-строка из целых чисел, задающий нуклеотидную последовательность. Для допустимых целых чисел смотрите таблицу Сопоставление нуклеотидных целых чисел с буквенными кодами. Целые числа произвольно присваиваются буквам IUB/IUPAC. |
AlphabetValue | Вектор символов или строка, задающая нуклеотидный алфавит. Варианты:
|
UnknownValue | Символ для представления неизвестных нуклеотидов, то есть 0 или целые числа ≥ 17 . Выбор представляет собой любой символ, кроме нуклеотидных символов A , C , G , T , и U и неоднозначные нуклеотидные символы N , R , Y , K , M , S , W , B , D , H , и V . По умолчанию это * . |
CaseValue | Вектор символов или строка, задающая верхний или нижний регистр. Варианты 'upper' (по умолчанию) или 'lower' . |
SeqChar | Нуклеотидная последовательность, заданная вектором символов кодов. |
преобразует SeqChar
= int2nt(SeqInt
)SeqInt
, вектор-строка целых чисел, задающих нуклеотидную последовательность, для SeqChar
, вектор символов кодов, задающих ту же нуклеотидную последовательность. Действительные коды см. в таблице Сопоставление нуклеотидных целых чисел с буквенными кодами.
Отображение нуклеотидных целых чисел с буквенными кодами
Нуклеотид | Целое число | Код |
---|---|---|
Аденозин | 1 | A |
Цитидин | 2 | C |
Гуанин | 3 | G |
Тимидин | 4 | T |
Уридин (если 'Alphabet' установлено на 'RNA' ) | 4 | U |
Пурин (A или G ) | 5 | R |
Пиримидин (T или C ) | 6 | Y |
Кето (G или T ) | 7 | K |
Амино (A или C ) | 8 | M |
Сильное взаимодействие (связи 3 H) (G или C ) | 9 | S |
Слабое взаимодействие (связи 2 H) (A или T ) | 10 | W |
Не A (C или G или T ) | 11 | B |
Не C (A или G или T ) | 12 | D |
Не G (A или C или T ) | 13 | H |
Не T или U (A или C или G ) | 14 | V |
Любой нуклеотид (A или C или G или T или U ) | 15 | N |
Зазор неопределенной длины | 16 | - |
Неизвестно (любое целое число не в таблице) | 0 или ≥ 17 | * (по умолчанию) |
вызывает SeqChar
= int2nt (SeqInt
... PropertyName
', PropertyValue
, ...)int2nt
с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
задает нуклеотидный алфавит. SeqChar
= int2nt(SeqInt
,
...'Alphabet', AlphabetValue
, ...)AlphabetValue
можно 'DNA'
, который использует символы A
, C
, G
, и T
, или 'RNA'
, который использует символы A
, C
, G
, и U
. По умолчанию это 'DNA'
.
задает символ для представления неизвестных нуклеотидов, то есть SeqChar
= int2nt(SeqInt
,
...'Unknown', UnknownValue
, ...)0
или целые числа ≥ 17
. UnknownValue
может быть любым символом, кроме нуклеотидных символов A
, C
, G
, T
, и U
и неоднозначные нуклеотидные символы N
, R
, Y
, K
, M
, S
, W
, B
, D
, H
, и V
. По умолчанию это *
.
задает верхний или нижний регистр. SeqChar
= int2nt(SeqInt
,
...'Case', CaseValue
, ...)CaseValue
можно 'upper'
(по умолчанию) или 'lower'
.
Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление.
s = int2nt([1 2 4 3 2 4 1 3 2]) s = ACTGCTAGC
Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление и задайте #
как символ для неизвестных чисел 17
и больше.
si = [1 2 4 20 2 4 40 3 2]; s = int2nt(si, 'unknown', '#') s = ACT#CT#GC
aa2int
| baselookup
| int2aa
| nt2int