int2nt

Преобразование нуклеотидной последовательности из целочисленного в буквенное представление

Синтаксис

SeqChar = int2nt(SeqInt) SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...) SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...) SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...)

Входные аргументы

`SeqInt`	Вектор ряда целых чисел, определяющих нуклеотидную последовательность. Допустимые целые числа см. в таблице Отображение нуклеотидных целых чисел в буквенные коды. Целые числа произвольно присваиваются буквам IUB/IUPAC.
`AlphabetValue`	Символьный вектор или строка, задающая нуклеотидный алфавит. Возможны следующие варианты: `'DNA'` (по умолчанию) - использует символы `A`, `C`, `G`, и `T`. `'RNA'` - Использует символы `A`, `C`, `G`, и `U`.
`UnknownValue`	Символ для представления неизвестных нуклеотидов, то есть `0` или целые числа ≥ `17`. Выбор - это любой символ, отличный от нуклеотидных символов. `A`, `C`, `G`, `T`, и `U` и многозначные нуклеотидные символы `N`, `R`, `Y`, `K`, `M`, `S`, `W`, `B`, `D`, `H`, и `V`. По умолчанию: `*`.
`CaseValue`	Символьный вектор или строка, задающая верхний или нижний регистр. Варианты: `'upper'` (по умолчанию) или `'lower'`.

Выходные аргументы

SeqChar Нуклеотидная последовательность, определенная символьным вектором кодов.

Описание

SeqChar = int2nt(SeqInt) новообращенные SeqInt, вектор ряда целых чисел, указывающий нуклеотидную последовательность, SeqChar, символьный вектор кодов, указывающий одну и ту же нуклеотидную последовательность. Допустимые коды см. в таблице Отображение нуклеотидных целых чисел в буквенные коды.

Отображение нуклеотидных целых чисел на буквенные коды

Нуклеотид	Целое число	Кодекс
Аденозин	`1`	`A`
Цитидин	`2`	`C`
Гуанин	`3`	`G`
Тимидин	`4`	`T`
Уридин (если `'Alphabet'` установить в значение `'RNA'`)	`4`	`U`
Пурине (`A` или `G`)	`5`	`R`
Пиримидин (`T` или `C`)	`6`	`Y`
Кето (`G` или `T`)	`7`	`K`
Амино (`A` или `C`)	`8`	`M`
Сильное взаимодействие (связи 3Н) (`G` или `C`)	`9`	`S`
Слабое взаимодействие (связи 2Н) (`A` или `T`)	`10`	`W`
Нет `A` (`C` или `G` или `T`)	`11`	`B`
Нет `C` (`A` или `G` или `T`)	`12`	`D`
Нет `G` (`A` или `C` или `T`)	`13`	`H`
Нет `T` или `U` (`A` или `C` или `G`)	`14`	`V`
Любой нуклеотид (`A` или `C` или `G` или `T` или `U`)	`15`	`N`
Разрыв неопределенной длины	`16`	`-`
Неизвестно (любое целое число, отсутствующее в таблице)	`0` или ≥ `17`	`*` (по умолчанию)

SeqChar = int2nt(SeqInt, ...PropertyName', PropertyValue, ...) требования int2nt с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...) задает нуклеотидный алфавит. AlphabetValue может быть 'DNA', в котором используются символы A, C, G, и T, или 'RNA', в котором используются символы A, C, G, и U. По умолчанию: 'DNA'.

SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...) указывает символ для представления неизвестных нуклеотидов, то есть 0 или целые числа ≥ 17. UnknownValue может быть любым символом, отличным от нуклеотидных символов A, C, G, T, и U и многозначные нуклеотидные символы N, R, Y, K, M, S, W, B, D, H, и V. По умолчанию: *.

SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...) указывает верхний или нижний регистр. CaseValue может быть 'upper' (по умолчанию) или 'lower'.

Примеры

Преобразование нуклеотидной последовательности из целочисленного в буквенное представление.
```
s = int2nt([1 2 4 3 2 4 1 3 2])

s =
ACTGCTAGC
```
Преобразование нуклеотидной последовательности из целочисленного в буквенное представление и определение # в качестве символа для неизвестных номеров 17 и больше.
```
si = [1 2 4 20 2 4 40 3 2];
s = int2nt(si, 'unknown', '#')

s =
ACT#CT#GC
```

См. также

aa2int | baselookup | int2aa | nt2int

Представлен до R2006a

Документация