int2nt

Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление

Синтаксис

SeqChar = int2nt(SeqInt) SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...) SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...) SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...)

Входные параметры

`SeqInt`	Вектор-строка из целых чисел, задающий нуклеотидную последовательность. Для допустимых целых чисел смотрите таблицу Сопоставление нуклеотидных целых чисел с буквенными кодами. Целые числа произвольно присваиваются буквам IUB/IUPAC.
`AlphabetValue`	Вектор символов или строка, задающая нуклеотидный алфавит. Варианты: `'DNA'` (по умолчанию) - Использует символы `A`, `C`, `G`, и `T`. `'RNA'` - Использует символы `A`, `C`, `G`, и `U`.
`UnknownValue`	Символ для представления неизвестных нуклеотидов, то есть 0 или целые числа ≥ `17`. Выбор представляет собой любой символ, кроме нуклеотидных символов `A`, `C`, `G`, `T`, и `U` и неоднозначные нуклеотидные символы `N`, `R`, `Y`, `K`, `M`, `S`, `W`, `B`, `D`, `H`, и `V`. По умолчанию это `*`.
`CaseValue`	Вектор символов или строка, задающая верхний или нижний регистр. Варианты `'upper'` (по умолчанию) или `'lower'`.

Выходные аргументы

SeqChar Нуклеотидная последовательность, заданная вектором символов кодов.

Описание

SeqChar = int2nt(SeqInt) преобразует SeqInt, вектор-строка целых чисел, задающих нуклеотидную последовательность, для SeqChar, вектор символов кодов, задающих ту же нуклеотидную последовательность. Действительные коды см. в таблице Сопоставление нуклеотидных целых чисел с буквенными кодами.

Отображение нуклеотидных целых чисел с буквенными кодами

Нуклеотид	Целое число	Код
Аденозин	`1`	`A`
Цитидин	`2`	`C`
Гуанин	`3`	`G`
Тимидин	`4`	`T`
Уридин (если `'Alphabet'` установлено на `'RNA'`)	`4`	`U`
Пурин (`A` или `G`)	`5`	`R`
Пиримидин (`T` или `C`)	`6`	`Y`
Кето (`G` или `T`)	`7`	`K`
Амино (`A` или `C`)	`8`	`M`
Сильное взаимодействие (связи 3 H) (`G` или `C`)	`9`	`S`
Слабое взаимодействие (связи 2 H) (`A` или `T`)	`10`	`W`
Не `A` (`C` или `G` или `T`)	`11`	`B`
Не `C` (`A` или `G` или `T`)	`12`	`D`
Не `G` (`A` или `C` или `T`)	`13`	`H`
Не `T` или `U` (`A` или `C` или `G`)	`14`	`V`
Любой нуклеотид (`A` или `C` или `G` или `T` или `U`)	`15`	`N`
Зазор неопределенной длины	`16`	`-`
Неизвестно (любое целое число не в таблице)	`0` или ≥ `17`	`*` (по умолчанию)

SeqChar = int2nt (SeqInt... PropertyName', PropertyValue, ...) вызывает int2nt с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...) задает нуклеотидный алфавит. AlphabetValue можно 'DNA', который использует символы A, C, G, и T, или 'RNA', который использует символы A, C, G, и U. По умолчанию это 'DNA'.

SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...) задает символ для представления неизвестных нуклеотидов, то есть 0 или целые числа ≥ 17. UnknownValue может быть любым символом, кроме нуклеотидных символов A, C, G, T, и U и неоднозначные нуклеотидные символы N, R, Y, K, M, S, W, B, D, H, и V. По умолчанию это *.

SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...) задает верхний или нижний регистр. CaseValue можно 'upper' (по умолчанию) или 'lower'.

Примеры

Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление.
```
s = int2nt([1 2 4 3 2 4 1 3 2])

s =
ACTGCTAGC
```
Преобразуйте нуклеотидную последовательность из целого числа в буквенное представление и задайте # как символ для неизвестных чисел 17 и больше.
```
si = [1 2 4 20 2 4 40 3 2];
s = int2nt(si, 'unknown', '#')

s =
ACT#CT#GC
```

См. также

aa2int | baselookup | int2aa | nt2int

Представлено до R2006a

Документация