nt2int

Преобразуйте нуклеотидную последовательность из буквы в целое число

Синтаксис

SeqInt = nt2int(SeqChar) SeqInt = nt2int(SeqChar, ...'Unknown', UnknownValue, ...) SeqInt = nt2int(SeqChar, ...'ACGTOnly', ACGTOnlyValue, ...)

Входные параметры

`SeqChar`	Одно из следующих: Вектор символов или строка, задающая нуклеотидную последовательность. Действительные буквенные коды см. в таблице Сопоставление нуклеотидных буквенных кодов с целыми числами. Целые числа произвольно присваиваются буквам IUB/IUPAC. MATLAB^® структура, содержащая `Sequence` поле, которое содержит нуклеотидную последовательность, такую как возвращенная `fastaread`, `fastqread`, `emblread`, `getembl`, `genbankread`, или `getgenbank`.
`UnknownValue`	Целое число для представления неизвестных нуклеотидов. Варианты являются целыми числами ≥ `0` и ≤ `255`. По умолчанию это `0`.
`ACGTOnlyValue`	Контролирует запрет неоднозначных нуклеотидов. Варианты `true` или `false` (по умолчанию). Если `ACGTOnlyValue` является `true`можно вводить только символы `A`, `C`, `G`, `T`, и `U`.

Выходные аргументы

SeqInt Нуклеотидная последовательность, заданная вектором-строкой целых чисел.

Описание

SeqInt = nt2int(SeqChar) преобразует SeqChar, вектор символов или строка, задающая нуклеотидную последовательность, для SeqInt, вектор-строка целых чисел, задающих ту же нуклеотидную последовательность. Для действительных кодов смотрите таблицу Сопоставление нуклеотидных буквенных кодов с целыми числами. Неизвестные символы (символы, отсутствующие в таблице) сопоставлены с 0. Погрешности, представленные дефисами, сопоставлены с 16.

SeqInt = nt2int (SeqChar... 'PropertyName', PropertyValue, ...) вызывает nt2int с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

SeqInt = nt2int(SeqChar, ...'Unknown', UnknownValue, ...) задает целое число, которое должно представлять неизвестные нуклеотиды. UnknownValue может быть целым числом ≥ 0 и ≤ 255. По умолчанию это 0.

SeqInt = nt2int(SeqChar, ...'ACGTOnly', ACGTOnlyValue, ...) контролирует запрет неоднозначных нуклеотидов (N, R, Y, K, M, S, W, B, D, H, и V). Варианты true или false (по умолчанию). Если ACGTOnlyValue является trueможно вводить только символы A, C, G, T, и U.

Отображение кодов нуклеотидных букв с целыми числами

Нуклеотид	Код	Целое число
Аденозин	`A`	`1`
Цитидин	`C`	`2`
Гуанин	`G`	`3`
Тимидин	`T`	`4`
Уридин (если `'Alphabet'` установлено на `'RNA'`)	`U`	`4`
Пурин (`A` или `G`)	`R`	`5`
Пиримидин (`T` или `C`)	`Y`	`6`
Кето (`G` или `T`)	`K`	`7`
Амино (`A` или `C`)	`M`	`8`
Сильное взаимодействие (связи 3 H) (`G` или `C`)	`S`	`9`
Слабое взаимодействие (связи 2 H) (`A` или `T`)	`W`	`10`
Не `A` (`C` или `G` или `T`)	`B`	`11`
Не `C` (`A` или `G` или `T`)	`D`	`12`
Не `G` (`A` или `C` или `T`)	`H`	`13`
Не `T` или `U` (`A` или `C` или `G`)	`V`	`14`
Любой нуклеотид (`A` или `C` или `G` или `T` или `U`)	`N`	`15`
Зазор неопределенной длины	`-`	`16`
Неизвестный (любой символ не в таблице)	`*`	`0` (по умолчанию)

Примеры

Пример 51. Преобразование простой последовательности

Преобразуйте нуклеотидную последовательность из букв в целые числа.

s = nt2int('ACTGCTAGC') 

s = 
     1    2    4    3    2    4    1    3    2

Пример 52. Преобразование случайной последовательности

Создайте случайный вектор символов, чтобы представлять нуклеотидную последовательность.
```
SeqChar = randseq(20)

SeqChar =

TTATGACGTTATTCTACTTT
```

Преобразуйте нуклеотидную последовательность из буквенного в целочисленное представление.

SeqInt = nt2int(SeqChar)

SeqInt =

  Columns 1 through 13
     4    4    1    4    3    1    2    3    4    4    1    4    4

  Columns 14 through 20 
     2    4    1    2    4    4    4

См. также

aa2int | baselookup | int2aa | int2nt

Представлено до R2006a

Документация