Преобразуйте нуклеотидную последовательность из буквы в целое число
SeqInt
= nt2int(SeqChar
)
SeqInt
= nt2int(SeqChar
,
...'Unknown', UnknownValue
, ...)
SeqInt
= nt2int(SeqChar
,
...'ACGTOnly', ACGTOnlyValue
, ...)
SeqChar | Одно из следующих:
|
UnknownValue | Целое число для представления неизвестных нуклеотидов. Варианты являются целыми числами ≥ 0 и ≤ 255 . По умолчанию это 0 . |
ACGTOnlyValue | Контролирует запрет неоднозначных нуклеотидов. Варианты true или false (по умолчанию). Если ACGTOnlyValue является true можно вводить только символы A , C , G , T , и U . |
SeqInt | Нуклеотидная последовательность, заданная вектором-строкой целых чисел. |
преобразует SeqInt
= nt2int(SeqChar
)SeqChar
, вектор символов или строка, задающая нуклеотидную последовательность, для SeqInt
, вектор-строка целых чисел, задающих ту же нуклеотидную последовательность. Для действительных кодов смотрите таблицу Сопоставление нуклеотидных буквенных кодов с целыми числами. Неизвестные символы (символы, отсутствующие в таблице) сопоставлены с 0
. Погрешности, представленные дефисами, сопоставлены с 16
.
вызывает SeqInt
= nt2int (SeqChar
... 'PropertyName
', PropertyValue
, ...)nt2int
с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:
задает целое число, которое должно представлять неизвестные нуклеотиды. SeqInt
= nt2int(SeqChar
,
...'Unknown', UnknownValue
, ...)UnknownValue
может быть целым числом ≥ 0
и ≤ 255
. По умолчанию это 0
.
контролирует запрет неоднозначных нуклеотидов (SeqInt
= nt2int(SeqChar
,
...'ACGTOnly', ACGTOnlyValue
, ...)N
, R
, Y
, K
, M
, S
, W
, B
, D
, H
, и V
). Варианты true
или false
(по умолчанию). Если ACGTOnlyValue
является true
можно вводить только символы A
, C
, G
, T
, и U
.
Отображение кодов нуклеотидных букв с целыми числами
Нуклеотид | Код | Целое число |
---|---|---|
Аденозин | A | 1 |
Цитидин | C | 2 |
Гуанин | G | 3 |
Тимидин | T | 4 |
Уридин (если 'Alphabet' установлено на 'RNA' ) | U | 4 |
Пурин (A или G ) | R | 5 |
Пиримидин (T или C ) | Y | 6 |
Кето (G или T ) | K | 7 |
Амино (A или C ) | M | 8 |
Сильное взаимодействие (связи 3 H) (G или C ) | S | 9 |
Слабое взаимодействие (связи 2 H) (A или T ) | W | 10 |
Не A (C или G или T ) | B | 11 |
Не C (A или G или T ) | D | 12 |
Не G (A или C или T ) | H | 13 |
Не T или U (A или C или G ) | V | 14 |
Любой нуклеотид (A или C или G или T или U ) | N | 15 |
Зазор неопределенной длины | - | 16 |
Неизвестный (любой символ не в таблице) | * | 0 (по умолчанию) |
Преобразуйте нуклеотидную последовательность из букв в целые числа.
s = nt2int('ACTGCTAGC')
s =
1 2 4 3 2 4 1 3 2
Создайте случайный вектор символов, чтобы представлять нуклеотидную последовательность.
SeqChar = randseq(20) SeqChar = TTATGACGTTATTCTACTTT
Преобразуйте нуклеотидную последовательность из буквенного в целочисленное представление.
SeqInt = nt2int(SeqChar) SeqInt = Columns 1 through 13 4 4 1 4 3 1 2 3 4 4 1 4 4 Columns 14 through 20 2 4 1 2 4 4 4
aa2int
| baselookup
| int2aa
| int2nt