Преобразуйте последовательность нуклеотида от буквы до целочисленного представления
SeqInt = nt2int(SeqChar)
SeqInt = nt2int(SeqChar,
...'Unknown', UnknownValue, ...)
SeqInt = nt2int(SeqChar,
...'ACGTOnly', ACGTOnlyValue, ...)
SeqChar | Одно из следующего:
|
UnknownValue | Целое число, чтобы представлять неизвестные нуклеотиды. Выбором являются целые числа ≥ 0 и ≤ 255. Значением по умолчанию является 0. |
ACGTOnlyValue | Управляет запретом на неоднозначные нуклеотиды. Выбором является true или false (значение по умолчанию). Если ACGTOnlyValue true, можно ввести только символы ACGT, и U. |
SeqInt | Последовательность нуклеотида задана вектором-строкой из целых чисел. |
преобразует SeqInt = nt2int(SeqChar)SeqChar, вектор символов или строка, задающая последовательность нуклеотида, к SeqInt, вектор-строка из целых чисел, задающих ту же последовательность нуклеотида. Для допустимых кодов см. таблицу Mapping Nucleotide Letter Codes to Integers. Неизвестные символы (символы не в таблице) сопоставлены с 0. Разрывы, представленные с дефисами, сопоставлены с 16.
вызовы SeqInt = nt2int (SeqCharPropertyName ', PropertyValue, ...)nt2int с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
задает целое число, чтобы представлять неизвестные нуклеотиды. SeqInt = nt2int(SeqChar,
...'Unknown', UnknownValue, ...)UnknownValue может быть целое число ≥ 0 и ≤ 255. Значением по умолчанию является 0.
управляет запретом на неоднозначные нуклеотиды (SeqInt = nt2int(SeqChar,
...'ACGTOnly', ACGTOnlyValue, ...)NRYKMSWBDH, и V). Выбором является true или false (значение по умолчанию). Если ACGTOnlyValue true, можно ввести только символы ACGT, и U.
Отображение алфавитных кодов нуклеотида к Целым числам
| Нуклеотид | Код | Целое число |
|---|---|---|
| Аденозин | A | 1 |
| Цитидин | C | 2 |
| Гуанин | G | 3 |
| Тимидин | T | 4 |
Уридин (если 'Alphabet' установите на 'RNA') | U | 4 |
Пурин (A или G) | R | 5 |
Пиримидин (T или C) | Y | 6 |
Keto (G или T) | K | 7 |
Аминопласт (A или C) | M | 8 |
Сильное взаимодействие (3 связи H) (G или C) | S | 9 |
Слабое взаимодействие (2 связи H) (A или T) | W | 10 |
Не A C или G или T) | B | 11 |
Не C A или G или T) | D | 12 |
Не G A или C или T) | H | 13 |
Не T или U A или C или G) | V | 14 |
Любой нуклеотид (A или C или G или T или U) | N | 15 |
| Разрыв неопределенной длины | - | 16 |
| Неизвестный (любой символ не в таблице) | * | 0 (значение по умолчанию) |
Преобразуйте последовательность нуклеотида от букв до целых чисел.
s = nt2int('ACTGCTAGC')
s =
1 2 4 3 2 4 1 3 2
Создайте случайный вектор символов, чтобы представлять последовательность нуклеотида.
SeqChar = randseq(20) SeqChar = TTATGACGTTATTCTACTTT
Преобразуйте последовательность нуклеотида от буквы до целочисленного представления.
SeqInt = nt2int(SeqChar)
SeqInt =
Columns 1 through 13
4 4 1 4 3 1 2 3 4 4 1 4 4
Columns 14 through 20
2 4 1 2 4 4 4
aa2int | baselookup | int2aa | int2nt