Преобразуйте последовательность нуклеотида от целого числа, чтобы обозначить буквами представление
SeqChar
= int2nt(SeqInt
)
SeqChar
= int2nt(SeqInt
,
...'Alphabet', AlphabetValue
, ...)
SeqChar
= int2nt(SeqInt
,
...'Unknown', UnknownValue
, ...)
SeqChar
= int2nt(SeqInt
,
...'Case', CaseValue
, ...)
SeqInt | Вектор-строка из целых чисел, задающих последовательность нуклеотида. Для допустимых целых чисел см. таблицу Mapping Nucleotide Integers to Letter Codes. Целые числа произвольно присвоены буквам IUB/IUPAC. |
AlphabetValue | Вектор символов или строка, задающая алфавит нуклеотида. Выбор:
|
UnknownValue | Символ, чтобы представлять неизвестные нуклеотиды, который является 0 или целые числа ≥ 17 . Выбором является любой символ кроме символов нуклеотида A C G T , и U и неоднозначные символы нуклеотида N R Y K M S W B D H , и V . Значением по умолчанию является * . |
CaseValue | Вектор символов или строка, задающая верхний регистр или нижний регистр. Выбором является 'upper' (значение по умолчанию) или 'lower' . |
SeqChar | Последовательность нуклеотида задана вектором символов кодов. |
преобразует SeqChar
= int2nt(SeqInt
)SeqInt
, вектор-строка из целых чисел, задающих последовательность нуклеотида, к SeqChar
, вектор символов кодов, задающих ту же последовательность нуклеотида. Для допустимых кодов см. таблицу Mapping Nucleotide Integers to Letter Codes.
Отображение Целых чисел нуклеотида к алфавитным кодам
Нуклеотид | Целое число | Код |
---|---|---|
Аденозин | 1
| A |
Цитидин | 2
| C |
Гуанин | 3
| G |
Тимидин | 4
| T |
Уридин (если 'Alphabet' установите на 'RNA' ) | 4
| U |
Пурин (A или G ) | 5
| R |
Пиримидин (T или C ) | 6
| Y |
Keto (G или T ) | 7
| K |
Аминопласт (A или C ) | 8
| M |
Сильное взаимодействие (3 связи H) (G или C ) | 9
| S |
Слабое взаимодействие (2 связи H) (A или T ) | 10
| W |
Не A C или G или T ) | 11
| B |
Не C A или G или T ) | 12
| D |
Не G A или C или T ) | 13
| H |
Не T или U A или C или G ) | 14
| V |
Любой нуклеотид (A или C или G или T или U ) | 15
| N |
Разрыв неопределенной длины | 16
| - |
Неизвестный (любое целое число не в таблице) | 0 или ≥ 17 | * (значение по умолчанию) |
вызовы SeqChar
= int2nt (SeqInt
PropertyName
', PropertyValue
, ...)int2nt
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
задает алфавит нуклеотида. SeqChar
= int2nt(SeqInt
,
...'Alphabet', AlphabetValue
, ...)AlphabetValue
может быть 'DNA'
, который использует символы A
C
G
, и T
, или 'RNA'
, который использует символы A
C
G
, и U
. Значением по умолчанию является 'DNA'
.
задает символ, чтобы представлять неизвестные нуклеотиды, который является SeqChar
= int2nt(SeqInt
,
...'Unknown', UnknownValue
, ...)0
или целые числа ≥ 17
. UnknownValue
может быть любой символ кроме символов нуклеотида A
C
G
T
, и U
и неоднозначные символы нуклеотида N
R
Y
K
M
S
W
B
D
H
, и V
. Значением по умолчанию является *
.
задает верхний регистр или нижний регистр. SeqChar
= int2nt(SeqInt
,
...'Case', CaseValue
, ...)CaseValue
может быть 'upper'
(значение по умолчанию) или 'lower'
.
Преобразуйте последовательность нуклеотида от целого числа, чтобы обозначить буквами представление.
s = int2nt([1 2 4 3 2 4 1 3 2]) s = ACTGCTAGC
Преобразуйте последовательность нуклеотида от целого числа, чтобы обозначить буквами представление и задать #
как символ для неизвестных чисел 17
и больше.
si = [1 2 4 20 2 4 40 3 2]; s = int2nt(si, 'unknown', '#') s = ACT#CT#GC
aa2int
| baselookup
| int2aa
| nt2int