Преобразуйте последовательность нуклеотида от целого числа, чтобы обозначить буквами представление
SeqChar
= int2nt(SeqInt
)
SeqChar
= int2nt(SeqInt
,
...'Alphabet', AlphabetValue
, ...)
SeqChar
= int2nt(SeqInt
,
...'Unknown', UnknownValue
, ...)
SeqChar
= int2nt(SeqInt
,
...'Case', CaseValue
, ...)
SeqInt | Вектор - строка из целых чисел, задающих последовательность нуклеотида. Для допустимых целых чисел см. таблицу Mapping Nucleotide Integers to Letter Codes. Целые числа произвольно присвоены буквам IUB/IUPAC. |
AlphabetValue | Вектор символов или строка, задающая алфавит нуклеотида. Выбор:
|
UnknownValue | Символ, чтобы представлять неизвестные нуклеотиды, который является 0 или целыми числами ≥ 17 . Выбором является любой символ кроме символов нуклеотида A , C , G , T , и U и неоднозначные символы нуклеотида N , R , Y , K , M , S , W , B , D , H и V . Значением по умолчанию является * . |
CaseValue | Вектор символов или строка, задающая верхний регистр или нижний регистр. Выбором является 'upper' (значение по умолчанию) или 'lower' . |
SeqChar | Последовательность нуклеотида задана вектором символов кодов. |
преобразовывает SeqChar
= int2nt(SeqInt
)SeqInt
, вектор - строку из целых чисел, задающих последовательность нуклеотида, к SeqChar
, вектору символов кодов, задающих ту же последовательность нуклеотида. Для допустимых кодов см. таблицу Mapping Nucleotide Integers to Letter Codes.
Отображение Целых чисел нуклеотида к алфавитным кодам
Нуклеотид | Целое число | Код |
---|---|---|
Аденозин | 1 | A |
Цитидин | 2 | C |
Гуанин | 3 | G |
Тимидин | 4 | T |
Уридин (если набор 'Alphabet' к 'RNA' ) | 4 | U |
Пурин (A или G ) | 5 | R |
Пиримидин (T или C ) | 6 | Y |
Keto (G или T ) | 7 | K |
Аминопласт (A или C ) | 8 | M |
Сильное взаимодействие (3 связи H) (G или C ) | 9 | S |
Слабое взаимодействие (2 связи H) (A или T ) | 10 | W |
Не A (C или G или T ) | 11 | B |
Не C (A или G или T ) | 12 | D |
Не G (A или C или T ) | 13 | H |
Не T или U (A или C или G ) | 14 | V |
Любой нуклеотид (A или C или G или T или U ) | 15 | N |
Разрыв неопределенной длины | 16 | - |
Неизвестный (любое целое число не в таблице) | 0 или ≥ 17 | * (значение по умолчанию) |
вызывает SeqChar = int2nt(SeqInt, ...PropertyName', PropertyValue, ...)
int2nt
с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName
должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:
задает алфавит нуклеотида. SeqChar
= int2nt(SeqInt
,
...'Alphabet', AlphabetValue
, ...)AlphabetValue
может быть 'DNA'
, который использует символы A
, C
, G
, и T
или 'RNA'
, который использует символы A
, C
, G
и U
. Значением по умолчанию является 'DNA'
.
задает символ, чтобы представлять неизвестные нуклеотиды, который является SeqChar
= int2nt(SeqInt
,
...'Unknown', UnknownValue
, ...)0
или целыми числами ≥ 17
. UnknownValue
может быть любым символом кроме символов нуклеотида A
, C
, G
, T
, и U
и неоднозначные символы нуклеотида N
, R
, Y
, K
, M
, S
, W
, B
, D
, H
и V
. Значением по умолчанию является *
.
задает верхний регистр или нижний регистр. SeqChar
= int2nt(SeqInt
,
...'Case', CaseValue
, ...)CaseValue
может быть 'upper'
(значение по умолчанию) или 'lower'
.
Преобразуйте последовательность нуклеотида от целого числа, чтобы обозначить буквами представление.
s = int2nt([1 2 4 3 2 4 1 3 2]) s = ACTGCTAGC
Преобразуйте последовательность нуклеотида от целого числа, чтобы обозначить буквами представление и задать #
как символ для неизвестных чисел 17
и больше.
si = [1 2 4 20 2 4 40 3 2]; s = int2nt(si, 'unknown', '#') s = ACT#CT#GC
aa2int
| baselookup
| int2aa
| nt2int