exponenta event banner

int2nt

Преобразование нуклеотидной последовательности из целочисленного в буквенное представление

Синтаксис

SeqChar = int2nt(SeqInt)
SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...)
SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...)
SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...)

Входные аргументы

SeqInt Вектор ряда целых чисел, определяющих нуклеотидную последовательность. Допустимые целые числа см. в таблице Отображение нуклеотидных целых чисел в буквенные коды. Целые числа произвольно присваиваются буквам IUB/IUPAC.
AlphabetValue Символьный вектор или строка, задающая нуклеотидный алфавит. Возможны следующие варианты:
  • 'DNA' (по умолчанию) - использует символы A, C, G, и T.

  • 'RNA' - Использует символы A, C, G, и U.

UnknownValue Символ для представления неизвестных нуклеотидов, то есть 0 или целые числа ≥ 17. Выбор - это любой символ, отличный от нуклеотидных символов. A, C, G, T, и U и многозначные нуклеотидные символы N, R, Y, K, M, S, W, B, D, H, и V. По умолчанию: *.
CaseValue Символьный вектор или строка, задающая верхний или нижний регистр. Варианты: 'upper' (по умолчанию) или 'lower'.

Выходные аргументы

SeqCharНуклеотидная последовательность, определенная символьным вектором кодов.

Описание

SeqChar = int2nt(SeqInt) новообращенные SeqInt, вектор ряда целых чисел, указывающий нуклеотидную последовательность, SeqChar, символьный вектор кодов, указывающий одну и ту же нуклеотидную последовательность. Допустимые коды см. в таблице Отображение нуклеотидных целых чисел в буквенные коды.

Отображение нуклеотидных целых чисел на буквенные коды

НуклеотидЦелое числоКодекс
Аденозин 1A
Цитидин 2C
Гуанин 3G
Тимидин 4T
Уридин (если 'Alphabet' установить в значение 'RNA') 4U
Пурине (A или G) 5R
Пиримидин (T или C) 6Y
Кето (G или T) 7K
Амино (A или C) 8M
Сильное взаимодействие (связи 3Н) (G или C) 9S
Слабое взаимодействие (связи 2Н) (A или T) 10W
Нет A (C или G или T)11B
Нет C (A или G или T)12D
Нет G (A или C или T)13H
Нет T или U (A или C или G)14V
Любой нуклеотид (A или C или G или T или U) 15N
Разрыв неопределенной длины16-
Неизвестно (любое целое число, отсутствующее в таблице) 0 или ≥ 17* (по умолчанию)

SeqChar = int2nt(SeqInt, ...PropertyName', PropertyValue, ...) требования int2nt с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...) задает нуклеотидный алфавит. AlphabetValue может быть 'DNA', в котором используются символы A, C, G, и T, или 'RNA', в котором используются символы A, C, G, и U. По умолчанию: 'DNA'.

SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...) указывает символ для представления неизвестных нуклеотидов, то есть 0 или целые числа ≥ 17. UnknownValue может быть любым символом, отличным от нуклеотидных символов A, C, G, T, и U и многозначные нуклеотидные символы N, R, Y, K, M, S, W, B, D, H, и V. По умолчанию: *.

SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...) указывает верхний или нижний регистр. CaseValue может быть 'upper' (по умолчанию) или 'lower'.

Примеры

  • Преобразование нуклеотидной последовательности из целочисленного в буквенное представление.

    s = int2nt([1 2 4 3 2 4 1 3 2])
    
    s =
    ACTGCTAGC
    
  • Преобразование нуклеотидной последовательности из целочисленного в буквенное представление и определение # в качестве символа для неизвестных номеров 17 и больше.

    si = [1 2 4 20 2 4 40 3 2];
    s = int2nt(si, 'unknown', '#')
    
    s =
    ACT#CT#GC
    

См. также

| | |

Представлен до R2006a