nt2int

Преобразуйте нуклеотидную последовательность из буквы в целое число

Синтаксис

SeqInt = nt2int(SeqChar)
SeqInt = nt2int(SeqChar, ...'Unknown', UnknownValue, ...)
SeqInt = nt2int(SeqChar, ...'ACGTOnly', ACGTOnlyValue, ...)

Входные параметры

SeqChar

Одно из следующих:

UnknownValue Целое число для представления неизвестных нуклеотидов. Варианты являются целыми числами ≥ 0 и ≤ 255. По умолчанию это 0.
ACGTOnlyValueКонтролирует запрет неоднозначных нуклеотидов. Варианты true или false (по умолчанию). Если ACGTOnlyValue является trueможно вводить только символы A, C, G, T, и U.

Выходные аргументы

SeqInt Нуклеотидная последовательность, заданная вектором-строкой целых чисел.

Описание

SeqInt = nt2int(SeqChar) преобразует SeqChar, вектор символов или строка, задающая нуклеотидную последовательность, для SeqInt, вектор-строка целых чисел, задающих ту же нуклеотидную последовательность. Для действительных кодов смотрите таблицу Сопоставление нуклеотидных буквенных кодов с целыми числами. Неизвестные символы (символы, отсутствующие в таблице) сопоставлены с 0. Погрешности, представленные дефисами, сопоставлены с 16.

SeqInt = nt2int (SeqChar... 'PropertyName', PropertyValue, ...) вызывает nt2int с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

SeqInt = nt2int(SeqChar, ...'Unknown', UnknownValue, ...) задает целое число, которое должно представлять неизвестные нуклеотиды. UnknownValue может быть целым числом ≥ 0 и ≤ 255. По умолчанию это 0.

SeqInt = nt2int(SeqChar, ...'ACGTOnly', ACGTOnlyValue, ...) контролирует запрет неоднозначных нуклеотидов (N, R, Y, K, M, S, W, B, D, H, и V). Варианты true или false (по умолчанию). Если ACGTOnlyValue является trueможно вводить только символы A, C, G, T, и U.

Отображение кодов нуклеотидных букв с целыми числами

НуклеотидКодЦелое число
Аденозин A 1
Цитидин C2
Гуанин G 3
Тимидин T4
Уридин (если 'Alphabet' установлено на 'RNA') U 4
Пурин (A или G) R 5
Пиримидин (T или C) Y 6
Кето (G или T) K 7
Амино (A или C) M 8
Сильное взаимодействие (связи 3 H) (G или C) S 9
Слабое взаимодействие (связи 2 H) (A или T) W 10
Не A (C или G или T)B 11
Не C (A или G или T)D 12
Не G (A или C или T)H 13
Не T или U (A или C или G)V 14
Любой нуклеотид (A или C или G или T или U) N 15
Зазор неопределенной длины- 16
Неизвестный (любой символ не в таблице)*0 (по умолчанию)

Примеры

Пример 51. Преобразование простой последовательности

Преобразуйте нуклеотидную последовательность из букв в целые числа.

s = nt2int('ACTGCTAGC') 

s = 
     1    2    4    3    2    4    1    3    2
Пример 52. Преобразование случайной последовательности
  1. Создайте случайный вектор символов, чтобы представлять нуклеотидную последовательность.

    SeqChar = randseq(20)
    
    SeqChar =
    
    TTATGACGTTATTCTACTTT
  2. Преобразуйте нуклеотидную последовательность из буквенного в целочисленное представление.

    SeqInt = nt2int(SeqChar)
    
    SeqInt =
    
      Columns 1 through 13
         4    4    1    4    3    1    2    3    4    4    1    4    4
    
      Columns 14 through 20 
         2    4    1    2    4    4    4
    

См. также

| | |

Представлено до R2006a