int2nt

Преобразуйте последовательность нуклеотида от целого числа, чтобы обозначить буквами представление

Синтаксис

SeqChar = int2nt(SeqInt)
SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...)
SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...)
SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...)

Входные параметры

SeqInt Вектор - строка из целых чисел, задающих последовательность нуклеотида. Для допустимых целых чисел см. таблицу Mapping Nucleotide Integers to Letter Codes. Целые числа произвольно присвоены буквам IUB/IUPAC.
AlphabetValue Вектор символов или строка, задающая алфавит нуклеотида. Выбор:
  • 'DNA' (значение по умолчанию) — Использование символы A, C, G и T.

  • 'RNA' — Использует символы A, C, G и U.

UnknownValue Символ, чтобы представлять неизвестные нуклеотиды, который является 0 или целыми числами ≥ 17. Выбором является любой символ кроме символов нуклеотида A, C, G, T, и U и неоднозначные символы нуклеотида N, R, Y, K, M, S, W, B, D, H и V. Значением по умолчанию является *.
CaseValue Вектор символов или строка, задающая верхний регистр или нижний регистр. Выбором является 'upper' (значение по умолчанию) или 'lower'.

Выходные аргументы

SeqCharПоследовательность нуклеотида задана вектором символов кодов.

Описание

SeqChar = int2nt(SeqInt) преобразовывает SeqInt, вектор - строку из целых чисел, задающих последовательность нуклеотида, к SeqChar, вектору символов кодов, задающих ту же последовательность нуклеотида. Для допустимых кодов см. таблицу Mapping Nucleotide Integers to Letter Codes.

Отображение Целых чисел нуклеотида к алфавитным кодам

НуклеотидЦелое числоКод
Аденозин 1A
Цитидин 2C
Гуанин 3G
Тимидин 4T
Уридин (если набор 'Alphabet' к 'RNA') 4U
Пурин (A или G) 5R
Пиримидин (T или C) 6Y
Keto (G или T) 7K
Аминопласт (A или C) 8M
Сильное взаимодействие (3 связи H) (G или C) 9S
Слабое взаимодействие (2 связи H) (A или T) 10W
Не A (C или G или T)11B
Не C (A или G или T)12D
Не G (A или C или T)13H
Не T или U (A или C или G)14V
Любой нуклеотид (A или C или G или T или U) 15N
Разрыв неопределенной длины16-
Неизвестный (любое целое число не в таблице) 0 или ≥ 17* (значение по умолчанию)

SeqChar = int2nt(SeqInt, ...PropertyName', PropertyValue, ...) вызывает int2nt с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

SeqChar = int2nt(SeqInt, ...'Alphabet', AlphabetValue, ...) задает алфавит нуклеотида. AlphabetValue может быть 'DNA', который использует символы A, C, G, и T или 'RNA', который использует символы A, C, G и U. Значением по умолчанию является 'DNA'.

SeqChar = int2nt(SeqInt, ...'Unknown', UnknownValue, ...) задает символ, чтобы представлять неизвестные нуклеотиды, который является 0 или целыми числами ≥ 17. UnknownValue может быть любым символом кроме символов нуклеотида A, C, G, T, и U и неоднозначные символы нуклеотида N, R, Y, K, M, S, W, B, D, H и V. Значением по умолчанию является *.

SeqChar = int2nt(SeqInt, ...'Case', CaseValue, ...) задает верхний регистр или нижний регистр. CaseValue может быть 'upper' (значение по умолчанию) или 'lower'.

Примеры

  • Преобразуйте последовательность нуклеотида от целого числа, чтобы обозначить буквами представление.

    s = int2nt([1 2 4 3 2 4 1 3 2])
    
    s =
    ACTGCTAGC
    
  • Преобразуйте последовательность нуклеотида от целого числа, чтобы обозначить буквами представление и задать # как символ для неизвестных чисел 17 и больше.

    si = [1 2 4 20 2 4 40 3 2];
    s = int2nt(si, 'unknown', '#')
    
    s =
    ACT#CT#GC
    

Смотрите также

| | |

Представлено до R2006a