aa2int

Преобразуйте последовательность аминокислот от буквы до целочисленного представления

Синтаксис

SeqInt = aa2int(SeqChar)
SeqInt = aa2int(SeqChar,'Unknown',unknownAA)

Входные параметры

SeqChar

Одно из следующего:

  • Вектор символов или строка, содержащая однобуквенные коды, задающие последовательность аминокислот. Для допустимых алфавитных кодов см. таблицу Mapping Amino Acid Letter Codes to Integers. Неизвестные символы сопоставлены с 0. Целые числа произвольно присвоены буквам IUB/IUPAC.

  • MATLAB® структура, содержащая Sequence поле, которое содержит последовательность аминокислот, такой, как возвращено fastaread, getgenpept, genpeptread, getpdb, или pdbread.

unknownAAНомер, представляющий неизвестную аминокислоту. Значением по умолчанию является 0.

Выходные аргументы

SeqIntПоследовательность аминокислот задана вектором-строкой из целых чисел.

Описание

SeqInt = aa2int(SeqChar) преобразует SeqChar, вектор символов или строка, содержащая однобуквенные коды, задающие последовательность аминокислот, к SeqInt, вектор-строка из целых чисел, задающих ту же последовательность аминокислот. Для допустимых алфавитных кодов см. таблицу Mapping Amino Acid Letter Codes to Integers.

SeqInt = aa2int(SeqChar,'Unknown',unknownAA) указывает, что номер раньше представлял неизвестную аминокислоту.

Отображение алфавитных кодов аминокислоты к Целым числам

АминокислотаКодЦелое число
Аланин A 1
Аргинин R 2
Аспарагин N 3
Кислота аспарагиновой кислоты (Аспартат) D 4
Цистеин C 5
Glutamine Q 6
Глутаминовая кислота (Глутамат) E 7
Глицин G 8
Гистидин H 9
Изолейцин I10
Лейцин L 11
Лизин K 12
Метионин M 13
Фенилаланин F 14
Пролин P 15
СеринS16
ТреонинT17
Триптофан W 18
Тирозин Y 19
Valine V 20
Аспарагин или кислота Аспарагиновой кислоты (Аспартат) B 21
Glutamine или Glutamic acid (Глутамат)Z 22
Неизвестная аминокислота (любая аминокислота) X 23
Остановка перевода * 24
Разрыв неопределенной длины - 25
Неизвестный символ (любой символ или символ не в таблице) ? 0

Примеры

свернуть все

Создайте случайную последовательность аминокислот.

seq = randseq(20,'alphabet','amino')
seq = 
'TYNYMRQLVVDVVITNHYSV'

Преобразуйте последовательность от буквы до целочисленного представления.

seqInt = aa2int(seq)
seqInt = 1x20 uint8 row vector

   17   19    3   19   13    2    6   11   20   20    4   20   20   10   17    3    9   19   16   20

Смотрите также

| | |

Представлено до R2006a