cleave

Расколите последовательность аминокислот с ферментом

Синтаксис

Fragments = cleave(SeqAA, Enzyme)
Fragments = cleave(SeqAA, PeptidePattern, Position)
[Fragments, CuttingSites] = cleave(...)
[Fragments, CuttingSites, Lengths] = cleave(...)
[Fragments, CuttingSites, Lengths, Missed] = cleave(...)
cleave(..., 'PartialDigest', PartialDigestValue, ...)
cleave(..., 'MissedSites', MissedSitesValue, ...)
cleave(..., 'Exception', ExceptionValue, ...)

Входные параметры

SeqAA

Одно из следующего:

  • Вектор символов или строка, содержащая однобуквенные коды, задающие последовательность аминокислот.

  • Вектор-строка из целых чисел, задающих последовательность аминокислот.

  • MATLAB® структура, содержащая Sequence поле, которое содержит последовательность аминокислот, такой, как возвращено fastaread, getgenpept, genpeptread, getpdb, или pdbread.

Примеры: 'ARN' или [1 2 3].

Enzyme

Вектор символов или строка, задающая имя или код сокращения для фермента или составной объект, для которого литература задает правило разламывания.

Совет

Используйте cleavelookup функционируйте, чтобы отобразить имена ферментов и составных объектов в библиотеке правила разламывания.

PeptidePattern

Короткая последовательность аминокислот, чтобы искать в SeqAA, большая последовательность. PeptidePattern может быть любое следующее:

Position

Целое число от 0 к длине PeptidePattern, это задает положение в PeptidePattern раскалывать.

Примечание

Положение 0 соответствует терминальному концу N PeptidePattern.

PartialDigestValue

Значение от 0 к 1 (значение по умолчанию), задающее вероятность, что сайт разламывания будет расколот.

MissedSitesValue

Неотрицательное целое число, задающее максимальное количество пропущенных сайтов разламывания. Выход включает все возможные фрагменты пептида, которые могут следовать из пропавших без вести MissedSitesValue или меньше сайтов разламывания. Значением по умолчанию является 0, который эквивалентен идеальному пищеварению.

ExceptionValue

Регулярное выражение, задающее исключение, управляет к правилу разламывания, сопоставленному с Enzyme. По умолчанию правила исключения только применяются в случае трипсина, и все другие ферменты не имеют никакого правила исключения, которое задано как пустой символьный вектор. Чтобы предотвратить использование исключений по умолчанию для трипсина, используйте пустой символьный вектор в качестве правила исключения.

Чтобы видеть регулярное выражение для правил исключения трипсина, проверяйте Раскалывать Интерполяционную таблицу.

Выходные аргументы

Fragments

Массив ячеек из символьных векторов, представляющий фрагменты от разламывания.

CuttingSites

Числовой вектор, содержащий индексы, представляющие сайты разламывания.

Примечание

cleave функция добавляет 0 к списку, таким образом, numel (CuttingSites) == numel (Fragments). Используйте CuttingSites +1 указать на первую аминокислоту каждого фрагмента, соответствующего к исходной последовательности.

Lengths

Числовой вектор, содержащий длину каждого фрагмента.

Missed

Числовой вектор, содержащий количество пропущенных сайтов разламывания для каждого фрагмента пептида.

Описание

Fragments = cleave(SeqAA, Enzyme) сокращения SeqAA, последовательность аминокислот, в части на сайтах разламывания, специфичных для Enzyme, вектор символов или строка, задающая имя или код сокращения для фермента или составной объект, для которого литература задает правило разламывания. Это возвращает Fragments, массив ячеек из символьных векторов, представляющий фрагменты от разламывания.

Совет

Используйте cleavelookup функционируйте, чтобы отобразить имена ферментов и составных объектов в библиотеке правила разламывания.

Fragments = cleave(SeqAA, PeptidePattern, Position) сокращения SeqAA, последовательность аминокислот, в части на сайтах разламывания, заданных шаблоном пептида и положением.

[Fragments, CuttingSites] = cleave(...) возвращает числовой вектор, содержащий индексы, представляющие сайты разламывания.

Примечание

cleave функция добавляет 0 к списку, таким образом, numel (CuttingSites) == numel (Fragments). Используйте CuttingSites +1 указать на первую аминокислоту каждого фрагмента, соответствующего к исходной последовательности.

[Fragments, CuttingSites, Lengths] = cleave(...) возвращает числовой вектор, содержащий длину каждого фрагмента.

[Fragments, CuttingSites, Lengths, Missed] = cleave(...) возвращает числовой вектор, содержащий количество пропущенных сайтов разламывания для каждого фрагмента.

расколите (..., 'PropertyName', PropertyValue, ...) вызовы cleave с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Заключите каждый PropertyName в одинарных кавычках. Каждый PropertyName является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:

cleave(..., 'PartialDigest', PartialDigestValue, ...) симулирует частичное пищеварение где PartialDigestValue вероятность сокращаемого сайта разламывания. PartialDigestValue значение от 0 к 1 (значение по умолчанию).

Эта таблица приводит некоторые общие протеазы и их сайты разламывания.

ПротеазаШаблон пептидаПоложение
Кислота аспарагиновой кислоты ND 1
Химотрипсин[WYF](?!P)1
Глутэмайн К.[ED](?!P) 1
Лизин C[K](?!P) 1
Трипсин[KR](?!P)1

cleave(..., 'MissedSites', MissedSitesValue, ...) возвращает все возможные фрагменты пептида, которые могут следовать из пропавших без вести MissedSitesValue или меньше сайтов разламывания. MissedSitesValue неотрицательное целое число. Значением по умолчанию является 0, который эквивалентен идеальному пищеварению.

cleave(..., 'Exception', ExceptionValue, ...) задает правило исключения к правилу разламывания, сопоставленному с Enzyme. ExceptionValue регулярное выражение. По умолчанию правила исключения только применяются в случае трипсина, и все другие ферменты не имеют никакого правила исключения, которое задано как пустой символьный вектор. Чтобы предотвратить использование исключений по умолчанию для трипсина, задайте пустой символьный вектор как правило исключения.

Примеры

свернуть все

В этом примере показано, как расколоть последовательность с помощью трипсина.

Получите последовательность белка из базы данных GenPept.

S = getgenpept('AAA59174');

Расколите последовательность, использующую правила разламывания трипсина и все известные исключения.

parts = cleave(S.Sequence,'trypsin');

Отобразите первые десять фрагментов.

parts(1:10)
ans = 

    'MGTGGR'
    'R'
    'GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR'
    'NNLTR'
    'LHELENCSVIEGHLQILLMFK'
    'TRPEDFR'
    'DLSFPK'
    'LIMITDYLLLFR'
    'VYGLESLK'
    'DLFPNLTVIR'

Расколите последовательность, использующую правила разламывания трипсина и одно определенное правило исключения.

parts = cleave(S.Sequence,'trypsin','exception','KD');
parts(1:10)
ans = 

    'MGTGGR'
    'R'
    'GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR'
    'NNLTR'
    'LHELENCSVIEGHLQILLMFK'
    'TRPEDFR'
    'DLSFPK'
    'LIMITDYLLLFR'
    'VYGLESLKDLFPNLTVIR'
    'GSR'

Расколите последовательность с помощью одного из правил разламывания трипсина, которое должно расколоть после K или R, когда следующий остаток не является P.

[parts, sites, lengths] = cleave(S.Sequence,'[KR](?!P)',1);
for i = 1:10
    fprintf('%5d%5d   %s\n',sites(i),lengths(i),parts{i})
end
    0    6   MGTGGR
    6    1   R
    7   34   GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR
   41    5   NNLTR
   46   21   LHELENCSVIEGHLQILLMFK
   67    7   TRPEDFR
   74    6   DLSFPK
   80   12   LIMITDYLLLFR
   92    8   VYGLESLK
  100   10   DLFPNLTVIR

Сократите последовательность с помощью трипсина, допуская 1 пропущенный сайт разламывания.

[parts2, sites2, lengths2, missed] = cleave(S.Sequence,'trypsin','missedsites',1);

Отобразите первые 10 фрагментов, которые имеют 1 пропущенный сайт разламывания.

idx = find(missed);
for i = 1:10
    fprintf('%5d%5d   %s\n',sites2(idx(i)),lengths2(idx(i)),parts2{idx(i)})
end
    0    7   MGTGGRR
    6   35   RGAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR
    7   39   GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIRNNLTR
   41   26   NNLTRLHELENCSVIEGHLQILLMFK
   46   28   LHELENCSVIEGHLQILLMFKTRPEDFR
   67   13   TRPEDFRDLSFPK
   74   18   DLSFPKLIMITDYLLLFR
   80   20   LIMITDYLLLFRVYGLESLK
   92   18   VYGLESLKDLFPNLTVIR
  100   13   DLFPNLTVIRGSR

Смотрите также

| | |

Представлено до R2006a