cleave

Расщепите аминокислотную последовательность ферментом

Синтаксис

Fragments = cleave(SeqAA, Enzyme)
Fragments = cleave(SeqAA, PeptidePattern, Position)
[Fragments, CuttingSites] = cleave(...)
[Fragments, CuttingSites, Lengths] = cleave(...)
[Fragments, CuttingSites, Lengths, Missed] = cleave(...)
cleave(..., 'PartialDigest', PartialDigestValue, ...)
cleave(..., 'MissedSites', MissedSitesValue, ...)
cleave(..., 'Exception', ExceptionValue, ...)

Входные параметры

SeqAA

Одно из следующих:

  • Вектор символов или строка, содержащая однобуквенные коды, задающие аминокислотную последовательность.

  • Вектор-строка из целых чисел, задающий аминокислотную последовательность.

  • MATLAB® структура, содержащая Sequence поле, которое содержит аминокислотную последовательность, такую как возвращенная fastaread, getgenpept, genpeptread, getpdb, или pdbread.

Примеры: 'ARN' или [1 2 3].

Enzyme

Вектор символов или строка, задающая имя или код сокращения для фермента или соединения, для которого в литературе задается правило расщепления.

Совет

Используйте cleavelookup функция для отображения имен ферментов и соединений в библиотеке правил расщепления.

PeptidePattern

Короткая аминокислотная последовательность для поиска в SeqAA, большую последовательность. PeptidePattern может быть любым из следующих:

Position

Целое число от 0 к длине PeptidePattern, который задает положение в PeptidePattern чтобы расщепить.

Примечание

Позиционные 0 соответствует N терминальному концу PeptidePattern.

PartialDigestValue

Значение от 0 на 1 (по умолчанию), указывая вероятность того, что сайт расщепления будет удален.

MissedSitesValue

Неотрицательное целое число, задающее максимальное количество пропущенных сайтов расщепления. Выход включает все возможные пептидные фрагменты, которые могут быть результатом отсутствия MissedSitesValue или меньше сайтов расщепления. По умолчанию это 0, что эквивалентно идеальному пищеварению.

ExceptionValue

Регулярное выражение, задающее правило исключения для правила расщепления, сопоставленного с Enzyme. По умолчанию правила исключения применяются только в случае трипсина, а все другие ферменты не имеют правила исключения, которое задается как пустой символьный вектор. Чтобы предотвратить использование исключений по умолчанию для трипсина, используйте пустой символьный вектор в качестве правила исключения.

Чтобы увидеть регулярное выражение для правил исключений трипсина, проверьте Интерполяционную таблицу.

Выходные аргументы

Fragments

Массив ячеек из символьных векторов, представляющих фрагменты из расщепления.

CuttingSites

Числовой вектор, содержащий индексы, представляющие сайты расщепления.

Примечание

cleave функция добавляет 0 в список, так числить (CuttingSites) = = numel (Fragments). Использование CuttingSites + 1 указание на первую аминокислоту каждого фрагмента, соответствующего исходной последовательности.

Lengths

Числовой вектор, содержащий длину каждого фрагмента.

Missed

Численный вектор, содержащий количество пропущенных сайтов расщепления для каждого пептидного фрагмента.

Описание

Fragments = cleave(SeqAA, Enzyme) вырезы SeqAA, аминокислотная последовательность, на части в местах расщепления, специфичных для Enzyme, вектор символов или строка, задающая имя или сокращение код для фермента или соединения, для которого в литературе задается правило расщепления. Возвращается Fragments, массив ячеек из векторов символов, представляющий фрагменты из расщепления.

Совет

Используйте cleavelookup функция для отображения имен ферментов и соединений в библиотеке правил расщепления.

Fragments = cleave(SeqAA, PeptidePattern, Position) вырезы SeqAAаминокислотная последовательность на части в местах расщепления, заданных пептидным шаблоном и положением.

[Fragments, CuttingSites] = cleave(...) возвращает числовой вектор, содержащий индексы, представляющие сайты расщепления.

Примечание

cleave функция добавляет 0 в список, так числить (CuttingSites) = = numel (Fragments). Использование CuttingSites + 1 указание на первую аминокислоту каждого фрагмента, соответствующего исходной последовательности.

[Fragments, CuttingSites, Lengths] = cleave(...) возвращает числовой вектор, содержащий длину каждого фрагмента.

[Fragments, CuttingSites, Lengths, Missed] = cleave(...) возвращает числовой вектор, содержащий количество пропущенных сайтов расщепления для каждого фрагмента.

cleave (..., 'PropertyName', PropertyValue, ...) вызывает cleave с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Заключайте каждую PropertyName в одинарных кавычках. Каждый PropertyName является нечувствительным к регистру. Эти имена свойства/пары значения свойств следующие:

cleave(..., 'PartialDigest', PartialDigestValue, ...) моделирует частичное пищеварение, где PartialDigestValue - вероятность разрыва участка расщепления. PartialDigestValue является значением от 0 на 1 (по умолчанию).

В этой таблице перечислены некоторые общие протеазы и их сайты расщепления.

ПротеазаПептидный шаблонПоложение
Аспарагиновая кислота ND 1
Химотрипсин[WYF](?!P)1
Глютамин C[ED](?!P) 1
Лизин C[K](?!P) 1
Трипсин[KR](?!P)1

cleave(..., 'MissedSites', MissedSitesValue, ...) возвращает все возможные пептидные фрагменты, которые могут быть результатом отсутствия MissedSitesValue или меньше сайтов расщепления. MissedSitesValue является неотрицательным целым числом. По умолчанию это 0, что эквивалентно идеальному пищеварению.

cleave(..., 'Exception', ExceptionValue, ...) задает правило исключения для правила расщепления, связанного с Enzyme. ExceptionValue является регулярным выражением. По умолчанию правила исключения применяются только в случае трипсина, а все другие ферменты не имеют правила исключения, которое задается как пустой символьный вектор. Чтобы предотвратить использование исключений по умолчанию для трипсина, укажите пустой символьный вектор в качестве правила исключения.

Примеры

свернуть все

Этот пример показывает, как расщепить последовательность с помощью трипсина.

Извлечение последовательности белков из базы данных GenPept.

S = getgenpept('AAA59174');

Расщепите последовательность, используя правила расщепления трипсина и все известные исключения.

parts = cleave(S.Sequence,'trypsin');

Отображение первых десяти фрагментов.

parts(1:10)
ans = 

    'MGTGGR'
    'R'
    'GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR'
    'NNLTR'
    'LHELENCSVIEGHLQILLMFK'
    'TRPEDFR'
    'DLSFPK'
    'LIMITDYLLLFR'
    'VYGLESLK'
    'DLFPNLTVIR'

Очистите последовательность, используя правила расщепления трипсина и одно конкретное правило исключения.

parts = cleave(S.Sequence,'trypsin','exception','KD');
parts(1:10)
ans = 

    'MGTGGR'
    'R'
    'GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR'
    'NNLTR'
    'LHELENCSVIEGHLQILLMFK'
    'TRPEDFR'
    'DLSFPK'
    'LIMITDYLLLFR'
    'VYGLESLKDLFPNLTVIR'
    'GSR'

Расщепите последовательность, используя один из правил расщепления трипсина, который должен расщепляться после K или R, когда следующий остаток не является P.

[parts, sites, lengths] = cleave(S.Sequence,'[KR](?!P)',1);
for i = 1:10
    fprintf('%5d%5d   %s\n',sites(i),lengths(i),parts{i})
end
    0    6   MGTGGR
    6    1   R
    7   34   GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR
   41    5   NNLTR
   46   21   LHELENCSVIEGHLQILLMFK
   67    7   TRPEDFR
   74    6   DLSFPK
   80   12   LIMITDYLLLFR
   92    8   VYGLESLK
  100   10   DLFPNLTVIR

Вырежьте последовательность с помощью трипсина, используя 1 пропущенный сайт расщепления.

[parts2, sites2, lengths2, missed] = cleave(S.Sequence,'trypsin','missedsites',1);

Отображение первых 10 фрагментов с 1 пропущенным сайтом расщепления.

idx = find(missed);
for i = 1:10
    fprintf('%5d%5d   %s\n',sites2(idx(i)),lengths2(idx(i)),parts2{idx(i)})
end
    0    7   MGTGGRR
    6   35   RGAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR
    7   39   GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIRNNLTR
   41   26   NNLTRLHELENCSVIEGHLQILLMFK
   46   28   LHELENCSVIEGHLQILLMFKTRPEDFR
   67   13   TRPEDFRDLSFPK
   74   18   DLSFPKLIMITDYLLLFR
   80   20   LIMITDYLLLFRVYGLESLK
   92   18   VYGLESLKDLFPNLTVIR
  100   13   DLFPNLTVIRGSR

См. также

| | |

Представлено до R2006a