расколоть

Расколите последовательность аминокислот с ферментом

Синтаксис

Fragments = cleave(SeqAA, Enzyme)
Fragments = cleave(SeqAA, PeptidePattern, Position)
[Fragments, CuttingSites] = cleave(...)
[Fragments, CuttingSites, Lengths] = cleave(...)
[Fragments, CuttingSites, Lengths, Missed] = cleave(...)
cleave(..., 'PartialDigest', PartialDigestValue, ...)
cleave(..., 'MissedSites', MissedSitesValue, ...)
cleave(..., 'Exception', ExceptionValue, ...)

Входные параметры

SeqAA

Одно из следующего:

  • Вектор символов или строка, содержащая однобуквенные коды, задающие последовательность аминокислот.

  • Вектор - строка из целых чисел, задающих последовательность аминокислот.

  • Структура MATLAB®, содержащая поле Sequence, которое содержит последовательность аминокислот, такой, как возвращено fastaread, getgenpept, genpeptread, getpdb или pdbread.

Примеры: 'ARN' или [1 2 3].

Enzyme

Вектор символов или строка, задающая имя или код сокращения для фермента или составной объект, для которого литература задает правило разламывания.

Совет

Используйте функцию cleavelookup, чтобы отобразить имена ферментов и составных объектов в библиотеке правила разламывания.

PeptidePattern

Короткая последовательность аминокислот, чтобы искать в SeqAA, большей последовательности. PeptidePattern может быть любым следующим:

Position

Целое число от 0 до длины PeptidePattern, который задает положение в PeptidePattern, чтобы расколоть.

Примечание

Положение 0 соответствует терминальному концу N PeptidePattern.

PartialDigestValue

Значение от 0 до 1 определение (по умолчанию) вероятности, что сайт разламывания будет расколот.

MissedSitesValue

Неотрицательное целое число, задающее максимальное количество пропущенных сайтов разламывания. Вывод включает все возможные фрагменты пептида, которые могут следовать из пропавших без вести MissedSitesValue или меньшего количества сайтов разламывания. Значением по умолчанию является 0, который эквивалентен идеальному пищеварению.

ExceptionValue

Регулярное выражение (MATLAB), задающий исключение, управляет к правилу разламывания, сопоставленному с Enzyme. По умолчанию правила исключения только применяются в случае трипсина, и все другие ферменты не имеют никакого правила исключения, которое задано как пустой символьный вектор. Чтобы предотвратить использование исключений по умолчанию для трипсина, используйте пустой символьный вектор в качестве правила исключения.

Чтобы видеть регулярное выражение для правил исключения трипсина, проверяйте Раскалывать Интерполяционную таблицу.

Выходные аргументы

Fragments

Массив ячеек из символьных векторов, представляющий фрагменты от разламывания.

CuttingSites

Числовой вектор, содержащий индексы, представляющие сайты разламывания.

Примечание

Функция cleave добавляет 0 в список, таким образом, numel(CuttingSites)==numel(Fragments). Используйте CuttingSites + 1, чтобы указать на первую аминокислоту каждого фрагмента, соответствующего к исходной последовательности.

Lengths

Числовой вектор, содержащий длину каждого фрагмента.

Missed

Числовой вектор, содержащий количество пропущенных сайтов разламывания для каждого фрагмента пептида.

Описание

Fragments = cleave(SeqAA, Enzyme) SeqAA сокращений, последовательность аминокислот, в части на сайтах разламывания, специфичных для Enzyme, вектора символов или строки, задающей имя или код сокращения для фермента или составной объект, для которого литература задает правило разламывания. Это возвращает Fragments, массив ячеек из символьных векторов, представляющий фрагменты от разламывания.

Совет

Используйте функцию cleavelookup, чтобы отобразить имена ферментов и составных объектов в библиотеке правила разламывания.

Fragments = cleave(SeqAA, PeptidePattern, Position) сокращения SeqAA, последовательность аминокислот, в части на сайтах разламывания, заданных шаблоном пептида и положением.

[Fragments, CuttingSites] = cleave(...) возвращает числовой вектор, содержащий индексы, представляющие сайты разламывания.

Примечание

Функция cleave добавляет 0 в список, таким образом, numel(CuttingSites)==numel(Fragments). Используйте CuttingSites + 1, чтобы указать на первую аминокислоту каждого фрагмента, соответствующего к исходной последовательности.

[Fragments, CuttingSites, Lengths] = cleave(...) возвращает числовой вектор, содержащий длину каждого фрагмента.

[Fragments, CuttingSites, Lengths, Missed] = cleave(...) возвращает числовой вектор, содержащий количество пропущенных сайтов разламывания для каждого фрагмента.

cleave(..., 'PropertyName', PropertyValue, ...) вызывает cleave с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Заключите каждый PropertyName в одинарные кавычки. Каждый PropertyName является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:

cleave(..., 'PartialDigest', PartialDigestValue, ...) моделирует частичное пищеварение, где PartialDigestValue является вероятностью сокращаемого сайта разламывания. PartialDigestValue является значением от 0 до 1 (значение по умолчанию).

Эта таблица приводит некоторые общие протеазы и их сайты разламывания.

ПротеазаШаблон пептидаПоложение
Кислота аспарагиновой кислоты ND 1
Химотрипсин[WYF](?!P)1
Глутэмайн К.[ED](?!P) 1
Лизин C[K](?!P) 1
Трипсин[KR](?!P)1

cleave(..., 'MissedSites', MissedSitesValue, ...) возвращает все возможные фрагменты пептида, которые могут следовать из пропавших без вести MissedSitesValue или меньшего количества сайтов разламывания. MissedSitesValue является неотрицательным целым числом. Значением по умолчанию является 0, который эквивалентен идеальному пищеварению.

cleave(..., 'Exception', ExceptionValue, ...) задает правило исключения к правилу разламывания, сопоставленному с Enzyme. ExceptionValue является регулярным выражением (MATLAB). По умолчанию правила исключения только применяются в случае трипсина, и все другие ферменты не имеют никакого правила исключения, которое задано как пустой символьный вектор. Чтобы предотвратить использование исключений по умолчанию для трипсина, задайте пустой символьный вектор как правило исключения.

Примеры

свернуть все

Этот пример показывает, как расколоть последовательность с помощью трипсина.

Получите последовательность белка из базы данных GenPept.

S = getgenpept('AAA59174');

Расколите последовательность, использующую правила разламывания трипсина и все известные исключения.

parts = cleave(S.Sequence,'trypsin');

Отобразите первые десять фрагментов.

parts(1:10)
ans = 

    'MGTGGR'
    'R'
    'GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR'
    'NNLTR'
    'LHELENCSVIEGHLQILLMFK'
    'TRPEDFR'
    'DLSFPK'
    'LIMITDYLLLFR'
    'VYGLESLK'
    'DLFPNLTVIR'

Расколите последовательность, использующую правила разламывания трипсина и одно определенное правило исключения.

parts = cleave(S.Sequence,'trypsin','exception','KD');
parts(1:10)
ans = 

    'MGTGGR'
    'R'
    'GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR'
    'NNLTR'
    'LHELENCSVIEGHLQILLMFK'
    'TRPEDFR'
    'DLSFPK'
    'LIMITDYLLLFR'
    'VYGLESLKDLFPNLTVIR'
    'GSR'

Расколите последовательность с помощью одного из правил разламывания трипсина, которое должно расколоть после K или R, когда следующий остаток не является P.

[parts, sites, lengths] = cleave(S.Sequence,'[KR](?!P)',1);
for i = 1:10
    fprintf('%5d%5d   %s\n',sites(i),lengths(i),parts{i})
end
    0    6   MGTGGR
    6    1   R
    7   34   GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR
   41    5   NNLTR
   46   21   LHELENCSVIEGHLQILLMFK
   67    7   TRPEDFR
   74    6   DLSFPK
   80   12   LIMITDYLLLFR
   92    8   VYGLESLK
  100   10   DLFPNLTVIR

Сократите последовательность с помощью трипсина, допуская 1 пропущенный сайт разламывания.

[parts2, sites2, lengths2, missed] = cleave(S.Sequence,'trypsin','missedsites',1);

Отобразите первые 10 фрагментов, которые имеют 1 пропущенный сайт разламывания.

idx = find(missed);
for i = 1:10
    fprintf('%5d%5d   %s\n',sites2(idx(i)),lengths2(idx(i)),parts2{idx(i)})
end
    0    7   MGTGGRR
    6   35   RGAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR
    7   39   GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIRNNLTR
   41   26   NNLTRLHELENCSVIEGHLQILLMFK
   46   28   LHELENCSVIEGHLQILLMFKTRPEDFR
   67   13   TRPEDFRDLSFPK
   74   18   DLSFPKLIMITDYLLLFR
   80   20   LIMITDYLLLFRVYGLESLK
   92   18   VYGLESLKDLFPNLTVIR
  100   13   DLFPNLTVIRGSR

Смотрите также

| | | |

Представлено до R2006a