расколоть

Расколите последовательность аминокислот с ферментом

Синтаксис

Fragments = cleave(SeqAA, Enzyme) Fragments = cleave(SeqAA, PeptidePattern, Position) [Fragments, CuttingSites] = cleave(...) [Fragments, CuttingSites, Lengths] = cleave(...) [Fragments, CuttingSites, Lengths, Missed] = cleave(...) cleave(..., 'PartialDigest', PartialDigestValue, ...) cleave(..., 'MissedSites', MissedSitesValue, ...) cleave(..., 'Exception', ExceptionValue, ...)

Входные параметры

`SeqAA`	Одно из следующего: Вектор символов или строка, содержащая однобуквенные коды, задающие последовательность аминокислот. Вектор - строка из целых чисел, задающих последовательность аминокислот. Структура MATLAB^®, содержащая поле `Sequence`, которое содержит последовательность аминокислот, такой, как возвращено `fastaread`, `getgenpept`, `genpeptread`, `getpdb` или `pdbread`. Примеры: `'ARN'` или `[1 2 3]`.
`Enzyme`	Вектор символов или строка, задающая имя или код сокращения для фермента или составной объект, для которого литература задает правило разламывания. Совет Используйте функцию `cleavelookup`, чтобы отобразить имена ферментов и составных объектов в библиотеке правила разламывания.
`PeptidePattern`	Короткая последовательность аминокислот, чтобы искать в `SeqAA`, большей последовательности. `PeptidePattern` может быть любым следующим: Вектор символов или строка Вектор целых чисел Регулярное выражение (MATLAB)
`Position`	Целое число от `0` до длины `PeptidePattern`, который задает положение в `PeptidePattern`, чтобы расколоть. Примечание Положение `0` соответствует терминальному концу N `PeptidePattern`.
`PartialDigestValue`	Значение от `0` до `1` определение (по умолчанию) вероятности, что сайт разламывания будет расколот.
`MissedSitesValue`	Неотрицательное целое число, задающее максимальное количество пропущенных сайтов разламывания. Вывод включает все возможные фрагменты пептида, которые могут следовать из пропавших без вести `MissedSitesValue` или меньшего количества сайтов разламывания. Значением по умолчанию является `0`, который эквивалентен идеальному пищеварению.
`ExceptionValue`	Регулярное выражение (MATLAB), задающий исключение, управляет к правилу разламывания, сопоставленному с `Enzyme`. По умолчанию правила исключения только применяются в случае трипсина, и все другие ферменты не имеют никакого правила исключения, которое задано как пустой символьный вектор. Чтобы предотвратить использование исключений по умолчанию для трипсина, используйте пустой символьный вектор в качестве правила исключения. Чтобы видеть регулярное выражение для правил исключения трипсина, проверяйте Раскалывать Интерполяционную таблицу.

Выходные аргументы

`Fragments`	Массив ячеек из символьных векторов, представляющий фрагменты от разламывания.
`CuttingSites`	Числовой вектор, содержащий индексы, представляющие сайты разламывания. Примечание Функция `cleave` добавляет `0` в список, таким образом`, numel(CuttingSites)==numel(Fragments)`. Используйте `CuttingSites` `+` `1`, чтобы указать на первую аминокислоту каждого фрагмента, соответствующего к исходной последовательности.
`Lengths`	Числовой вектор, содержащий длину каждого фрагмента.
`Missed`	Числовой вектор, содержащий количество пропущенных сайтов разламывания для каждого фрагмента пептида.

Описание

Fragments = cleave(SeqAA, Enzyme) SeqAA сокращений, последовательность аминокислот, в части на сайтах разламывания, специфичных для Enzyme, вектора символов или строки, задающей имя или код сокращения для фермента или составной объект, для которого литература задает правило разламывания. Это возвращает Fragments, массив ячеек из символьных векторов, представляющий фрагменты от разламывания.

Совет

Используйте функцию cleavelookup, чтобы отобразить имена ферментов и составных объектов в библиотеке правила разламывания.

Fragments = cleave(SeqAA, PeptidePattern, Position) сокращения SeqAA, последовательность аминокислот, в части на сайтах разламывания, заданных шаблоном пептида и положением.

[Fragments, CuttingSites] = cleave(...) возвращает числовой вектор, содержащий индексы, представляющие сайты разламывания.

Примечание

Функция cleave добавляет 0 в список, таким образом, numel(CuttingSites)==numel(Fragments). Используйте CuttingSites + 1, чтобы указать на первую аминокислоту каждого фрагмента, соответствующего к исходной последовательности.

[Fragments, CuttingSites, Lengths] = cleave(...) возвращает числовой вектор, содержащий длину каждого фрагмента.

[Fragments, CuttingSites, Lengths, Missed] = cleave(...) возвращает числовой вектор, содержащий количество пропущенных сайтов разламывания для каждого фрагмента.

cleave(..., 'PropertyName', PropertyValue, ...) вызывает cleave с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Заключите каждый PropertyName в одинарные кавычки. Каждый PropertyName является нечувствительным к регистру. Это имя свойства / пары значения свойства следующие:

cleave(..., 'PartialDigest', PartialDigestValue, ...) моделирует частичное пищеварение, где PartialDigestValue является вероятностью сокращаемого сайта разламывания. PartialDigestValue является значением от 0 до 1 (значение по умолчанию).

Эта таблица приводит некоторые общие протеазы и их сайты разламывания.

Протеаза	Шаблон пептида	Положение
Кислота аспарагиновой кислоты N	`D`	1
Химотрипсин	`[WYF](?!P)`	1
Глутэмайн К.	`[ED](?!P)`	1
Лизин C	`[K](?!P)`	1
Трипсин	`[KR](?!P)`	1

cleave(..., 'MissedSites', MissedSitesValue, ...) возвращает все возможные фрагменты пептида, которые могут следовать из пропавших без вести MissedSitesValue или меньшего количества сайтов разламывания. MissedSitesValue является неотрицательным целым числом. Значением по умолчанию является 0, который эквивалентен идеальному пищеварению.

cleave(..., 'Exception', ExceptionValue, ...) задает правило исключения к правилу разламывания, сопоставленному с Enzyme. ExceptionValue является регулярным выражением (MATLAB). По умолчанию правила исключения только применяются в случае трипсина, и все другие ферменты не имеют никакого правила исключения, которое задано как пустой символьный вектор. Чтобы предотвратить использование исключений по умолчанию для трипсина, задайте пустой символьный вектор как правило исключения.

Примеры

свернуть все

Расколите последовательность

Этот пример показывает, как расколоть последовательность с помощью трипсина.

Получите последовательность белка из базы данных GenPept.

S = getgenpept('AAA59174');

Расколите последовательность, использующую правила разламывания трипсина и все известные исключения.

parts = cleave(S.Sequence,'trypsin');

Отобразите первые десять фрагментов.

parts(1:10)

ans = 

    'MGTGGR'
    'R'
    'GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR'
    'NNLTR'
    'LHELENCSVIEGHLQILLMFK'
    'TRPEDFR'
    'DLSFPK'
    'LIMITDYLLLFR'
    'VYGLESLK'
    'DLFPNLTVIR'

Расколите последовательность, использующую правила разламывания трипсина и одно определенное правило исключения.

parts = cleave(S.Sequence,'trypsin','exception','KD');
parts(1:10)

ans = 

    'MGTGGR'
    'R'
    'GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR'
    'NNLTR'
    'LHELENCSVIEGHLQILLMFK'
    'TRPEDFR'
    'DLSFPK'
    'LIMITDYLLLFR'
    'VYGLESLKDLFPNLTVIR'
    'GSR'

Расколите последовательность с помощью одного из правил разламывания трипсина, которое должно расколоть после K или R, когда следующий остаток не является P.

[parts, sites, lengths] = cleave(S.Sequence,'[KR](?!P)',1);
for i = 1:10
    fprintf('%5d%5d   %s\n',sites(i),lengths(i),parts{i})
end

    0    6   MGTGGR
    6    1   R
    7   34   GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR
   41    5   NNLTR
   46   21   LHELENCSVIEGHLQILLMFK
   67    7   TRPEDFR
   74    6   DLSFPK
   80   12   LIMITDYLLLFR
   92    8   VYGLESLK
  100   10   DLFPNLTVIR

Сократите последовательность с помощью трипсина, допуская 1 пропущенный сайт разламывания.

[parts2, sites2, lengths2, missed] = cleave(S.Sequence,'trypsin','missedsites',1);

Отобразите первые 10 фрагментов, которые имеют 1 пропущенный сайт разламывания.

idx = find(missed);
for i = 1:10
    fprintf('%5d%5d   %s\n',sites2(idx(i)),lengths2(idx(i)),parts2{idx(i)})
end

    0    7   MGTGGRR
    6   35   RGAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR
    7   39   GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIRNNLTR
   41   26   NNLTRLHELENCSVIEGHLQILLMFK
   46   28   LHELENCSVIEGHLQILLMFKTRPEDFR
   67   13   TRPEDFRDLSFPK
   74   18   DLSFPKLIMITDYLLLFR
   80   20   LIMITDYLLLFRVYGLESLK
   92   18   VYGLESLKDLFPNLTVIR
  100   13   DLFPNLTVIRGSR

Документация

расколоть

Синтаксис

Входные параметры

Совет

Примечание

Выходные аргументы

Примечание

Описание

Совет

Примечание

Примеры

Расколите последовательность

Смотрите также

Представлено до R2006a

Документация Bioinformatics Toolbox

Поддержка