exponenta event banner

расколоть

Расщепление аминокислотной последовательности ферментом

Синтаксис

Fragments = cleave(SeqAA, Enzyme)
Fragments = cleave(SeqAA, PeptidePattern, Position)
[Fragments, CuttingSites] = cleave(...)
[Fragments, CuttingSites, Lengths] = cleave(...)
[Fragments, CuttingSites, Lengths, Missed] = cleave(...)
cleave(..., 'PartialDigest', PartialDigestValue, ...)
cleave(..., 'MissedSites', MissedSitesValue, ...)
cleave(..., 'Exception', ExceptionValue, ...)

Входные аргументы

SeqAA

Одно из следующих:

  • Символьный вектор или строка, содержащая однобуквенные коды, определяющие аминокислотную последовательность.

  • Вектор ряда целых чисел, указывающий аминокислотную последовательность.

  • Структура MATLAB ®, содержащая Sequence поле, которое содержит аминокислотную последовательность, такую как возвращенная fastaread, getgenpept, genpeptread, getpdb, или pdbread.

Примеры: 'ARN' или [1 2 3].

Enzyme

Символьный вектор или строка, указывающая имя или код сокращения для фермента или соединения, для которого в литературе указано правило расщепления.

Совет

Используйте cleavelookup функция для отображения названий ферментов и соединений в библиотеке правил расщепления.

PeptidePattern

Короткая аминокислотная последовательность для поиска в SeqAA, большая последовательность. PeptidePattern может быть любым из следующих:

Position

Целое число от 0 до длины PeptidePattern, которая указывает позицию в PeptidePattern для расщепления.

Примечание

Положение 0 соответствует N терминальному концу PeptidePattern.

PartialDigestValue

Значение от 0 кому 1 (по умолчанию), указывая вероятность того, что сайт расщепления будет расщеплен.

MissedSitesValue

Неотрицательное целое число, указывающее максимальное число пропущенных сайтов расщепления. Выход включает все возможные пептидные фрагменты, которые могут быть результатом отсутствия MissedSitesValue или менее сайтов расщепления. По умолчанию: 0, что эквивалентно идеальному пищеварению.

ExceptionValue

Регулярное выражение, указывающее правило исключения для правила разделения, связанного с Enzyme. По умолчанию правила исключений применяются только в случае трипсина, а у всех остальных ферментов нет правила исключений, которое указано как пустой символьный вектор. Чтобы предотвратить использование исключений по умолчанию для трипсина, используйте пустой символьный вектор в качестве правила исключения.

Чтобы просмотреть регулярное выражение для правил исключения трипсина, проверьте таблицу Clave Lookup.

Выходные аргументы

Fragments

Клеточный массив символьных векторов, представляющих фрагменты расщепления.

CuttingSites

Числовой вектор, содержащий индексы, представляющие сайты расщепления.

Примечание

cleave функция добавляет 0 в список, так numel(CuttingSites)==numel(Fragments). Использовать CuttingSites + 1 указывают на первую аминокислоту каждого фрагмента, соответствующую исходной последовательности.

Lengths

Числовой вектор, содержащий длину каждого фрагмента.

Missed

Числовой вектор, содержащий количество пропущенных сайтов расщепления для каждого пептидного фрагмента.

Описание

Fragments = cleave(SeqAA, Enzyme) сокращения SeqAAаминокислотная последовательность на части в сайтах расщепления, специфичных для Enzyme, символьный вектор или строка, указывающая имя или код сокращения для фермента или соединения, для которого литература определяет правило расщепления. Возвращается Fragments, клеточный массив символьных векторов, представляющих фрагменты из расщепления.

Совет

Используйте cleavelookup функция для отображения названий ферментов и соединений в библиотеке правил расщепления.

Fragments = cleave(SeqAA, PeptidePattern, Position) сокращения SeqAAаминокислотная последовательность на части в местах расщепления, определенных пептидным паттерном и положением.

[Fragments, CuttingSites] = cleave(...) возвращает числовой вектор, содержащий индексы, представляющие сайты расщепления.

Примечание

cleave функция добавляет 0 в список, так numel(CuttingSites)==numel(Fragments). Использовать CuttingSites + 1 указывают на первую аминокислоту каждого фрагмента, соответствующую исходной последовательности.

[Fragments, CuttingSites, Lengths] = cleave(...) возвращает числовой вектор, содержащий длину каждого фрагмента.

[Fragments, CuttingSites, Lengths, Missed] = cleave(...) возвращает числовой вектор, содержащий количество пропущенных сайтов расщепления для каждого фрагмента.

cleave(..., 'PropertyName', PropertyValue, ...) требования cleave с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Заключить каждый PropertyName в одинарных кавычках. Каждый PropertyName нечувствителен к регистру. Эти пары имя/значение свойства следующие:

cleave(..., 'PartialDigest', PartialDigestValue, ...) имитирует частичное переваривание, где PartialDigestValue - вероятность разреза места расщепления. PartialDigestValue является значением из 0 кому 1 (по умолчанию).

В этой таблице перечислены некоторые распространенные протеазы и их сайты расщепления.

ПротеазаПаттерн пептидаПоложение
Аспарагиновая кислота ND 1
Химотрипсин[WYF](?!P)1
Глутамин С[ED](?!P) 1
Лизин С[K](?!P) 1
Трипсин[KR](?!P)1

cleave(..., 'MissedSites', MissedSitesValue, ...) возвращает все возможные фрагменты пептида, которые могут возникнуть в результате отсутствия MissedSitesValue или менее сайтов расщепления. MissedSitesValue - неотрицательное целое число. По умолчанию: 0, что эквивалентно идеальному пищеварению.

cleave(..., 'Exception', ExceptionValue, ...) указывает правило исключения для правила разделения, связанного с Enzyme. ExceptionValue является регулярным выражением. По умолчанию правила исключений применяются только в случае трипсина, а у всех остальных ферментов нет правила исключений, которое указано как пустой символьный вектор. Чтобы предотвратить использование исключений по умолчанию для трипсина, укажите пустой символьный вектор в качестве правила исключения.

Примеры

свернуть все

В этом примере показано, как расщепить последовательность с помощью трипсина.

Извлеките последовательность белка из базы данных GenPept.

S = getgenpept('AAA59174');

Склеивайте последовательность, используя правила расщепления трипсина и все известные исключения.

parts = cleave(S.Sequence,'trypsin');

Отображение первых десяти фрагментов.

parts(1:10)
ans = 

    'MGTGGR'
    'R'
    'GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR'
    'NNLTR'
    'LHELENCSVIEGHLQILLMFK'
    'TRPEDFR'
    'DLSFPK'
    'LIMITDYLLLFR'
    'VYGLESLK'
    'DLFPNLTVIR'

Удалите последовательность с помощью правил расщепления трипсина и отдельного правила исключения.

parts = cleave(S.Sequence,'trypsin','exception','KD');
parts(1:10)
ans = 

    'MGTGGR'
    'R'
    'GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR'
    'NNLTR'
    'LHELENCSVIEGHLQILLMFK'
    'TRPEDFR'
    'DLSFPK'
    'LIMITDYLLLFR'
    'VYGLESLKDLFPNLTVIR'
    'GSR'

Расщепляют последовательность, используя одно из правил расщепления трипсина, которое должно расщепляться после K или R, когда следующий остаток не является P.

[parts, sites, lengths] = cleave(S.Sequence,'[KR](?!P)',1);
for i = 1:10
    fprintf('%5d%5d   %s\n',sites(i),lengths(i),parts{i})
end
    0    6   MGTGGR
    6    1   R
    7   34   GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR
   41    5   NNLTR
   46   21   LHELENCSVIEGHLQILLMFK
   67    7   TRPEDFR
   74    6   DLSFPK
   80   12   LIMITDYLLLFR
   92    8   VYGLESLK
  100   10   DLFPNLTVIR

Разрезают последовательность с использованием трипсина, позволяя получить 1 пропущенный сайт расщепления.

[parts2, sites2, lengths2, missed] = cleave(S.Sequence,'trypsin','missedsites',1);

Отображение первых 10 фрагментов, имеющих 1 пропущенный сайт расщепления.

idx = find(missed);
for i = 1:10
    fprintf('%5d%5d   %s\n',sites2(idx(i)),lengths2(idx(i)),parts2{idx(i)})
end
    0    7   MGTGGRR
    6   35   RGAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIR
    7   39   GAAAAPLLVAVAALLLGAAGHLYPGEVCPGMDIRNNLTR
   41   26   NNLTRLHELENCSVIEGHLQILLMFK
   46   28   LHELENCSVIEGHLQILLMFKTRPEDFR
   67   13   TRPEDFRDLSFPK
   74   18   DLSFPKLIMITDYLLLFR
   80   20   LIMITDYLLLFRVYGLESLK
   92   18   VYGLESLKDLFPNLTVIR
  100   13   DLFPNLTVIRGSR

См. также

| | |

Представлен до R2006a