seqprofile

Вычислите профиль последовательности от набора умножают выровненные последовательности

Синтаксис

Profile = seqprofile(Seqs) [Profile, Symbols] = seqprofile(Seqs) seqprofile(Seqs, ...'Alphabet', AlphabetValue, ...) seqprofile(Seqs, ...'Counts', CountsValue, ...) seqprofile(Seqs, ...'Gaps', GapsValue, ...) seqprofile(Seqs, ...'Ambiguous', AmbiguousValue, ...) seqprofile(Seqs, ...'Limits', LimitsValue, ...)

Аргументы

`Seqs`	Набор умножает выровненные последовательности, представленные любым из following:. Массив символов Массив ячеек из символьных векторов Вектор строки Массив структур, содержащих поле `Sequence`
`AlphabetValue`	Вектор символов или строка, задающая алфавит последовательности. Выбор: `'NT'` — Нуклеотиды `'AA'` — Аминокислоты (значение по умолчанию) `'none'` Никакой алфавит Когда `Alphabet` является `'none'`, список символов основан на наблюдаемых символах. Каждый символ может быть любым символом, за исключением дефиса (-) и период (.), которые резервируются для разрывов.
`CountsValue`	Средства управления, возвращающие частоту (отношение количеств количеств/общего количества) или количеств. Выбором является `true` (количества) или `false` (частота). Значением по умолчанию является `false`.
`GapsValue`	Вектор символов или строка, которая управляет подсчетом разрывов в последовательности. Выбор: `все` Количества все разрывы `'noflanks'` — Количества все разрывы кроме тех во флангах каждой последовательности `'none'` Значение по умолчанию. Количества никакие разрывы.
`AmbiguousValue`	Средства управления считая неоднозначные символы. Введите `'Count'`, чтобы добавить частичные количества в стандартные символы.
`LimitsValue`	Задает, использовать ли часть последовательности. Введите вектор `[1x2]` с первым положением и последней позицией, чтобы включать в профиль. Значением по умолчанию является `[1,SeqLength]`.

Описание

Profile = seqprofile(Seqs) возвращает Profile, матрицу размера [20 (or 4) x SequenceLength] с частотой аминокислот (или нуклеотиды) для каждого столбца в нескольких выравнивание. Распоряжением строк дают

4 нуклеотида — A C G T/U
20 аминокислот — A R N D C Q E G H I L K M F P S T W Y V

[Profile, Symbols] = seqprofile(Seqs) возвращает Symbols, уникальный список символов, где каждый символ в списке соответствует строке в Profile, профиле.

seqprofile(Seqs, ...'PropertyName', PropertyValue, ...) вызывает seqprofile с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

seqprofile(Seqs, ...'Alphabet', AlphabetValue, ...) выбирает алфавит нуклеотида, алфавит аминокислоты или никакой алфавит.

seqprofile(Seqs, ...'Counts', CountsValue, ...) то, когда Counts является true, возвращает количества вместо частоты.

seqprofile(Seqs, ...'Gaps', GapsValue, ...) добавляет строку к нижней части профиля (Profile) со счетом для разрывов.

seqprofile(Seqs, ...'Ambiguous', AmbiguousValue, ...) то, когда Ambiguous является 'count', считает неоднозначные символы аминокислоты (B Z X) и символы нуклеотида (R Y K M S W B D H V N) со стандартными символами. Например, аминокислота, X добавляет количество 1/20 в каждую строку, в то время как аминокислота B рассчитывает как 1/2 в строках N и D.

seqprofile(Seqs, ...'Limits', LimitsValue, ...) задает запуск и конечные положения для профиля относительно индексов нескольких выравнивание.

Примеры

свернуть все

Вычислите профиль последовательности

Скрипт Open Live Script

Создайте массив структур, представляющих выравнивание кратного аминокислот:

seqs = fastaread('pf00002.fa');

Возвратите профиль последовательности, и список символов от положения 50 - 55 набора умножают выровненные последовательности, считая все разрывы.

[Profile2,Symbols2] = seqprofile(seqs,'limits',[50 55],'gaps','all')

Profile2 = 21×6

    0.0312    0.0312    0.1562    0.4375    0.1250    0.2188
         0         0    0.3750         0         0         0
         0         0    0.0938    0.1562         0         0
         0         0         0    0.0312         0         0
         0    0.0625         0         0    0.0312         0
         0         0         0    0.0312         0         0
         0         0         0    0.1250         0         0
    0.0312         0    0.0625         0         0         0
         0         0         0         0         0         0
    0.4688    0.0625         0         0    0.3125    0.1562
      ⋮

Symbols2 = 
'ARNDCQEGHILKMFPSTWYV-'

Документация

seqprofile

Синтаксис

Аргументы

Описание

Примеры

Вычислите профиль последовательности

Смотрите также

Представлено до R2006a

Документация Bioinformatics Toolbox

Поддержка