seqprofile

Вычислите профиль последовательности от набора умножают выровненные последовательности

Синтаксис

Profile = seqprofile(Seqs)
[Profile, Symbols] = seqprofile(Seqs)
seqprofile(Seqs, ...'Alphabet', AlphabetValue, ...)
seqprofile(Seqs, ...'Counts', CountsValue, ...)
seqprofile(Seqs, ...'Gaps', GapsValue, ...)
seqprofile(Seqs, ...'Ambiguous', AmbiguousValue, ...)
seqprofile(Seqs, ...'Limits', LimitsValue, ...)

Аргументы

Seqs

Набор умножает выровненные последовательности, представленные любым из following:.

  • Массив символов

  • Массив ячеек из символьных векторов

  • Вектор строки

  • Массив структур, содержащих поле Sequence

AlphabetValue

Вектор символов или строка, задающая алфавит последовательности. Выбор:

  • 'NT' — Нуклеотиды

  • 'AA' — Аминокислоты (значение по умолчанию)

  • 'none' Никакой алфавит

Когда Alphabet является 'none', список символов основан на наблюдаемых символах. Каждый символ может быть любым символом, за исключением дефиса (-) и период (.), которые резервируются для разрывов.

CountsValue

Средства управления, возвращающие частоту (отношение количеств количеств/общего количества) или количеств. Выбором является true (количества) или false (частота). Значением по умолчанию является false.

GapsValue

Вектор символов или строка, которая управляет подсчетом разрывов в последовательности. Выбор:

  • все Количества все разрывы

  • 'noflanks' — Количества все разрывы кроме тех во флангах каждой последовательности

  • 'none' Значение по умолчанию. Количества никакие разрывы.

AmbiguousValue

Средства управления считая неоднозначные символы. Введите 'Count', чтобы добавить частичные количества в стандартные символы.

LimitsValue

Задает, использовать ли часть последовательности. Введите вектор [1x2] с первым положением и последней позицией, чтобы включать в профиль. Значением по умолчанию является [1,SeqLength].

Описание

Profile = seqprofile(Seqs) возвращает Profile, матрицу размера [20 (or 4) x SequenceLength] с частотой аминокислот (или нуклеотиды) для каждого столбца в нескольких выравнивание. Распоряжением строк дают

  • 4 нуклеотида — A C G T/U

  • 20 аминокислот — A R N D C Q E G H I L K M F P S T W Y V

[Profile, Symbols] = seqprofile(Seqs) возвращает Symbols, уникальный список символов, где каждый символ в списке соответствует строке в Profile, профиле.

seqprofile(Seqs, ...'PropertyName', PropertyValue, ...) вызывает seqprofile с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

seqprofile(Seqs, ...'Alphabet', AlphabetValue, ...) выбирает алфавит нуклеотида, алфавит аминокислоты или никакой алфавит.

seqprofile(Seqs, ...'Counts', CountsValue, ...) то, когда Counts является true, возвращает количества вместо частоты.

seqprofile(Seqs, ...'Gaps', GapsValue, ...) добавляет строку к нижней части профиля (Profile) со счетом для разрывов.

seqprofile(Seqs, ...'Ambiguous', AmbiguousValue, ...) то, когда Ambiguous является 'count', считает неоднозначные символы аминокислоты (B Z X) и символы нуклеотида (R Y K M S W B D H V N) со стандартными символами. Например, аминокислота, X добавляет количество 1/20 в каждую строку, в то время как аминокислота B рассчитывает как 1/2 в строках N и D.

seqprofile(Seqs, ...'Limits', LimitsValue, ...) задает запуск и конечные положения для профиля относительно индексов нескольких выравнивание.

Примеры

свернуть все

Создайте массив структур, представляющих выравнивание кратного аминокислот:

seqs = fastaread('pf00002.fa');

Возвратите профиль последовательности, и список символов от положения 50 - 55 набора умножают выровненные последовательности, считая все разрывы.

[Profile2,Symbols2] = seqprofile(seqs,'limits',[50 55],'gaps','all')
Profile2 = 21×6

    0.0312    0.0312    0.1562    0.4375    0.1250    0.2188
         0         0    0.3750         0         0         0
         0         0    0.0938    0.1562         0         0
         0         0         0    0.0312         0         0
         0    0.0625         0         0    0.0312         0
         0         0         0    0.0312         0         0
         0         0         0    0.1250         0         0
    0.0312         0    0.0625         0         0         0
         0         0         0         0         0         0
    0.4688    0.0625         0         0    0.3125    0.1562
      ⋮

Symbols2 = 
'ARNDCQEGHILKMFPSTWYV-'

Представлено до R2006a