exponenta event banner

seqprofile

Вычислить профиль последовательности из набора последовательностей с кратным выравниванием

Синтаксис

Profile = seqprofile(Seqs)
[Profile, Symbols] = seqprofile(Seqs)
seqprofile(Seqs, ...'Alphabet', AlphabetValue, ...)
seqprofile(Seqs, ...'Counts', CountsValue, ...)
seqprofile(Seqs, ...'Gaps', GapsValue, ...)
seqprofile(Seqs, ...'Ambiguous', AmbiguousValue, ...)
seqprofile(Seqs, ...'Limits', LimitsValue, ...)

Аргументы

Seqs

Набор мультипликационных выровненных последовательностей, представленных любым из следующих:.

  • Символьный массив

  • Массив ячеек символьных векторов

  • Строковый вектор

  • Массив структур, содержащих поле Sequence

AlphabetValue

Символьный вектор или строка, задающая алфавит последовательности. Возможны следующие варианты:

  • 'NT' - Нуклеотиды

  • 'AA' - аминокислоты (по умолчанию)

  • 'none' - Без алфавита

Когда Alphabet является 'none'список символов основан на наблюдаемых символах. Каждый символ может быть любым символом, за исключением дефиса (-) и точки (.), которые зарезервированы для пробелов.

CountsValue

Управляет частотой возврата (отношение количества счетчиков к общему количеству счетчиков) или количеством счетчиков. Варианты: true (количество) или false (частота). По умолчанию: false.

GapsValue

Символьный вектор или строка, управляющая подсчетом промежутков в последовательности. Возможны следующие варианты:

  • 'all' - Подсчитывает все пробелы

  • 'noflanks' - Подсчитывает все промежутки, кроме тех, которые находятся на флангах каждой последовательности

  • 'none' - По умолчанию. Не считает пробелов.

AmbiguousValue

Управляет подсчетом неоднозначных символов. Войти 'Count' для добавления частичных счетчиков к стандартным символам.

LimitsValue

Указывает, следует ли использовать часть последовательности. Введите a [1x2] вектор с первой позицией и последней позицией для включения в профиль. По умолчанию: [1,SeqLength].

Описание

Profile = seqprofile(Seqs) прибыль Profile, матрица размера [20 (or 4) x SequenceLength] с частотой аминокислот (или нуклеотидов) для каждого столбца в множественном выравнивании. Порядок строк задается

  • 4 нуклеотида - A C G T/U

  • 20 аминокислоты - A R N D C Q E G H I L K M F P S T W Y V

[Profile, Symbols] = seqprofile(Seqs) прибыль Symbols, уникальный список символов, где каждый символ в списке соответствует строке в Profile, профиль.

seqprofile(Seqs, ...'PropertyName', PropertyValue, ...) требования seqprofile с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

seqprofile(Seqs, ...'Alphabet', AlphabetValue, ...) выбирает нуклеотидный алфавит, аминокислотный алфавит или без алфавита.

seqprofile(Seqs, ...'Counts', CountsValue, ...) когда Counts является true, возвращает счетчики вместо частоты.

seqprofile(Seqs, ...'Gaps', GapsValue, ...) добавляет строку в нижнюю часть профиля (Profile) с учетом пробелов.

seqprofile(Seqs, ...'Ambiguous', AmbiguousValue, ...) когда Ambiguous является 'count', подсчитывает неоднозначные аминокислотные символы (B Z X) и нуклеотидные символы (R Y K M S W B D H V N) со стандартными символами. Например, аминокислота X добавляет 1/20 количество в каждом ряду, в то время как аминокислота B засчитывается как 1/2 на D и N строк.

seqprofile(Seqs, ...'Limits', LimitsValue, ...) задает начальную и конечную позиции профиля относительно индексов нескольких трасс.

Примеры

свернуть все

Создать массив структур, представляющих множественное выравнивание аминокислот:

seqs = fastaread('pf00002.fa');

Верните профиль последовательности и список символов из положения 50-55 набора последовательностей с кратным выравниванием, подсчитывая все промежутки.

[Profile2,Symbols2] = seqprofile(seqs,'limits',[50 55],'gaps','all')
Profile2 = 21×6

    0.0312    0.0312    0.1562    0.4375    0.1250    0.2188
         0         0    0.3750         0         0         0
         0         0    0.0938    0.1562         0         0
         0         0         0    0.0312         0         0
         0    0.0625         0         0    0.0312         0
         0         0         0    0.0312         0         0
         0         0         0    0.1250         0         0
    0.0312         0    0.0625         0         0         0
         0         0         0         0         0         0
    0.4688    0.0625         0         0    0.3125    0.1562
      ⋮

Symbols2 = 
'ARNDCQEGHILKMFPSTWYV-'
Представлен до R2006a