seqconsensus

Вычислите последовательность согласия

Синтаксис

CSeq = seqconsensus(Seqs)
[CSeq, Score] = seqconsensus(Seqs)
CSeq = seqconsensus(Profile)
seqconsensus(..., 'PropertyName', PropertyValue,...)
seqconsensus(..., 'ScoringMatrix', ScoringMatrixValue)

Аргументы

SeqsНабор умножает выровненную аминокислоту или последовательности нуклеотида. Введите символьный массив, вектор строки, массив ячеек из символьных векторов или массив структур с полем Sequence.
ProfileПрофиль последовательности. Введите профиль от функционального seqprofile. Profile является матрицей размера [20 (or 4) x Sequence Length] с частотой или количеством аминокислот (или нуклеотиды) для каждого положения. Profile может также иметь 21 (или 5) строки, если разрывы включены в согласие.
ScoringMatrixValue

Любое из следующего:

  • Вектор символов или строка, задающая матрицу выигрыша, чтобы использовать для выравнивания. Выбор для последовательностей аминокислот:

    • 'BLOSUM62'

    • 'BLOSUM30', увеличивающийся 5 до 'BLOSUM90'

    • 'BLOSUM100'

    • 'PAM10', увеличивающийся 10 до 'PAM500'

    • 'DAYHOFF'

    • 'GONNET'

    Значение по умолчанию:

    • 'BLOSUM50' — Когда AlphabetValue равняется 'AA'

    • 'NUC44' — Когда AlphabetValue равняется 'NT'

    Примечание

    Вышеупомянутые матрицы выигрыша, которым предоставляют программное обеспечение, также включают структуру, содержащую масштабный коэффициент, который преобразовывает единицы выходного счета вдребезги. Можно также использовать свойство 'Scale' задать дополнительный масштабный коэффициент, чтобы преобразовать выходной счет от битов до другого модуля.

  • 21x21, 5x5, 20x20 или числовой массив 4x4. Для включенных разрывом случаев очки разрыва (последняя строка/столбец) установлены в mean(diag(ScoringMatrix)) для разрыва, соответствующего с другим разрывом, и установлены в mean(nodiag(ScoringMatrix)) для разрыва, соответствующего с другим символом.

    Примечание

    Если вы используете матрицу выигрыша, которую вы создали, матрица не включает масштабный коэффициент. Выходной счет будет возвращен в тех же модулях как матрица выигрыша.

Примечание

Если необходимо скомпилировать seqconsensus в автономное приложение или компонент программного обеспечения с помощью MATLAB® Compiler™, используйте матрицу вместо вектора символов или строки для ScoringMatrixValue.

Описание

CSeq = seqconsensus(Seqs), для умножения выровненного набора последовательностей (Seqs), возвращает вектор символов с последовательностью согласия (CSeq). Частота символов (аминокислоты 20, нуклеотиды 4) в наборе последовательностей определяется с функциональным seqprofile. Для неоднозначного нуклеотида или символов аминокислоты, частоты или количества добавляется к стандартному набору символов.

[CSeq, Score] = seqconsensus(Seqs) возвращает счет сохранения последовательности согласия. Очки вычисляются с выигрывающим матричным BLOSUM50 для аминокислот или NUC44 для нуклеотидов. Очки являются средним евклидовым расстоянием между выигранным символом и значением согласия M-dimensional. M является размером алфавита. Значение согласия является профилем, взвешенным матрицей выигрыша.

CSeq = seqconsensus(Profile) возвращает вектор символов с последовательностью согласия (CSeq) от профиля последовательности (Profile).

seqconsensus(..., 'PropertyName', PropertyValue,...) задает дополнительные свойства с помощью имени свойства / пары значения.

seqconsensus(..., 'ScoringMatrix', ScoringMatrixValue) задает матрицу выигрыша.

Следующие входные параметры походят на функциональный seqprofile, когда алфавит ограничивается 'AA' или 'NT'.

seqconsensus(..., 'Alphabet', AlphabetValue)

seqconsensus(..., 'Gaps', GapsValue)

seqconsensus(..., 'Ambiguous', AmbiguousValue)

seqconsensus(..., 'Limits', LimitsValue)

Примеры

  seqs = fastaread('pf00002.fa');
  [C,S] = seqconsensus(seqs,'limits',[50 60],'gaps','all')

Представлено до R2006a