seqconsensus

Вычислите последовательность согласия

Синтаксис

CSeq = seqconsensus(Seqs)
[CSeq, Score] = seqconsensus(Seqs)
CSeq = seqconsensus(Profile)
seqconsensus(..., 'PropertyName', PropertyValue,...)
seqconsensus(..., 'ScoringMatrix', ScoringMatrixValue)

Аргументы

SeqsНабор умножает выровненную аминокислоту или последовательности нуклеотида. Введите символьный массив, вектор строки, массив ячеек из символьных векторов или массив структур с полем Sequence.
ProfileПрофиль последовательности. Введите профиль от функции seqprofileПрофиль матрица размера [20 (or 4) x Sequence Length] с частотой или количеством аминокислот (или нуклеотиды) для каждого положения. Profile может также иметь 21 (или 5) строки, если разрывы включены в согласие.
ScoringMatrixValue

Любое из следующего:

  • Вектор символов или строка, задающая матрицу выигрыша, чтобы использовать для выравнивания. Выбор для последовательностей аминокислот:

    • 'BLOSUM62'

    • 'BLOSUM30' увеличение на 5 до 'BLOSUM90'

    • 'BLOSUM100'

    • 'PAM10' увеличение на 10 до 'PAM500'

    • 'DAYHOFF'

    • 'GONNET'

    Значение по умолчанию:

    • 'BLOSUM50' — Когда AlphabetValue равняется 'AA'

    • 'NUC44' — Когда AlphabetValue равняется 'NT'

    Примечание

    Вышеупомянутые матрицы выигрыша, которым предоставляют программное обеспечение, также включают структуру, содержащую масштабный коэффициент, который преобразовывает единицы выходного счета вдребезги. Можно также использовать 'Scale' свойство задать дополнительный масштабный коэффициент, чтобы преобразовать выходной счет от битов до другого модуля.

  • 21x21, 5x5, 20x20, или 4x4 числовой массив. Для включенных разрывом случаев баллы разрыва (последняя строка/столбец) установлены в mean(diag(ScoringMatrix)) для разрыва, соответствующего с другим разрывом и набором к mean(nodiag(ScoringMatrix)) для разрыва, соответствующего с другим символом.

    Примечание

    Если вы используете матрицу выигрыша, которую вы создали, матрица не включает масштабный коэффициент. Выходной счет будет возвращен в тех же модулях как матрица выигрыша.

Примечание

Если необходимо скомпилировать seqconsensus в автономное приложение или компонент программного обеспечения с помощью MATLAB® Compiler™, используйте матрицу вместо вектора символов или строки для ScoringMatrixValue.

Описание

CSeq = seqconsensus(Seqs), для умножения выровненного набора последовательностей (Seqs), возвращает вектор символов с последовательностью согласия (CSeq). Частота символов (20 аминокислоты, 4 нуклеотиды) в наборе последовательностей определяется с функцией seqprofile. Для неоднозначного нуклеотида или символов аминокислоты, частоты или количества добавляется к стандартному набору символов.

[CSeq, Score] = seqconsensus(Seqs) возвращает счет сохранения последовательности согласия. Баллы вычисляются с выигрывающим матричным BLOSUM50 для аминокислот или NUC44 для нуклеотидов. Баллы являются средним евклидовым расстоянием между выигранным символом и значением согласия M-dimensional. M размер алфавита. Значение согласия является профилем, взвешенным матрицей выигрыша.

CSeq = seqconsensus(Profile) возвращает вектор символов с последовательностью согласия (CSeq) от профиля последовательности (Profile).

seqconsensus(..., 'PropertyName', PropertyValue,...) задает дополнительные свойства с помощью имени свойства / пары значения.

seqconsensus(..., 'ScoringMatrix', ScoringMatrixValue) задает матрицу выигрыша.

Следующие входные параметры походят на функцию seqprofile когда алфавит ограничивается 'AA' ornt .

seqconsensus (..., 'Алфавит', AlphabetValue)

seqconsensus (..., 'Разрывы', GapsValue)

seqconsensus (..., 'Неоднозначный', AmbiguousValue)

seqconsensus (..., 'Пределы', LimitsValue)

Примеры

  seqs = fastaread('pf00002.fa');
  [C,S] = seqconsensus(seqs,'limits',[50 60],'gaps','all')
Представлено до R2006a