seqconsensus

Вычислите консенсусную последовательность

Синтаксис

CSeq = seqconsensus(Seqs)
[CSeq, Score] = seqconsensus(Seqs)
CSeq = seqconsensus(Profile)
seqconsensus(..., 'PropertyName', PropertyValue,...)
seqconsensus(..., 'ScoringMatrix', ScoringMatrixValue)

Аргументы

SeqsНабор многократно выровненных аминокислотных или нуклеотидных последовательностей. Введите символьный массив, строковый вектор, массив ячеек из векторов символов или массив структур с полем Sequence.
ProfileПрофиль последовательности. Введите профиль из функции seqprofile. Profile - матрица размера [20 (or 4) x Sequence Length] с частотой или количеством аминокислот (или нуклеотидов) для каждой позиции. Profile может также иметь 21 (или 5) строк, если погрешности включены в консенсус.
ScoringMatrixValue

Одно из следующих:

  • Вектор символов или строка, задающая матрицу скоринга для выравнивания. Варианты для аминокислотных последовательностей:

    • 'BLOSUM62'

    • 'BLOSUM30' увеличение на 5 до 'BLOSUM90'

    • 'BLOSUM100'

    • 'PAM10' увеличение на 10 до 'PAM500'

    • 'DAYHOFF'

    • 'GONNET'

    По умолчанию это:

    • 'BLOSUM50' - Когда AlphabetValue равен 'AA'

    • 'NUC44' - Когда AlphabetValue равен 'NT'

    Примечание

    Вышеупомянутые матрицы оценки, снабженные программным обеспечением, также включают структуру, содержащую коэффициент шкалы, который преобразует модули выхода счета в биты. Можно также использовать 'Scale' свойство, задающее дополнительный коэффициент шкалы для преобразования выхода счета из бит в другой модуль.

  • A 21x21, 5x5, 20x20, или 4x4 числовой массив. Для случаев, включенных в погрешность, счета погрешностей (последняя строка/столбец) устанавливаются на mean(diag(ScoringMatrix)) для промежутка, совпадающего с другим промежутком, и установите равным mean(nodiag(ScoringMatrix)) для зазора, совпадающего с другим символом.

    Примечание

    Если вы используете созданную матрицу скоринга, матрица не включает коэффициент шкалы. Итоговый счет будет возвращаем в тех же модулях измерения, что и матрица оценки.

Примечание

Если вам нужно скомпилироваться seqconsensus в самостоятельное приложение или программный компонент с использованием MATLAB® Compiler™ используйте матрицу вместо вектора символов или строки для ScoringMatrixValue.

Описание

CSeq = seqconsensus(Seqs), для многократно выровненного набора последовательностей (Seqs), возвращает вектор символов с консенсусной последовательностью (CSeq). Частота символов (20 аминокислоты, 4 нуклеотиды) в наборе последовательностей определяется функцией seqprofile. Для неоднозначных нуклеотидных или аминокислотных символов частота или количество добавляется к стандартному набору символов.

[CSeq, Score] = seqconsensus(Seqs) возвращает счет сохранения консенсусной последовательности. Счета вычисляются с помощью матрицы подсчета баллов BLOSUM50 для аминокислот или NUC44 для нуклеотидов. Счета являются средним евклидовым расстоянием между набранным символом и M-мерным консенсусным значением. M - размер алфавита. Консенсусное значение является профилем, взвешенным оценочной матрицей.

CSeq = seqconsensus(Profile) возвращает вектор символов с консенсусной последовательностью (CSeq) из профиля последовательности (Profile).

seqconsensus(..., 'PropertyName', PropertyValue,...) задает необязательные свойства, используя имя свойства/ значение пары.

seqconsensus(..., 'ScoringMatrix', ScoringMatrixValue) задает матрицу оценки.

Следующие входные параметры аналогичны функции seqprofile когда алфавит ограничен 'AA' или 'NT'.

seqconsensus (..., 'Alphabet', AlphabetValue)

seqconsensus (..., 'Gaps', GapsValue)

seqconsensus (..., 'Ambiguous', AmbiguousValue)

seqconsensus (..., 'Limits', LimitsValue)

Примеры

  seqs = fastaread('pf00002.fa');
  [C,S] = seqconsensus(seqs,'limits',[50 60],'gaps','all')
Представлено до R2006a