seqconsensus

Расчет консенсусной последовательности

Синтаксис

CSeq = seqconsensus(Seqs) [CSeq, Score] = seqconsensus(Seqs) CSeq = seqconsensus(Profile) seqconsensus(..., 'PropertyName', PropertyValue,...) seqconsensus(..., 'ScoringMatrix', ScoringMatrixValue)

Аргументы

`Seqs`	Набор мультипликационно выровненных аминокислотных или нуклеотидных последовательностей. Введите символьный массив, строковый вектор, массив ячеек символьных векторов или массив структур с полем `Sequence`.
`Profile`	Профиль последовательности. Введите профиль из функции `seqprofile`. `Profile` является матрицей размера `[20 (or 4) x Sequence Length]` с частотой или количеством аминокислот (или нуклеотидов) для каждого положения. `Profile` также может иметь 21 (или 5) строку, если пробелы включены в консенсус.
`ScoringMatrixValue`	Одно из следующих действий: Символьный вектор или строка, задающая матрицу оценки для выравнивания. Варианты аминокислотных последовательностей: `'BLOSUM62'` `'BLOSUM30'` увеличение на `5` до `'BLOSUM90'` `'BLOSUM100'` `'PAM10'` увеличение на `10` до `'PAM500'` `'DAYHOFF'` `'GONNET'` Значение по умолчанию: `'BLOSUM50'` - Когда `AlphabetValue` равняется `'AA'` `'NUC44'` - Когда `AlphabetValue` равняется `'NT'` Примечание Вышеупомянутые матрицы оценки, снабженные программным обеспечением, также включают в себя структуру, содержащую масштабный коэффициент, который преобразует единицы выходной оценки в биты. Вы также можете использовать `'Scale'` свойство для указания дополнительного масштабного коэффициента для преобразования выходной оценки из битов в другую единицу. A `21x21`, `5x5`, `20x20`, или `4x4` числовой массив. Для случаев, включенных в гэп, для баллов гэпа (последняя строка/столбец) установлено значение `mean(diag(ScoringMatrix))` для совпадения промежутка с другим промежутком и задайте значение `mean(nodiag(ScoringMatrix))` для сопоставления промежутка с другим символом. Примечание Если используется созданная матрица оценки, она не включает масштабный коэффициент. Выходной балл будет возвращен в тех же единицах, что и матрица оценки. Примечание Если нужно скомпилировать `seqconsensus` в автономном приложении или программном компоненте, использующем MATLAB ® Compiler™, используйте матрицу вместо символьного вектора или строки для`ScoringMatrixValue`.

Описание

CSeq = seqconsensus(Seqs), для множественно выровненного набора последовательностей (Seqs), возвращает вектор символов с консенсусной последовательностью (CSeq). Частота символов (20 аминокислоты, 4 нуклеотиды) в наборе последовательностей определяется функцией seqprofile. Для неоднозначных нуклеотидных или аминокислотных символов частоту или число добавляют к стандартному набору символов.

[CSeq, Score] = seqconsensus(Seqs) возвращает оценку сохранения консенсусной последовательности. Баллы вычисляются с помощью матрицы оценки BLOSUM50 для аминокислот или NUC44 для нуклеотидов. Баллы представляют собой среднее евклидовое расстояние между обозначенным символом и М-мерным консенсусным значением. M - размер алфавита. Консенсусное значение - это профиль, взвешенный по матрице оценки.

CSeq = seqconsensus(Profile) возвращает вектор символов с консенсусной последовательностью (CSeq) из профиля последовательности (Profile).

seqconsensus(..., 'PropertyName', PropertyValue,...) определяет дополнительные свойства, используя пары имя/значение свойства.

seqconsensus(..., 'ScoringMatrix', ScoringMatrixValue) задает матрицу оценки.

Следующие входные параметры аналогичны функции seqprofile когда алфавит ограничен 'AA' или 'NT'.

seqconsensus(..., 'Alphabet', AlphabetValue)

seqconsensus(..., 'Gaps', GapsValue)

seqconsensus(..., 'Ambiguous', AmbiguousValue)

seqconsensus(..., 'Limits', LimitsValue)

Примеры

  seqs = fastaread('pf00002.fa');
  [C,S] = seqconsensus(seqs,'limits',[50 60],'gaps','all')

См. также

Представлен до R2006a

Документация