exponenta event banner

seqconsensus

Расчет консенсусной последовательности

Синтаксис

CSeq = seqconsensus(Seqs)
[CSeq, Score] = seqconsensus(Seqs)
CSeq = seqconsensus(Profile)
seqconsensus(..., 'PropertyName', PropertyValue,...)
seqconsensus(..., 'ScoringMatrix', ScoringMatrixValue)

Аргументы

SeqsНабор мультипликационно выровненных аминокислотных или нуклеотидных последовательностей. Введите символьный массив, строковый вектор, массив ячеек символьных векторов или массив структур с полем Sequence.
ProfileПрофиль последовательности. Введите профиль из функции seqprofile. Profile является матрицей размера [20 (or 4) x Sequence Length] с частотой или количеством аминокислот (или нуклеотидов) для каждого положения. Profile также может иметь 21 (или 5) строку, если пробелы включены в консенсус.
ScoringMatrixValue

Одно из следующих действий:

  • Символьный вектор или строка, задающая матрицу оценки для выравнивания. Варианты аминокислотных последовательностей:

    • 'BLOSUM62'

    • 'BLOSUM30' увеличение на 5 до 'BLOSUM90'

    • 'BLOSUM100'

    • 'PAM10' увеличение на 10 до 'PAM500'

    • 'DAYHOFF'

    • 'GONNET'

    Значение по умолчанию:

    • 'BLOSUM50' - Когда AlphabetValue равняется 'AA'

    • 'NUC44' - Когда AlphabetValue равняется 'NT'

    Примечание

    Вышеупомянутые матрицы оценки, снабженные программным обеспечением, также включают в себя структуру, содержащую масштабный коэффициент, который преобразует единицы выходной оценки в биты. Вы также можете использовать 'Scale' свойство для указания дополнительного масштабного коэффициента для преобразования выходной оценки из битов в другую единицу.

  • A 21x21, 5x5, 20x20, или 4x4 числовой массив. Для случаев, включенных в гэп, для баллов гэпа (последняя строка/столбец) установлено значение mean(diag(ScoringMatrix)) для совпадения промежутка с другим промежутком и задайте значение mean(nodiag(ScoringMatrix)) для сопоставления промежутка с другим символом.

    Примечание

    Если используется созданная матрица оценки, она не включает масштабный коэффициент. Выходной балл будет возвращен в тех же единицах, что и матрица оценки.

Примечание

Если нужно скомпилировать seqconsensus в автономном приложении или программном компоненте, использующем MATLAB ® Compiler™, используйте матрицу вместо символьного вектора или строки дляScoringMatrixValue.

Описание

CSeq = seqconsensus(Seqs), для множественно выровненного набора последовательностей (Seqs), возвращает вектор символов с консенсусной последовательностью (CSeq). Частота символов (20 аминокислоты, 4 нуклеотиды) в наборе последовательностей определяется функцией seqprofile. Для неоднозначных нуклеотидных или аминокислотных символов частоту или число добавляют к стандартному набору символов.

[CSeq, Score] = seqconsensus(Seqs) возвращает оценку сохранения консенсусной последовательности. Баллы вычисляются с помощью матрицы оценки BLOSUM50 для аминокислот или NUC44 для нуклеотидов. Баллы представляют собой среднее евклидовое расстояние между обозначенным символом и М-мерным консенсусным значением. M - размер алфавита. Консенсусное значение - это профиль, взвешенный по матрице оценки.

CSeq = seqconsensus(Profile) возвращает вектор символов с консенсусной последовательностью (CSeq) из профиля последовательности (Profile).

seqconsensus(..., 'PropertyName', PropertyValue,...) определяет дополнительные свойства, используя пары имя/значение свойства.

seqconsensus(..., 'ScoringMatrix', ScoringMatrixValue) задает матрицу оценки.

Следующие входные параметры аналогичны функции seqprofile когда алфавит ограничен 'AA' или 'NT'.

seqconsensus(..., 'Alphabet', AlphabetValue)

seqconsensus(..., 'Gaps', GapsValue)

seqconsensus(..., 'Ambiguous', AmbiguousValue)

seqconsensus(..., 'Limits', LimitsValue)

Примеры

  seqs = fastaread('pf00002.fa');
  [C,S] = seqconsensus(seqs,'limits',[50 60],'gaps','all')
Представлен до R2006a