seqlogo

Отобразите логотип последовательности для нуклеотида или последовательностей аминокислот

Синтаксис

seqlogo(Seqs)
seqlogo(Profile)
WgtMatrix = seqlogo(...)
[WgtMatrix, Handle] = seqlogo(...)
seqlogo(..., 'Displaylogo', DisplaylogoValue, ...)
seqlogo(..., 'Alphabet', AlphabetValue, ...)
seqlogo(..., 'Startat', StartatValue, ...)
seqlogo(..., 'Endat', EndatValue, ...)
seqlogo(..., 'SSCorrection', SSCorrectionValue, ...)

Входные параметры

Seqs

Набор попарных или умножает выровненный нуклеотид или последовательности аминокислот, представленные любым следующим:

  • Массив символов

  • Массив ячеек из символьных векторов

  • Вектор строки

  • Массив структур, содержащих Sequence поле

Profile

Матрица распределения профиля последовательности с частотой нуклеотидов или аминокислот для каждого столбца в нескольких выравнивание, такой, как возвращено seqprofile функция.

Размер матрицы плотности распределения:

  • Для нуклеотидов — [4 x sequence length]

  • Для аминокислот — [20 x sequence length]

Если разрывы были включены, Profile может иметь 5 строки (для нуклеотидов) или 21 строки (для аминокислот), но seqlogo игнорирует разрывы.

DisplaylogoValue

Управляет отображением логотипа последовательности. Выбором является true (значение по умолчанию) или false.

AlphabetValue

Вектор символов или строка, задающая тип последовательности (нуклеотид или аминокислота). Выбором является 'NT' (значение по умолчанию) or'AA'.

StartatValue

Положительное целое число, которое задает стартовую позицию для последовательностей в Seqs. Стартовой позицией по умолчанию является 1.

EndatValue

Положительное целое число, которое задает конечное положение для последовательностей в Seqs. Значением по умолчанию конечное положение является максимальная длина последовательностей в Seqs.

SSCorrectionValue

Управляет использованием коррекции небольшой выборки по оценке количества битов. Выбором является true (значение по умолчанию) или false.

Выходные аргументы

WgtMatrixМассив ячеек, содержащий символ, перечисляет в Seqs или Profile и матрица веса, используемая, чтобы графически отобразить логотип последовательности.
HandleОбработайте к фигуре логотипа последовательности.

Описание

seqlogo(Seqs) отображает логотип последовательности для Seqs, набор выровненных последовательностей. Логотип графически отображает сохранение последовательности в особом положении в выравнивании последовательностей, измеренных в битах. Максимальным сохранением последовательности на сайт является log2(4) биты для последовательностей нуклеотида и log2(20) биты для последовательностей аминокислот. Если значение сохранения последовательности является нулем или отрицательный, никакой логотип не отображен в том положении.

seqlogo(Profile) отображает логотип последовательности для Profile, матрица распределения профиля последовательности с частотой нуклеотидов или аминокислот для каждого столбца в нескольких выравнивание, такой, как возвращено seqprofile функция.

Цветовой код для нуклеотидов

Нуклеотид Цвет
AЗеленый
CСиний
GЖелтый
TUКрасный
ДругойФиолетовый

Цветовой код для аминокислот

Аминокислота Химическое свойствоЦвет
G S T Y C Q NПолярныйЗеленый
A V L I P W F MГидрофобныйОранжевый
D EКислыйКрасный
K R HОсновнойСиний
ДругойTan

WgtMatrix = seqlogo(...) возвращает массив ячеек уникальных символов в последовательности Seqs или Profile, и информационная матрица веса, используемая, чтобы графически отобразить логотип.

[WgtMatrix, Handle] = seqlogo(...) возвращает указатель на фигуру логотипа последовательности.

seqlogo (SeqsPropertyName ', PropertyValue, ...) вызовы seqpdist с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

seqlogo(..., 'Displaylogo', DisplaylogoValue, ...) управляет отображением логотипа последовательности. Выбором является true (значение по умолчанию) или false.

seqlogo(..., 'Alphabet', AlphabetValue, ...) задает тип последовательности (нуклеотид или аминокислота). Выбором является 'NT' (значение по умолчанию) or'AA'.

Примечание

Если вы предоставляете последовательности аминокислот seqlogo, необходимо установить Alphabet к 'AA'.

seqlogo(..., 'Startat', StartatValue, ...) задает стартовую позицию для последовательностей в Seqs. Стартовой позицией по умолчанию является 1.

seqlogo(..., 'Endat', EndatValue, ...) задает конечное положение для последовательностей в Seqs. Значением по умолчанию конечное положение является максимальная длина последовательностей в Seqs.

seqlogo(..., 'SSCorrection', SSCorrectionValue, ...) управляет использованием коррекции небольшой выборки по оценке количества битов. Выбором является true (значение по умолчанию) или false.

Примечание

Простое вычисление битов имеет тенденцию переоценивать сохранение в конкретном местоположении. Компенсировать эту переоценку, когда SSCorrection установлен в true, грубая оценка применяется как аппроксимированная коррекция. Эта коррекция работает лучше, когда количество последовательностей больше 50.

Примеры

свернуть все

В этом примере показано, как отобразить логотип последовательности для набора выровненных последовательностей нуклеотида.

Создайте серию выровненных последовательностей нуклеотида.

S = {'ATTATAGCAAACTA',...
     'AACATGCCAAAGTA',...
     'ATCATGCAAAAGGA'}
S =

  1x3 cell array

    {'ATTATAGCAAACTA'}    {'AACATGCCAAAGTA'}    {'ATCATGCAAAAGGA'}

Отобразите логотип последовательности.

seqlogo(S)

В этом примере показано, как отобразить логотип последовательности для набора выровненных последовательностей аминокислот.

Создайте серию выровненных последовательностей аминокислот.

S2 = {'LSGGQRQRVAIARALAL',...
      'LSGGEKQRVAIARALMN',...
      'LSGGQIQRVLLARALAA',...
      'LSGGERRRLEIACVLAL',...
      'FSGGEKKKNELWQMLAL',...
      'LSGGERRRLEIACVLAL'};

Отобразите логотип последовательности, задав последовательность аминокислот и ограничив логотип, чтобы упорядочить положения 2 - 10.

seqlogo(S2, 'alphabet', 'aa', 'startAt', 2, 'endAt', 10)

Ссылки

[1] Шнейдер, T.D., и Стивенс, R.M. (1990). Логотипы последовательности: новый способ отобразить последовательности согласия. Исследование Нуклеиновых кислот 18, 6097–6100.

Смотрите также

| |

Представлено до R2006a