seqlogo

Отобразите логотип последовательности для нуклеотида или последовательностей аминокислот

Синтаксис

seqlogo(Seqs)
seqlogo(Profile)
WgtMatrix = seqlogo(...)
[WgtMatrix, Handle] = seqlogo(...)
seqlogo(..., 'Displaylogo', DisplaylogoValue, ...)
seqlogo(..., 'Alphabet', AlphabetValue, ...)
seqlogo(..., 'Startat', StartatValue, ...)
seqlogo(..., 'Endat', EndatValue, ...)
seqlogo(..., 'SSCorrection', SSCorrectionValue, ...)

Входные параметры

Seqs

Набор попарных или умножает выровненный нуклеотид или последовательности аминокислот, представленные любым следующим:

  • Массив символов

  • Массив ячеек из символьных векторов

  • Вектор строки

  • Массив структур, содержащих поле Sequence

Profile

Матрица распределения профиля последовательности с частотой нуклеотидов или аминокислот для каждого столбца в нескольких выравнивание, такой, как возвращено функцией seqprofile.

Размер матрицы плотности распределения:

  • Для нуклеотидов — [4 x sequence length]

  • Для аминокислот — [20 x sequence length]

Если разрывы были включены, Profile может иметь строки 5 (для нуклеотидов) или строки 21 (для аминокислот), но seqlogo игнорирует разрывы.

DisplaylogoValue

Управляет отображением логотипа последовательности. Выбором является true (значение по умолчанию) или false.

AlphabetValue

Вектор символов или строка, задающая тип последовательности (нуклеотид или аминокислота). Выбором является 'NT' (значение по умолчанию) or'AA'.

StartatValue

Положительное целое число, которое задает стартовую позицию для последовательностей в Seqs. Стартовой позицией по умолчанию является 1.

EndatValue

Положительное целое число, которое задает конечное положение для последовательностей в Seqs. Значением по умолчанию конечное положение является максимальная длина последовательностей в Seqs.

SSCorrectionValue

Управляет использованием исправления небольшой выборки по оценке количества битов. Выбором является true (значение по умолчанию) или false.

Выходные аргументы

WgtMatrixМассив ячеек, содержащий символ, перечисляет в Seqs или Profile и матрице веса, используемой, чтобы графически отобразить логотип последовательности.
HandleОбработайте к фигуре логотипа последовательности.

Описание

seqlogo(Seqs) отображает логотип последовательности для Seqs, набора выровненных последовательностей. Логотип графически отображает сохранение последовательности в особом положении в выравнивании последовательностей, измеренных в битах. Максимальное сохранение последовательности на сайт является битами log2(4) для последовательностей нуклеотида и битами log2(20) для последовательностей аминокислот. Если значение сохранения последовательности является нулем или отрицательный, никакой логотип не отображен в том положении.

seqlogo(Profile) отображает логотип последовательности для Profile, матрицы распределения профиля последовательности с частотой нуклеотидов или аминокислот для каждого столбца в нескольких выравнивание, такой, как возвращено функцией seqprofile.

Цветовой код для нуклеотидов

Нуклеотид Цвет
AЗеленый
CСиний
GЖелтый
T, UКрасный
ДругойФиолетовый

Цветовой код для аминокислот

Аминокислота Химическое свойствоЦвет
G S T Y C Q NПолярныйЗеленый
A V L I P W F MГидрофобныйОранжевый
D EКислыйКрасный
K R HОсновнойСиний
ДругойЗагар

WgtMatrix = seqlogo(...) возвращает массив ячеек уникальных символов в последовательности Seqs или Profile и информационная матрица веса, используемая, чтобы графически отобразить логотип.

[WgtMatrix, Handle] = seqlogo(...) возвращает указатель на фигуру логотипа последовательности.

seqlogo(Seqs, ...'PropertyName', PropertyValue, ...) вызывает seqpdist с дополнительными свойствами, которые используют имя свойства / пары значения свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и нечувствительный к регистру. Это имя свойства / пары значения свойства следующие:

seqlogo(..., 'Displaylogo', DisplaylogoValue, ...) управляет отображением логотипа последовательности. Выбором является true (значение по умолчанию) или false.

seqlogo(..., 'Alphabet', AlphabetValue, ...) задает тип последовательности (нуклеотид или аминокислота). Выбором является 'NT' (значение по умолчанию) or'AA'.

Примечание

Если вы предоставляете последовательности аминокислот seqlogo, необходимо установить Alphabet на 'AA'.

seqlogo(..., 'Startat', StartatValue, ...) задает стартовую позицию для последовательностей в Seqs. Стартовой позицией по умолчанию является 1.

seqlogo(..., 'Endat', EndatValue, ...) задает конечное положение для последовательностей в Seqs. Значением по умолчанию конечное положение является максимальная длина последовательностей в Seqs.

seqlogo(..., 'SSCorrection', SSCorrectionValue, ...) управляет использованием исправления небольшой выборки по оценке количества битов. Выбором является true (значение по умолчанию) или false.

Примечание

Простое вычисление битов имеет тенденцию переоценивать сохранение в конкретном местоположении. Чтобы компенсировать эту переоценку, когда SSCorrection установлен в true, грубая оценка применяется как аппроксимированное исправление. Это исправление работает лучше, когда количество последовательностей больше, чем 50.

Примеры

свернуть все

Этот пример показывает, как отобразить логотип последовательности для набора выровненных последовательностей нуклеотида.

Создайте серию выровненных последовательностей нуклеотида.

S = {'ATTATAGCAAACTA',...
     'AACATGCCAAAGTA',...
     'ATCATGCAAAAGGA'}
S =

  1x3 cell array

    {'ATTATAGCAAACTA'}    {'AACATGCCAAAGTA'}    {'ATCATGCAAAAGGA'}

Отобразите логотип последовательности.

seqlogo(S)

Этот пример показывает, как отобразить логотип последовательности для набора выровненных последовательностей аминокислот.

Создайте серию выровненных последовательностей аминокислот.

S2 = {'LSGGQRQRVAIARALAL',...
      'LSGGEKQRVAIARALMN',...
      'LSGGQIQRVLLARALAA',...
      'LSGGERRRLEIACVLAL',...
      'FSGGEKKKNELWQMLAL',...
      'LSGGERRRLEIACVLAL'};

Отобразите логотип последовательности, задав последовательность аминокислот и ограничив логотип, чтобы упорядочить положения 2 - 10.

seqlogo(S2, 'alphabet', 'aa', 'startAt', 2, 'endAt', 10)

Ссылки

[1] Шнейдер, T.D., и Стивенс, R.M. (1990). Логотипы последовательности: новый способ отобразить последовательности согласия. Исследование Нуклеиновых кислот 18, 6097–6100.

Смотрите также

| |

Представлено до R2006a