exponenta event banner

seqlogo

Логотип отображаемой последовательности для нуклеотидных или аминокислотных последовательностей

Синтаксис

seqlogo(Seqs)
seqlogo(Profile)
WgtMatrix = seqlogo(...)
[WgtMatrix, Handle] = seqlogo(...)
seqlogo(..., 'Displaylogo', DisplaylogoValue, ...)
seqlogo(..., 'Alphabet', AlphabetValue, ...)
seqlogo(..., 'Startat', StartatValue, ...)
seqlogo(..., 'Endat', EndatValue, ...)
seqlogo(..., 'SSCorrection', SSCorrectionValue, ...)

Входные аргументы

Seqs

Набор попарных или мультипликационных выровненных нуклеотидных или аминокислотных последовательностей, представленных любым из следующих:

  • Символьный массив

  • Массив ячеек символьных векторов

  • Строковый вектор

  • Массив структур, содержащий Sequence область

Profile

Матрица распределения профиля последовательности с частотой нуклеотидов или аминокислот для каждого столбца во множественном выравнивании, такая как возвращаемая seqprofile функция.

Размер матрицы распределения частот:

  • Для нуклеотидов - [4 x sequence length]

  • Для аминокислот - [20 x sequence length]

Если пробелы были включены, Profile может иметь 5 строки (для нуклеотидов) или 21 строки (для аминокислот), но seqlogo пропуски игнорируются.

DisplaylogoValue

Управление отображением логотипа последовательности. Варианты: true (по умолчанию) или false.

AlphabetValue

Символьный вектор или строка, указывающая тип последовательности (нуклеотид или аминокислота). Варианты: 'NT' (по умолчанию) или'AA'.

StartatValue

Положительное целое число, указывающее начальную позицию для последовательностей в Seqs. Начальное положение по умолчанию - 1.

EndatValue

Положительное целое число, указывающее конечную позицию для последовательностей в Seqs. Конечная позиция по умолчанию - максимальная длина последовательностей в Seqs.

SSCorrectionValue

Управляет использованием малой коррекции выборки при оценке количества битов. Варианты: true (по умолчанию) или false.

Выходные аргументы

WgtMatrixМассив ячеек, содержащий список символов в Seqs или Profile и весовую матрицу, используемую для графического отображения логотипа последовательности.
HandleПерейдите к рисунку логотипа последовательности.

Описание

seqlogo(Seqs) отображает логотип последовательности для Seqsнабор выровненных последовательностей. Логотип графически отображает сохранение последовательности в определенном положении при выравнивании последовательностей, измеренное битами. Максимальное сохранение последовательности на сайте: log2(4) биты для нуклеотидных последовательностей и log2(20) биты для аминокислотных последовательностей. Если значение сохранения последовательности равно нулю или является отрицательным, логотип в этом положении не отображается.

seqlogo(Profile) отображает логотип последовательности для Profileматрица распределения профиля последовательности с частотой нуклеотидов или аминокислот для каждого столбца во множественном выравнивании, такая как возвращаемая seqprofile функция.

Цветовой код для нуклеотидов

Нуклеотид Цвет
AЗеленый
CСиний
GЖелтый
T, UКрасный
ДругоеФиолетовый

Цветовой код для аминокислот

Аминокислота Химическая собственностьЦвет
G S T Y C Q NПолярныйЗеленый
A V L I P W F MГидрофобныйОранжевый
D EКислыйКрасный
K R HОсновнойСиний
ДругоеЗагар

WgtMatrix = seqlogo(...) возвращает массив ячеек уникальных символов в последовательности Seqs или Profileи матрица весов информации, используемая для графического отображения логотипа.

[WgtMatrix, Handle] = seqlogo(...) возвращает маркер к рисунку логотипа последовательности.

seqlogo(Seqs, ...'PropertyName', PropertyValue, ...) требования seqpdist с необязательными свойствами, использующими пары имя/значение свойства. Можно указать одно или несколько свойств в любом порядке. Каждый PropertyName должен быть заключен в одинарные кавычки и не учитывать регистр. Эти пары имя/значение свойства следующие:

seqlogo(..., 'Displaylogo', DisplaylogoValue, ...) управляет отображением логотипа последовательности. Варианты: true (по умолчанию) или false.

seqlogo(..., 'Alphabet', AlphabetValue, ...) определяет тип последовательности (нуклеотид или аминокислота). Варианты: 'NT' (по умолчанию) или'AA'.

Примечание

Если вы предоставляете аминокислотные последовательности seqlogo, необходимо установить Alphabet кому 'AA'.

seqlogo(..., 'Startat', StartatValue, ...) задает начальную позицию для последовательностей в Seqs. Начальное положение по умолчанию - 1.

seqlogo(..., 'Endat', EndatValue, ...) указывает конечную позицию для последовательностей в Seqs. Конечная позиция по умолчанию - максимальная длина последовательностей в Seqs.

seqlogo(..., 'SSCorrection', SSCorrectionValue, ...) управляет использованием малой коррекции выборки при оценке количества битов. Варианты: true (по умолчанию) или false.

Примечание

Простое вычисление битов имеет тенденцию переоценивать сохранение в конкретном местоположении. Чтобы компенсировать эту завышенную оценку, когда SSCorrection имеет значение trueгрубая оценка применяется в качестве приблизительной коррекции. Эта коррекция работает лучше, когда число последовательностей больше 50.

Примеры

свернуть все

В этом примере показано, как отображать логотип последовательности для набора выровненных нуклеотидных последовательностей.

Создать ряд выровненных нуклеотидных последовательностей.

S = {'ATTATAGCAAACTA',...
     'AACATGCCAAAGTA',...
     'ATCATGCAAAAGGA'}
S =

  1x3 cell array

    {'ATTATAGCAAACTA'}    {'AACATGCCAAAGTA'}    {'ATCATGCAAAAGGA'}

Отображение логотипа последовательности.

seqlogo(S)

В этом примере показано, как отображать логотип последовательности для набора выровненных аминокислотных последовательностей.

Создать ряд выровненных аминокислотных последовательностей.

S2 = {'LSGGQRQRVAIARALAL',...
      'LSGGEKQRVAIARALMN',...
      'LSGGQIQRVLLARALAA',...
      'LSGGERRRLEIACVLAL',...
      'FSGGEKKKNELWQMLAL',...
      'LSGGERRRLEIACVLAL'};

Отображение логотипа последовательности с указанием аминокислотной последовательности и ограничением логотипа позициями последовательности 2- 10.

seqlogo(S2, 'alphabet', 'aa', 'startAt', 2, 'endAt', 10)

Ссылки

[1] Шнайдер, Т.Д., и Стивенс, Р.М. (1990). Логотипы последовательностей: новый способ отображения консенсусных последовательностей. Исследования нуклеиновых кислот 18, 6097-6100.

См. также

| |

Представлен до R2006a