seqlogo

Отобразите логотип последовательности для нуклеотидных или аминокислотных последовательностей

Синтаксис

seqlogo(Seqs)
seqlogo(Profile)
WgtMatrix = seqlogo(...)
[WgtMatrix, Handle] = seqlogo(...)
seqlogo(..., 'Displaylogo', DisplaylogoValue, ...)
seqlogo(..., 'Alphabet', AlphabetValue, ...)
seqlogo(..., 'Startat', StartatValue, ...)
seqlogo(..., 'Endat', EndatValue, ...)
seqlogo(..., 'SSCorrection', SSCorrectionValue, ...)

Входные параметры

Seqs

Набор парных или множительно выровненных нуклеотидных или аминокислотных последовательностей, представленных любым из следующих:

  • Символьный массив

  • Массив ячеек из символьных векторов

  • Строковый вектор

  • Массив структур, содержащий Sequence область

Profile

Матрица распределения профиля последовательности с частотой нуклеотидов или аминокислот для каждого столбца во множественном выравнивании, например, возвращенная seqprofile функция.

Размер матрицы частотного распределения:

  • Для нуклеотидов - [4 x sequence length]

  • Для аминокислот - [20 x sequence length]

Если были включены пробелы, Profile возможно, имел 5 строки (для нуклеотидов) или 21 строки (для аминокислот), но seqlogo игнорирует погрешности.

DisplaylogoValue

Управление отображением логотипа последовательности. Варианты true (по умолчанию) или false.

AlphabetValue

Вектор символов или строка, задающая тип последовательности (нуклеотид или аминокислота). Варианты 'NT' (по умолчанию) или 'AA'.

StartatValue

Положительное целое число, которое задает начальное положение для последовательностей в Seqs. Начальное положение по умолчанию 1.

EndatValue

Положительное целое число, которое задает конечное положение для последовательностей в Seqs. Конечное положение по умолчанию является максимальной длиной последовательностей в Seqs.

SSCorrectionValue

Управляет использованием небольшой выборки коррекции в оценке количества бит. Варианты true (по умолчанию) или false.

Выходные аргументы

WgtMatrixМассив ячеек, содержащий список символов в Seqs или Profile и весовую матрицу, используемую для графического отображения логотипа последовательности.
HandleУказатель на рисунок логотипа последовательности.

Описание

seqlogo(Seqs) отображает логотип последовательности для Seqs, набор выровненных последовательностей. Логотип графически отображает сохранение последовательности в конкретном положении при выравнивании последовательностей, измеренных в битах. Максимальное сохранение последовательности на сайте log2(4) биты для нуклеотидных последовательностей и log2(20) биты для аминокислотных последовательностей. Если значение сохранения последовательности меньше нуля или отрицательное, логотип в этом положении не отображается.

seqlogo(Profile) отображает логотип последовательности для Profile, матрица распределения профиля последовательности с частотой нуклеотидов или аминокислот для каждого столбца во множестве выравниваний, таких как возвращенная seqprofile функция.

Цветовой код для нуклеотидов

Нуклеотид Цвет
AЗеленый
CСиний
GЖелтый
T, UКрасный
ДругоеФиолетовый

Цветовой код для аминокислот

Аминокислота Химические свойстваЦвет
G S T Y C Q NПолярныйЗеленый
A V L I P W F MГидрофобныйОранжевый
D EКислыйКрасный
K R HОсновнойСиний
ДругоеTan

WgtMatrix = seqlogo(...) возвращает массив ячеек из уникальных символов в последовательности Seqs или Profile, и матрица информационного веса, используемая для графического отображения логотипа.

[WgtMatrix, Handle] = seqlogo(...) возвращает указатель на рисунок логотипа последовательности.

seqlogo (Seqs... 'PropertyName', PropertyValue, ...) вызывает seqpdist с необязательными свойствами, которые используют пары имя/значение свойства. Можно задать одно или несколько свойств в любом порядке. Каждый PropertyName должны быть заключены в одинарные кавычки и нечувствительны к регистру. Эти имена свойства/пары значения свойств следующие:

seqlogo(..., 'Displaylogo', DisplaylogoValue, ...) управляет отображением логотипа последовательности. Варианты true (по умолчанию) или false.

seqlogo(..., 'Alphabet', AlphabetValue, ...) задает тип последовательности (нуклеотид или аминокислота). Варианты 'NT' (по умолчанию) или 'AA'.

Примечание

Если вы обеспечиваете аминокислотные последовательности для seqlogo, вы должны задать Alphabet на 'AA'.

seqlogo(..., 'Startat', StartatValue, ...) задает начальное положение для последовательностей в Seqs. Начальное положение по умолчанию 1.

seqlogo(..., 'Endat', EndatValue, ...) задает конечное положение для последовательностей в Seqs. Конечное положение по умолчанию является максимальной длиной последовательностей в Seqs.

seqlogo(..., 'SSCorrection', SSCorrectionValue, ...) управляет использованием небольшой выборки коррекции в оценке количества бит. Варианты true (по умолчанию) или false.

Примечание

Простое вычисление бит имеет тенденцию переоценивать сохранение в конкретном месте. Чтобы компенсировать эту переоценку, когда SSCorrection установлено в trueприблизительная оценка применяется как приблизительная коррекция. Эта коррекция работает лучше, когда количество последовательностей больше 50.

Примеры

свернуть все

Этот пример показывает, как отобразить логотип последовательности для набора выровненных нуклеотидных последовательностей.

Создайте ряд выровненных нуклеотидных последовательностей.

S = {'ATTATAGCAAACTA',...
     'AACATGCCAAAGTA',...
     'ATCATGCAAAAGGA'}
S =

  1x3 cell array

    {'ATTATAGCAAACTA'}    {'AACATGCCAAAGTA'}    {'ATCATGCAAAAGGA'}

Отобразите логотип последовательности.

seqlogo(S)

Этот пример показывает, как отобразить логотип последовательности для набора выровненных аминокислотных последовательностей.

Создайте ряд выровненных аминокислотных последовательностей.

S2 = {'LSGGQRQRVAIARALAL',...
      'LSGGEKQRVAIARALMN',...
      'LSGGQIQRVLLARALAA',...
      'LSGGERRRLEIACVLAL',...
      'FSGGEKKKNELWQMLAL',...
      'LSGGERRRLEIACVLAL'};

Отобразите логотип последовательности, задав аминокислотную последовательность и ограничив логотип позициями последовательности, 2 через 10.

seqlogo(S2, 'alphabet', 'aa', 'startAt', 2, 'endAt', 10)

Ссылки

[1] Schneider, T.D., and Stephens, R.M. (1990). Sequence Logos: Новый способ отображения консенсусных последовательностей. Исследования нуклеиновых кислот 18, 6097-6100.

См. также

| |

Представлено до R2006a