exponenta event banner

clustergram

Объект, содержащий данные анализа иерархической кластеризации

Описание

clustergram функция создает clustergram объект. Объект содержит данные анализа иерархической кластеризации, которые можно просмотреть в тепловой карте и дендрограмме.

Создание

Описание

пример

cgObj = clustergram(data) выполняет анализ иерархической кластеризации для значений в data. Возвращенный объект кластерграммы cgObj содержит данные анализа и отображает дендрограмму и тепловую карту.

пример

cgObj = clustergram(data,Name,Value) задает свойства объекта, используя пары имя-значение. Например, clustergram(data,'Standardize','column') стандартизирует значения по столбцам данных. Можно указать несколько пар имя-значение. Заключите каждое имя свойства в кавычки.

Входные аргументы

развернуть все

Исходные данные, указанные как объект DataMatrix или числовая матрица. Обычно, если матрица содержит данные экспрессии генов, каждая строка соответствует гену, а каждая колонка соответствует образцу.

Аргументы пары «имя-значение»

Чтобы задать свойства объекта, используйте аргументы пары имя-значение, разделенные запятыми. Заключите каждое имя свойства в отдельные кавычки.

Пример: cg = clustergram(data,'Colormap',redbluecmap,'Annotate',true)

Свойства

развернуть все

Измерение для стандартизации значений данных, указанное как символьный вектор, строка или положительное целое число. Возможны следующие варианты:

  • 'column' или 1 - Стандартизация по столбцам данных.

  • 'row' или 2 - Стандартизация по строкам данных.

  • 'none' или 3 - Не стандартизируйте.

При указании 'column' или 'row'функция преобразует стандартизированные значения таким образом, что среднее значение равно 0, а стандартное отклонение равно 1 в указанном измерении.

Пример: 'column'

Типы данных: double | char | string

Флажок, чтобы сделать цветовую шкалу тепловой карты симметричной вокруг нуля, указанной как true или false.

Пример: false

Типы данных: logical

Имя дескриптора функции или функции для вычисления отсутствующих данных, указанного как символьный вектор или массив ячеек. Если указан массив ячеек, первый элемент должен быть именем функции или дескриптора функции, а остальные элементы должны быть парами имя-значение, используемыми в качестве входных данных функции. Отсутствующие точки данных окрашены в серый цвет в тепловой карте.

Если точки данных отсутствуют, используйте это свойство для вычисления отсутствующих значений. В противном случае clustergram ошибки функции.

Пример: 'func1'

Типы данных: char

цвета тепловой карты, заданные в виде матрицы из трех столбцов (M-by-3) со значениями красно-зелено-синего цвета (RGB) или именем дескриптора функции, который возвращает карту цветов, например redgreencmap или redbluecmap.

Карта цветов по умолчанию: redgreencmap, в котором красный представляет значения выше среднего, черный представляет среднее, а зеленый представляет значения ниже среднего значения строки (гена) во всех столбцах (образцах).

Пример: redbluecmap

Типы данных: double | char

Метки столбцов, заданные как строковый вектор, массив ячеек символьных векторов или числовой вектор. Размер вектора должен соответствовать количеству столбцов на входе data.

Если число меток столбцов составляет 200 или более, метки не отображаются на графике кластерграммы.

Пример: ["sample1","sample2","sample3"]

Типы данных: double | string | cell

Метки строк, заданные как строковый вектор, массив ячеек символьных векторов или числовой вектор. Размер вектора должен соответствовать количеству строк на входе data.

Если число меток строк составляет 200 или более, метки не отображаются на графике кластерграммы.

Пример: ["gene1","gene2","gene3"]

Типы данных: double | string | cell

Ориентация меток столбцов, заданная как числовой скаляр. Задайте значение поворота в градусах (положительные углы вызывают поворот против часовой стрелки).

Пример: 30

Типы данных: double

Ориентация меток строк, заданная как числовой скаляр. Задайте значение поворота в градусах (положительные углы вызывают поворот против часовой стрелки).

Пример: 30

Типы данных: double

Флажок для отображения значений данных в тепловой карте, указанный как true или false.

Пример: true

Типы данных: logical

Отображение точности значений данных в тепловой карте, указанных как числовой скаляр. Количество цифр точности по умолчанию: 2.

Пример: 3

Типы данных: double

Флажок для отображения цветных маркеров вместо цветного текста для меток строк и столбцов, указанный как true или false.

Пример: true

Типы данных: logical

Цвет текста отображаемых значений данных в тепловой карте, указанный как символьный вектор, строка или трехэлементный числовой вектор. Например, для использования голубого можно ввести [0 1 1], 'c', "c", "cyan", или 'cyan'. Дополнительные сведения см. в разделе Параметры цвета.

Пример: 'red'

Типы данных: char | string | double

Отображение диапазона стандартизированных значений, заданного как положительный скаляр.

Значение по умолчанию 3означает, что существует изменение цвета для значений между -3 и 3, но значения больше, чем 3 имеют тот же цвет, что и 3, и значения меньше, чем -3 имеют тот же цвет, что и -3.

Например, при указании redgreencmap для 'Colormap' свойство, чистый красный цвет представляет значения, превышающие или равные указанному значению диапазона отображения, а чистый зеленый цвет представляет значения, меньшие или равные отрицательному значению указанного диапазона отображения.

Пример: 3

Типы данных: double

Предупреждение

Это свойство будет удалено в следующем выпуске. Набор LabelsWithMarkers кому true для цветных маркеров вместо цветных текстов.

Информация о цвете меток столбцов, заданная как структура или массив структуры.

Для одной структуры необходимо указать следующие поля.

  • Labels - Массив ячеек символьных векторов, определяющих метки столбцов, перечисленных в ColumnLabels собственность.

  • Colors - символьный вектор или строка, задающая цвет для меток столбцов. Если это поле пустое, используется цвет по умолчанию (черный).

Для массива структуры необходимо указать один элемент в каждом поле для каждой структуры.

  • Labels - символьный вектор или строка, указывающая метку столбца, указанную в ColumnLabels собственность.

  • Colors - символьный вектор или строка, задающая цвет для меток столбцов. Если это поле пустое, используется цвет по умолчанию (черный).

Дополнительные сведения об указании цветов см. в разделе Параметры цвета.

Типы данных: struct

Предупреждение

Это свойство будет удалено в следующем выпуске. Набор LabelsWithMarkers кому true для цветных маркеров вместо цветных текстов.

Информация о цвете меток строк, заданная как структура или массив структуры.

Для одной структуры необходимо указать следующие поля.

  • Labels - Массив ячеек символьных векторов, задающих метки строк, перечисленные в RowLabels собственность.

  • Colors - символьный вектор или строка, задающая цвет для меток строк. Если это поле пустое, используется цвет по умолчанию (черный).

Для массива структуры необходимо указать один элемент в каждом поле для каждой структуры.

  • Labels - символьный вектор или строка, указывающая метку строки, указанную в RowLabels собственность.

  • Colors - символьный вектор или строка, задающая цвет для меток строк. Если это поле пустое, используется цвет по умолчанию (черный).

Дополнительные сведения об указании цветов см. в разделе Параметры цвета.

Измерение для кластеризации данных, указанное как положительное целое число, символьный вектор или строка. Возможны следующие варианты:

  • 'column' или 1 - кластер только по столбцам данных, что приводит к кластеризованным строкам.

  • 'row' или 2 - кластер только по строкам данных, что приводит к кластеризованным столбцам.

  • 'all' или 3 - Кластер по столбцам данных, затем кластер по строкам кластерных данных.

Пример: 2

Типы данных: double | char | string

Информация для аннотирования групп столбцов, заданная как структура или массив структуры.

Если указана одна структура, каждое поле должно содержать массив ячеек элементов. При указании массива структуры каждая структура должна иметь один элемент в каждом поле.

Поля:

  • GroupNumber - скаляр, указывающий номер группы столбцов для аннотации.

  • Annotation - символьный вектор, указывающий текст для аннотирования группы столбцов.

  • Color - символьный вектор или трехэлементный вектор значений RGB, указывающий цвет для маркировки группы столбцов. Дополнительные сведения об указании цветов см. в разделе Параметры цвета. Если это поле пустое, значением по умолчанию является 'blue'.

Типы данных: struct

Метрика расстояния для передачи в pdist для вычисления попарных расстояний между столбцами, определяемых как символьный вектор или массив ячеек. Укажите массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковского с показателем степени p, укажите {'minkowski',p}.

Пример: 'jaccard'

Типы данных: char | cell

Информация о пороговом значении цвета для передачи в dendrogram функция для создания дендрограммного графика, заданного как скалярный, двухэлементный числовой вектор, символьный вектор или клеточный массив символьных векторов. Этот параметр задает 'ColorThreshold' свойство дендрограммного графика. Если указан двухэлементный числовой вектор или массив ячеек, первый элемент предназначен для строк, а второй элемент - для столбцов.

Типы данных: double | cell

Отношение пространства, которое занимают дендрограммы строки и столбца относительно тепловой карты, указанное как скаляр между 0 и 1 или двухэлементный вектор. Если указать скаляр, функция использует его как отношение для дендрограмм строк и столбцов. Если задан двухэлементный вектор, функция использует первый элемент для отношения ширины дендрограммы строки к ширине тепловой карты, а второй элемент для отношения высоты дендрограммы столбца к высоте тепловой карты. Второй элемент игнорируется для одномерных кластерграмм.

Пример: 0.5

Типы данных: double

Метод связывания, переданный linkage создание иерархического дерева кластера для строк и столбцов, заданного как символьный вектор или двухэлементный массив ячеек символьных векторов. При указании массива ячеек функция использует первый элемент для связи между строками и второй элемент для связи между столбцами.

Пример: 'centroid'

Типы данных: char | cell

Флаг для log2 преобразования данных из естественного масштаба, указанного как true или false.

Пример: true

Типы данных: logical

Флаг для вычисления оптимального порядка листьев, который максимизирует сходство между соседними листьями, указанный как true или false. Значение по умолчанию зависит от размера входа data. Если количество строк или столбцов в data превышает 1500, значение по умолчанию: false. В противном случае значением по умолчанию является true.

Отключение расчета оптимального порядка листьев может быть полезно при работе с большими наборами данных, поскольку этот расчет потребляет много памяти и времени.

Пример: true

Типы данных: logical

Информация для аннотирования групп строк, заданная как структура или массив структуры.

Если указана одна структура, каждое поле должно содержать массив ячеек элементов. При указании массива структуры каждая структура должна иметь один элемент в каждом поле.

Поля:

  • GroupNumber - скаляр, указывающий номер группы столбцов для аннотации.

  • Annotation - символьный вектор, указывающий текст для аннотирования группы столбцов.

  • Color - символьный вектор или трехэлементный вектор значений RGB, указывающий цвет для маркировки группы столбцов. Дополнительные сведения об указании цветов см. в разделе Параметры цвета. Если это поле пустое, значением по умолчанию является 'blue'.

Типы данных: struct

Метрика расстояния для передачи в pdist для вычисления попарных расстояний между строками, заданных как символьный вектор или массив ячеек. Укажите массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковского с показателем степени p, укажите {'minkowski',p}.

Пример: 'jaccard'

Типы данных: char | cell

Флаг для отображения диаграмм дерева дендрограммы с кластерграммой, указанной как 'on' или 'off'.

Пример: 'off'

Типы данных: char

Функции объекта

viewОтображение тепловой карты или кластерграммы
plotТонировать тепловую карту или кластерграмму
addTitleДобавить заголовок в тепловую карту или кластерграмму
addXLabelМетка оси X тепловой карты или кластерграммы
addYLabelМетка оси Y тепловой карты или кластерграммы
clusterGroupВыбор группы кластеров

Примеры

свернуть все

Загрузить данные микрочипов, содержащие уровни экспрессии генов Saccharomyces cerevisiae (дрожжей) во время метаболического перехода от ферментации к дыханию [1].

load filteredyeastdata

Этот файл MAT включает три переменные, которые добавляются в рабочую область MATLAB ®:

- yeastvalues - Матрица данных экспрессии генов Saccharomyces, -_cerevisiae_ во время метаболического сдвига от ферментации к дыханию - genes - Массив ячеек регистрационных номеров GenBank ® для маркировки строк вyeastvalues - times - вектор значений времени для маркировки столбцов в yeastvalues

Создайте объект clustergram для отображения тепловой карты из данных экспрессии генов в первых 30 строках yeastvalues создать матрицу и стандартизировать вдоль строк данных.

cgo = clustergram(yeastvalues(1:30,:),'Standardize','Row')
Clustergram object with 30 rows of nodes and 7 columns of nodes.

Используйте set метод и genes и times векторы для добавления значимых меток строк и столбцов в кластерграмму.

set(cgo,'RowLabels',genes(1:30),'ColumnLabels',times)

Добавьте цветовую панель в кластер, щелкнув значок Insert Colorbar на панели инструментов.

Просмотрите подсказку данных, содержащую значение интенсивности, метку строки и метку столбца для определенной области карты теплопередачи, щелкнув значок Data Cursor на панели инструментов, затем щелкните область на тепловой карте. Чтобы удалить эту подсказку, щелкните ее правой кнопкой мыши и выберите Delete Current Datatip.

Отобразите значения интенсивности для каждой области карты теплопередачи, нажав кнопку Аннотации (Annotate) на панели инструментов. Снова нажмите кнопку Аннотации (Annotate), чтобы удалить значения интенсивности.

Tip: If the amount of data is large enough, the cells within the clustergram
are too small to display the intensity annotations. Zoom in to see the
intensity annotations.

Удалите диаграммы дерева дендрограмм из рисунка, нажав кнопку Show Dendrogram на панели инструментов. Щелкните его еще раз, чтобы отобразить дендрограммы.

Используйте get метод отображения свойств объекта clustergram, cgo.

get(cgo)
               Cluster: 'ALL'
              RowPDist: {'Euclidean'}
           ColumnPDist: {'Euclidean'}
               Linkage: {'Average'}
            Dendrogram: {}
      OptimalLeafOrder: 1
              LogTrans: 0
          DisplayRatio: [0.2000 0.2000]
        RowGroupMarker: []
     ColumnGroupMarker: []
        ShowDendrogram: 'on'
           Standardize: 'ROW'
             Symmetric: 1
          DisplayRange: 3
              Colormap: [11x3 double]
             ImputeFun: []
          ColumnLabels: {1x7 cell}
             RowLabels: {30x1 cell}
    ColumnLabelsRotate: 90
       RowLabelsRotate: 0
              Annotate: 'off'
        AnnotPrecision: 2
            AnnotColor: 'w'
     ColumnLabelsColor: []
        RowLabelsColor: []
     LabelsWithMarkers: 0

Измените параметры кластеризации, изменив метод связывания и цвет групп узлов в дендрограмме, связь которых меньше порога 3.

set(cgo,'Linkage','complete','Dendrogram',3)

Поместите курсор на узел ветви в дендрограмме, чтобы выделить (синим цветом) группу, связанную с ней. Нажмите и удерживайте кнопку мыши для отображения подсказки с указанием номера группы и узлов (генов или образцов) в группе.

Щелкните правой кнопкой мыши узел ветви в дендрограмме, чтобы отобразить меню опций.

Доступны следующие опции:

- Set Group Color - изменение цвета группы кластера. - Print Group to Figure - печать группы в окне рисунка. - Копировать группу в новую кластерграмму - копировать группу в новое окно кластерграммы. - Экспортировать группу в рабочую область - создание объекта кластерграммы группы в рабочей области MATLAB. - Экспортировать информацию о группе в рабочую область - создание структуры, содержащей информацию о группе в рабочей области MATLAB. Структура содержит следующие поля:

- GroupNames - массив ячеек символьных векторов, содержащих имена групп строк или столбцов. - RowNodeNames - массив ячеек символьных векторов, содержащих имена узлов строк. - ColumnNodeNames - массив ячеек символьных векторов, содержащих имена узлов столбцов. - ExprValues - матрица M-на-N значений интенсивности, где M и N - количество узлов строк и узлов столбцов соответственно. Если матрица содержит данные экспрессии генов, обычно каждая строка соответствует гену, а каждая колонка соответствует образцу.

Создайте объект кластерграммы для группы 18 в рабочей области MATLAB. Щелкните правой кнопкой мыши группу 18 и выберите Экспортировать группу в рабочую область. В диалоговом окне «Экспорт в рабочую область» введите Group18и нажмите кнопку «ОК».

Используйте view метод просмотра объекта clustergram, Group18.

view(Group18)

Просмотрите все данные экспрессии генов с помощью расходящейся красной и синей карты цветов и стандартизируйте вдоль рядов данных.

cgo_all = clustergram(yeastvalues,'Colormap',redbluecmap,'Standardize','Row')
Clustergram object with 614 rows of nodes and 7 columns of nodes.

Создайте массивы структуры, чтобы задать цвета маркеров и аннотации для двух групп строк (510 и 593) и двух групп столбцов (4 и 5).

rm = struct('GroupNumber',{510,593},'Annotation',{'A','B'},...
     'Color',{'b','m'});
cm = struct('GroupNumber',{4,5},'Annotation',{'Time1','Time2'},...
     'Color',{[1 1 0],[0.6 0.6 1]});

Используйте RowGroupMarker и ColumnGroupMarker свойства для добавления цветовых маркеров и аннотаций к кластерграмме.

set(cgo_all,'RowGroupMarker',rm,'ColumnGroupMarker',cm)

Подробнее

развернуть все

Ссылки

[1] DeRisi, J. L. «Исследование метаболического и генетического контроля экспрессии генов в геномном масштабе». Наука 278, № 5338 (24 октября 1997): 680-86.

См. также

| |

Представлен до R2006a