clustergram

Объект, содержащий иерархические аналитические данные о кластеризации

Описание

clustergram функция создает clustergram объект. Объект содержит иерархические аналитические данные о кластеризации, которые можно просмотреть в тепловой карте и древовидной схеме.

Создание

Описание

пример

cgObj = clustergram(data) выполняет иерархический анализ кластеризации значений в data. Возвращенный объект cgObj кластерграммы содержит аналитические данные и отображает древовидную схему и тепловую карту.

пример

cgObj = clustergram(data,Name,Value) устанавливает свойства объектов с помощью пар "имя-значение". Например, clustergram(data,'Standardize','column') стандартизирует значения вдоль столбцов данных. Можно задать несколько пар "имя-значение". Заключите каждое имя свойства в кавычки.

Входные параметры

развернуть все

Исходные данные, заданные как объект DataMatrix или числовая матрица. Как правило, если матрица содержит данные об экспрессии гена, каждая строка соответствует гену, и каждый столбец соответствует выборке.

Аргументы в виде пар имя-значение

Используйте разделенные от запятой аргументы пары "имя-значение", чтобы установить свойства объектов. Заключите каждое имя свойства в одинарные кавычки.

Пример: cg = clustergram(data,'Colormap',redbluecmap,'Annotate',true)

Свойства

развернуть все

Размерность для стандартизации значений данных, заданных как вектор символов, строка или положительное целое число. Выбор:

  • 'column' или 1 — Стандартизируйте вдоль столбцов данных.

  • 'row' или 2 — Стандартизируйте вдоль строк данных.

  • 'none' или 3 — Не стандартизировать.

Если вы задаете 'column' или 'row', функция преобразовывает стандартизированные значения так, чтобы среднее значение было 0, и стандартное отклонение 1 в заданном измерении.

Пример: 'column'

Типы данных: double | char | string

Отметьте, чтобы сделать цветовую шкалу тепловой карты симметричной вокруг нуля, заданного как true или false.

Пример: false

Типы данных: логический

Имя функции или указателя на функцию, чтобы приписать недостающие данные, заданные как вектор символов или массив ячеек. Если вы задаете массив ячеек, первый элемент должен быть именем функции или указателя на функцию, и остающиеся элементы должны быть парами "имя-значение", используемыми в качестве входных параметров к функции. Недостающие точки данных окрашены в серый в тепловой карте.

Пример: 'func1'

Типы данных: char

цвета тепловой карты, заданные как с тремя столбцами (M-by-3) матрица значений "красного зеленого синего" (RGB) или имя указателя на функцию, который возвращает палитру, такую как redgreencmap или redbluecmap.

Палитрой по умолчанию является redgreencmap, в котором красный представляет значения выше среднего значения, черный представляет среднее значение, и зеленый представляет значения ниже среднего значения строки (ген) через все столбцы (выборки).

Пример: redbluecmap

Типы данных: double | char

Метки столбца, заданные как вектор строки, массив ячеек из символьных векторов или числовой вектор. Размер вектора должен совпадать с количеством столбцов во входе data.

Пример: ["sample1","sample2","sample3"]

Типы данных: double | string | cell

Метки строки, заданные как вектор строки, массив ячеек из символьных векторов или числовой вектор. Размер вектора должен совпадать с количеством строк во входе data.

Пример: ["gene1","gene2","gene3"]

Типы данных: double | string | cell

Ориентация меток столбца, заданных в виде числа. Задайте значение вращения в градусах (положительные углы вызывают против часовой стрелки вращение).

Пример: 30

Типы данных: double

Ориентация меток строки, заданных в виде числа. Задайте значение вращения в градусах (положительные углы вызывают против часовой стрелки вращение).

Пример: 30

Типы данных: double

Отметьте, чтобы отобразить значения данных в тепловой карте, заданной как true или false.

Пример: true

Типы данных: логический

Точность отображения значений данных в тепловой карте, заданной в виде числа. Количеством по умолчанию цифр точности является 2.

Пример 3

Типы данных: double

Отметьте, чтобы отобразиться окрашенный маркерами вместо цветного текста для меток строки и столбца, заданных как true или false.

Пример: true

Типы данных: логический

Цвет текста отображенных значений данных в тепловой карте, заданной как вектор символов, строка или трехэлементный числовой вектор. Например, чтобы использовать голубой, можно ввести [0 1 1]CCГолубой, или 'cyan'. Для получения дополнительной информации смотрите Параметры цвета.

Пример: 'red'

Типы данных: char | string | double

Отобразитесь область значений стандартизируют значения, заданные как положительная скалярная величина.

Значение по умолчанию 3средние значения, что существует цветное изменение для значений между -3 и 3, но значения, больше, чем 3 тот же цвет как 3, и значения меньше, чем -3 тот же цвет как -3.

Например, если вы задаете redgreencmap для 'Colormap' свойство, чистый красный представляет значения, больше, чем или равный заданному значению области значений отображения, и чистый зеленый представляет значения, меньше чем или равные отрицанию заданного значения области значений отображения.

Пример 3

Типы данных: double

Предупреждение

Это свойство будет удалено в будущем релизе. Установите LabelsWithMarkers к true для цветных маркеров вместо цветных текстов.

Информация о цвете для меток столбца, заданных как структура или массив структур.

Для одной структуры необходимо задать следующие поля.

  • Labels — Массив ячеек из символьных векторов, задающий метки столбца, перечислен в ColumnLabels свойство.

  • Colors — Вектор символов или строка, задающая цвет для меток столбца. Если это поле пусто, (черный) цвет по умолчанию используется.

Для массива структур необходимо указать один элемент в каждом поле для каждой структуры.

  • Labels — Вектор символов или строка, задающая метку столбца, перечислены в ColumnLabels свойство.

  • Colors — Вектор символов или строка, задающая цвет для меток столбца. Если это поле пусто, (черный) цвет по умолчанию используется.

Для получения дополнительной информации об определении цветов смотрите Параметры цвета.

Типы данных: struct

Предупреждение

Это свойство будет удалено в будущем релизе. Установите LabelsWithMarkers к true для цветных маркеров вместо цветных текстов.

Информация о цвете для меток строки, заданных как структура или массив структур.

Для одной структуры необходимо задать следующие поля.

  • Labels — Массив ячеек из символьных векторов, задающий метки строки, перечислен в RowLabels свойство.

  • Colors — Вектор символов или строка, задающая цвет для меток строки. Если это поле пусто, (черный) цвет по умолчанию используется.

Для массива структур необходимо указать один элемент в каждом поле для каждой структуры.

  • Labels — Вектор символов или строка, задающая метку строки, перечислены в RowLabels свойство.

  • Colors — Вектор символов или строка, задающая цвет для меток строки. Если это поле пусто, (черный) цвет по умолчанию используется.

Для получения дополнительной информации об определении цветов смотрите Параметры цвета.

Размерность для кластеризации данных, заданной как положительное целое число, вектор символов или строка. Выбор:

  • 'column' или 1 — Кластер вдоль столбцов данных только, которые приводят к кластеризованным строкам.

  • 'row' или 2 — Кластер вдоль строк данных только, которые приводят к сгруппированным столбцам.

  • 'all' или 3 — Кластер вдоль столбцов данных, затем кластер вдоль строк кластеризируемых строкой данных.

Пример 2

Типы данных: double | char | string

Информация для аннотирования групп столбцов, заданных как структура или массив структур.

Если вы задаете одну структуру, каждое поле должно содержать массив ячеек элементов. Если вы задаете массив структур, каждая структура должна иметь один элемент в каждом поле.

Поля:

  • GroupNumber — Скаляр, задающий номер группы столбцов, чтобы аннотировать.

  • Annotation — Текст определения вектора символов, чтобы аннотировать группу столбцов.

  • Color — Вектор символов или трехэлементный вектор значений RGB, задающих цвет, чтобы пометить группу столбцов. Для получения дополнительной информации об определении цветов смотрите Параметры цвета. Если это поле пусто, значением по умолчанию является 'blue'.

Типы данных: struct

Метрика расстояния, чтобы передать pdist функция, чтобы вычислить попарные расстояния между столбцами, заданными как вектор символов или массив ячеек. Задайте массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковскего с экспонентой p, задайте {'minkowski',p}.

Пример: 'jaccard'

Типы данных: char | cell

Информация о цветовом пороге, чтобы передать dendrogram функция, чтобы создать график древовидной схемы, заданный как скаляр, двухэлементный числовой вектор, вектор символов или массив ячеек из символьных векторов. Эта опция устанавливает 'ColorThreshold' свойство графика древовидной схемы. Если вы задаете двухэлементный числовой векторный массив или массив ячеек, первый элемент для строк, и второй элемент для столбцов.

Типы данных: double | cell

Отношение места, которое древовидные схемы строки и столбца занимают относительно тепловой карты, заданной как скаляр между 0 и 1 или двухэлементный вектор. Если вы задаете скаляр, функция использует его в качестве отношения для обеих древовидных схем строки и столбца. Если вы задаете двухэлементный вектор, функция использует первый элемент в отношении ширины древовидной схемы строки к ширине тепловой карты и второй элемент для отношения высоты древовидной схемы столбца к высоте тепловой карты. Второй элемент проигнорирован для одномерных кластерграмм.

Пример: 0.5

Типы данных: double

Метод рычажного устройства передал linkage функция, чтобы создать иерархическое кластерное дерево для строк и столбцов, заданных как вектор символов или двухэлементный массив ячеек из символьных векторов. Если вы задаете массив ячеек, функция использует первый элемент в рычажном устройстве между строками и второй элемент для рычажного устройства между столбцами.

Пример: 'centroid'

Типы данных: char | cell

Флаг к log2 преобразовывает данные из натурального звукоряда, заданного как true или false.

Пример: true

Типы данных: логический

Отметьте, чтобы вычислить оптимальный листовой порядок, который максимизирует подобие между соседними листами, заданными как true или false. Значение по умолчанию зависит от размера входа data. Если количество строк или столбцов в data превышает 1500, значением по умолчанию является false. В противном случае значением по умолчанию является true.

Отключение оптимального листового вычисления упорядоченного расположения может быть полезным при работе с большими наборами данных, потому что это вычисление использует большую память и время.

Пример: true

Типы данных: логический

Информация для аннотирования групп строк, заданных как структура или массив структур.

Если вы задаете одну структуру, каждое поле должно содержать массив ячеек элементов. Если вы задаете массив структур, каждая структура должна иметь один элемент в каждом поле.

Поля

  • GroupNumber — Скаляр, задающий номер группы столбцов, чтобы аннотировать.

  • Annotation — Текст определения вектора символов, чтобы аннотировать группу столбцов.

  • Color — Вектор символов или трехэлементный вектор значений RGB, задающих цвет, чтобы пометить группу столбцов. Для получения дополнительной информации об определении цветов смотрите Параметры цвета. Если это поле пусто, значением по умолчанию является 'blue'.

Типы данных: struct

Метрика расстояния, чтобы передать pdist функция, чтобы вычислить попарные расстояния между строками, заданными как вектор символов или массив ячеек. Задайте массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковскего с экспонентой p, задайте {'minkowski',p}.

Пример: 'jaccard'

Типы данных: char | cell

Отметьте, чтобы показать древовидные схемы древовидной схемы с кластерграммой, заданной как 'on' или 'off'.

Пример: 'off'

Типы данных: char

Функции объекта

viewОтобразите тепловую карту или кластерграмму
plotПредставьте тепловую карту или кластерграмму
addTitleДобавьте заголовок на тепловую карту или кластерграмму
addXLabelПометьте ось X тепловой карты или кластерграммы
addYLabelПометьте ось Y тепловой карты или кластерграммы
clusterGroupВыберите кластерную группу

Примеры

свернуть все

Загрузите микроданные массива, содержащие уровни экспрессии гена Saccharomyces cerevisiae (дрожжи) во время метаболического сдвига от ферментации до дыхания (Derisi, J. и др., 1997).

load filteredyeastdata

Этот MAT-файл включает три переменные, которые добавляются к рабочей области MATLAB®:

  • yeastvalues - Матрица A данных об экспрессии гена из Saccharomyces cerevisiae во время метаболического сдвига от ферментации до дыхания

  • гены - массив ячеек инвентарных номеров GenBank® для маркировки строк в yeastvalues

  • времена - вектор временных стоимостей для маркировки столбцов в yeastvalues

Создайте кластерграмму, возражают и отображают карту тепла из данных об экспрессии гена в первых 30 строках yeastvalues матрица и стандартизирует вдоль строк данных.

cgo = clustergram(yeastvalues(1:30,:),'Standardize','Row')
Clustergram object with 30 rows of nodes and 7 columns of nodes.

Используйте set метод и genes и times векторы, чтобы добавить значимую строку и столбец помечают к кластерграмме.

set(cgo,'RowLabels',genes(1:30),'ColumnLabels',times)

Добавьте цветную полосу в кластерграмму путем нажатия на Insert Colorbar кнопка на панели инструментов.

Просмотрите всплывающую подсказку, содержащую значение интенсивности, метку строки и метку столбца для определенной области карты тепла путем нажатия на Data Cursor кнопка на панели инструментов, затем кликая по области в карте тепла. Чтобы удалить эту всплывающую подсказку, щелкните правой кнопкой по нему, затем выберите Delete Current Datatip.

Отобразите значения интенсивности для каждой области карты тепла путем нажатия кнопки Annotate на панели инструментов. Нажмите кнопку Annotate снова, чтобы удалить значения интенсивности.

Tip: If the amount of data is large enough, the cells within the clustergram
are too small to display the intensity annotations. Zoom in to see the
intensity annotations.

Удалите древовидные схемы древовидной схемы от фигуры путем нажатия кнопки Show Dendrogram на панели инструментов. Кликните по нему снова, чтобы отобразить древовидные схемы.

Используйте get метод, чтобы отобразить свойства объекта кластерграммы, cgo.

get(cgo)
               Cluster: 'ALL'
              RowPDist: {'Euclidean'}
           ColumnPDist: {'Euclidean'}
               Linkage: {'Average'}
            Dendrogram: {}
      OptimalLeafOrder: 1
              LogTrans: 0
          DisplayRatio: [0.2000 0.2000]
        RowGroupMarker: []
     ColumnGroupMarker: []
        ShowDendrogram: 'on'
           Standardize: 'ROW'
             Symmetric: 1
          DisplayRange: 3
              Colormap: [11x3 double]
             ImputeFun: []
          ColumnLabels: {1x7 cell}
             RowLabels: {30x1 cell}
    ColumnLabelsRotate: 90
       RowLabelsRotate: 0
              Annotate: 'off'
        AnnotPrecision: 2
            AnnotColor: 'w'
     ColumnLabelsColor: []
        RowLabelsColor: []
     LabelsWithMarkers: 0

Измените кластеризирующиеся параметры путем изменения метода рычажного устройства и изменения цвета групп узлов в древовидной схеме, рычажное устройство которой меньше порога 3.

set(cgo,'Linkage','complete','Dendrogram',3)

Установите курсор на узел ветви в древовидной схеме, чтобы подсветить (в синем) группу, сопоставленную с ним. Нажмите и удержите кнопку мыши, чтобы отобразить всплывающую подсказку, перечисляющую номер группы и узлы (гены или выборки) в группе.

Щелкните правой кнопкой по узлу ветви по древовидной схеме, чтобы отобразить меню опций.

Следующие опции доступны:

  • Цвет Set Group - Изменение кластерный цвет группы.

  • Print Group, чтобы фигурировать - Print группа к Окну рисунка.

  • Copy Group к Новой Кластерграмме - Copy группа к новому окну Clustergram.

  • Export Group к Рабочей области - Создает объект кластерграммы группы в рабочем пространстве MATLAB.

  • Информация о Export Group к Рабочей области - Создает структуру, содержащую информацию о группе в рабочем пространстве MATLAB. Структура содержит эти поля:

  1. GroupNames - Массив ячеек из символьных векторов, содержащий имена строки или групп столбцов.

  2. RowNodeNames - Массив ячеек из символьных векторов, содержащий имена узлов строки.

  3. ColumnNodeNames - Массив ячеек векторов текстового символа, содержащих имена узлов столбца.

  4. ExprValues - Матрица M на n значений интенсивности, где M и N являются количеством узлов строки и узлов столбца соответственно. Если матрица содержит данные об экспрессии гена, обычно каждая строка соответствует гену, и каждый столбец соответствует выборке.

Создайте объект кластерграммы в рабочем пространстве MATLAB Группы 18 путем щелчка правой кнопкой по нему, затем выбора Export Group to Workspace. В диалоговом окне Export to Workspace, типе Group18, затем нажимают ОК.

Используйте view метод, чтобы просмотреть объект кластерграммы, Group18.

view(Group18)

Просмотрите все данные об экспрессии гена с помощью отличающейся красно-синей палитры и стандартизируйте вдоль строк данных.

cgo_all = clustergram(yeastvalues,'Colormap',redbluecmap,'Standardize','Row')
Clustergram object with 614 rows of nodes and 7 columns of nodes.

Создайте массивы структур, чтобы задать цвета маркера и аннотации для двух групп строк (510 и 593) и двух групп столбцов (4 и 5).

rm = struct('GroupNumber',{510,593},'Annotation',{'A','B'},...
     'Color',{'b','m'});
cm = struct('GroupNumber',{4,5},'Annotation',{'Time1','Time2'},...
     'Color',{[1 1 0],[0.6 0.6 1]});

Используйте 'RowGroupMarker' и 'ColumnGroupMarker' свойства добавить цветовые маркеры и аннотации к кластерграмме.

set(cgo_all,'RowGroupMarker',rm,'ColumnGroupMarker',cm)

Больше о

развернуть все

Смотрите также

| |

Представлено до R2006a

Для просмотра документации необходимо авторизоваться на сайте