clustergram

Объект, содержащий иерархические аналитические данные о кластеризации

Описание

Функция clustergram создает объект clustergram. Объект содержит иерархические аналитические данные о кластеризации, которые можно просмотреть в тепловой карте и древовидной схеме.

Создание

Синтаксис

clustergram(data)
clustergram(data,Name,Value)

Описание

пример

cgObj = clustergram(data) выполняет иерархический анализ кластеризации значений в data. Возвращенный clustergram объект cgObj содержит аналитические данные и отображает древовидную схему и тепловую карту.

пример

cgObj = clustergram(data,Name,Value) устанавливает свойства объектов с помощью пар "имя-значение". Например, clustergram(data,'Standardize','column') стандартизирует значения вдоль столбцов данных. Можно задать несколько пар "имя-значение". Заключите каждое имя свойства в кавычки.

Входные параметры

развернуть все

Исходные данные, заданные как объект DataMatrix или числовая матрица. Как правило, если матрица содержит данные об экспрессии гена, каждая строка соответствует гену, и каждый столбец соответствует выборке.

Аргументы в виде пар имя-значение

Используйте разделенные от запятой аргументы пары "имя-значение", чтобы установить свойства объектов. Заключите каждое имя свойства в одинарные кавычки.

Пример: cg = clustergram(data,'Colormap',redbluecmap,'Annotate',true)

Свойства

развернуть все

Размерность для стандартизации значений данных, заданных как вектор символов, строка или положительное целое число. Выбор:

  • 'column' или 1 — Стандартизируйте вдоль столбцов данных.

  • 'row' или 2 — Стандартизируйте вдоль строк данных.

  • 'none' или 3 — Не стандартизировать.

Если вы задаете 'column' или 'row', функция преобразовывает стандартизированные значения так, чтобы среднее значение было 0, и стандартное отклонение 1 в заданном измерении.

Пример: 'column'

Типы данных: double | char | string

Отметьте, чтобы сделать цветовую шкалу тепловой карты симметричной вокруг нуля, заданного как true или false.

Пример: false

Типы данных: логический

Имя функции или указателя на функцию, чтобы приписать недостающие данные, заданные как вектор символов или массив ячеек. Если вы задаете массив ячеек, первый элемент должен быть именем функции или указателя на функцию, и остающиеся элементы должны быть парами "имя-значение", используемыми в качестве входных параметров к функции. Недостающие точки данных окрашены в серый в тепловой карте.

Пример: 'func1'

Типы данных: char

цвета тепловой карты, заданные как с тремя столбцами (M-by-3) матрица значений "красного зеленого синего" (RGB) или имя указателя на функцию, который возвращает палитру, такую как redgreencmap или redbluecmap.

Палитрой по умолчанию является redgreencmap, в котором красный представляет значения выше среднего значения, черный представляет среднее значение, и зеленый представляет значения ниже среднего значения строки (ген) через все столбцы (выборки).

Пример: redbluecmap

Типы данных: double | char

Метки столбца, заданные как вектор строки, массив ячеек из символьных векторов или числовой вектор. Размер вектора должен совпадать с количеством столбцов во входе data.

Пример: ["sample1","sample2","sample3"]

Типы данных: double | string | cell

Метки строки, заданные как вектор строки, массив ячеек из символьных векторов или числовой вектор. Размер вектора должен совпадать с количеством строк во входе data.

Пример: ["gene1","gene2","gene3"]

Типы данных: double | string | cell

Ориентация меток столбца, заданных в виде числа. Задайте значение вращения в градусах (положительные углы вызывают против часовой стрелки вращение).

Пример: 30

Типы данных: double

Ориентация меток строки, заданных в виде числа. Задайте значение вращения в градусах (положительные углы вызывают против часовой стрелки вращение).

Пример: 30

Типы данных: double

Отметьте, чтобы отобразить значения данных в тепловой карте, заданной как true или false.

Пример: true

Типы данных: логический

Точность отображения значений данных в тепловой карте, заданной в виде числа. Количеством по умолчанию цифр точности является 2.

Пример 3

Типы данных: double

Отметьте, чтобы отобразиться окрашенный маркерами вместо цветного текста для меток строки и столбца, заданных как true или false.

Пример: true

Типы данных: логический

Цвет текста отображенных значений данных в тепловой карте, заданной как вектор символов, строка или трехэлементный числовой вектор. Например, чтобы использовать голубой, можно ввести [0 1 1], 'c', "c", "cyan" или 'cyan'. Для получения дополнительной информации смотрите Параметры цвета.

Пример: 'red'

Типы данных: char | string | double

Отобразитесь область значений стандартизируют значения, заданные как положительная скалярная величина.

Значение по умолчанию 3 означает, что существует цветное изменение для значений между -3 и 3, но значения, больше, чем 3, являются тем же цветом как 3 и значения меньше, чем -3, является тем же цветом как -3.

Например, если вы задаете redgreencmap для свойства 'Colormap', чистый красный представляет значения, больше, чем или равный заданному значению области значений отображения, и чистый зеленый представляет значения, меньше чем или равные отрицанию заданного значения области значений отображения.

Пример 3

Типы данных: double

Предупреждение

Это свойство будет удалено в будущем релизе. Установите LabelsWithMarkers на true для цветных маркеров вместо цветных текстов.

Информация о цвете для меток столбца, заданных как структура или массив структур.

Для одной структуры необходимо задать следующие поля.

  • Labels — Массив ячеек из символьных векторов, задающий метки столбца, перечислен в свойстве ColumnLabels.

  • Colors — Вектор символов или строка, задающая цвет для меток столбца. Если это поле пусто, (черный) цвет по умолчанию используется.

Для массива структур необходимо указать один элемент в каждом поле для каждой структуры.

  • Labels — Вектор символов или строка, задающая метку столбца, перечислены в свойстве ColumnLabels.

  • Colors — Вектор символов или строка, задающая цвет для меток столбца. Если это поле пусто, (черный) цвет по умолчанию используется.

Для получения дополнительной информации об определении цветов смотрите Параметры цвета.

Типы данных: struct

Предупреждение

Это свойство будет удалено в будущем релизе. Установите LabelsWithMarkers на true для цветных маркеров вместо цветных текстов.

Информация о цвете для меток строки, заданных как структура или массив структур.

Для одной структуры необходимо задать следующие поля.

  • Labels — Массив ячеек из символьных векторов, задающий метки строки, перечислен в свойстве RowLabels.

  • Colors — Вектор символов или строка, задающая цвет для меток строки. Если это поле пусто, (черный) цвет по умолчанию используется.

Для массива структур необходимо указать один элемент в каждом поле для каждой структуры.

  • Labels — Вектор символов или строка, задающая метку строки, перечислены в свойстве RowLabels.

  • Colors — Вектор символов или строка, задающая цвет для меток строки. Если это поле пусто, (черный) цвет по умолчанию используется.

Для получения дополнительной информации об определении цветов смотрите Параметры цвета.

Размерность для кластеризации данных, заданной как положительное целое число, вектор символов или строка. Выбор:

  • 'column' или 1 — Кластер вдоль столбцов данных только, которые приводят к кластеризованным строкам.

  • 'row' или 2 — Кластер вдоль строк данных только, которые приводят к сгруппированным столбцам.

  • 'all' или 3 — Кластер вдоль столбцов данных, затем кластер вдоль строк кластеризируемых строкой данных.

Пример 2

Типы данных: double | char | string

Информация для аннотирования групп столбцов, заданных как структура или массив структур.

Если вы задаете одну структуру, каждое поле должно содержать массив ячеек элементов. Если вы задаете массив структур, каждая структура должна иметь один элемент в каждом поле.

Поля:

  • GroupNumber — Скаляр, задающий номер группы столбцов, чтобы аннотировать.

  • Аннотация Текст определения вектора символов, чтобы аннотировать группу столбцов.

  • Color — Вектор символов или трехэлементный вектор значений RGB, задающих цвет, чтобы маркировать группу столбцов. Для получения дополнительной информации об определении цветов смотрите Параметры цвета. Если это поле пусто, значением по умолчанию является 'blue'.

Типы данных: struct

Метрика расстояния, чтобы передать pdist функционирует, чтобы вычислить попарные расстояния между столбцами, заданными как вектор символов или массив ячеек. Задайте массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковскего с экспонентой p, задайте {'minkowski',p}.

Пример: 'jaccard'

Типы данных: char | cell

Информация о цветовом пороге, чтобы передать dendrogram функционирует, чтобы создать график древовидной схемы, заданный как скаляр, двухэлементный числовой вектор, вектор символов или массив ячеек из символьных векторов. Эта опция устанавливает свойство 'ColorThreshold' графика древовидной схемы. Если вы задаете двухэлементный числовой векторный массив или массив ячеек, первый элемент для строк, и второй элемент для столбцов.

Типы данных: double | cell

Отношение места, которое древовидные схемы строки и столбца занимают относительно тепловой карты, заданной как скаляр между 0 и 1 или двухэлементным вектором. Если вы задаете скаляр, функция использует его в качестве отношения для обеих древовидных схем строки и столбца. Если вы задаете двухэлементный вектор, функция использует первый элемент для отношения ширины древовидной схемы строки к ширине тепловой карты и второй элемент для отношения высоты древовидной схемы столбца к высоте тепловой карты. Второй элемент проигнорирован для одномерного clustergrams.

Пример: 0.5

Типы данных: double

Метод связи передал функции linkage, чтобы создать иерархическое кластерное дерево для строк и столбцов, заданных как вектор символов или двухэлементный массив ячеек из символьных векторов. Если вы задаете массив ячеек, функция использует первый элемент для связи между строками и второй элемент для связи между столбцами.

Пример: 'centroid'

Типы данных: char | cell

Флаг к log2 преобразовывает данные из натурального звукоряда, заданного как true или false.

Пример: true

Типы данных: логический

Отметьте, чтобы вычислить оптимальный листовой порядок, который максимизирует подобие между соседними листами, заданными как true или false. Значение по умолчанию зависит от размера входа data. Если количество строк или столбцов в data превышает 1500, значением по умолчанию является false. В противном случае значением по умолчанию является true.

Отключение оптимального листового вычисления упорядоченного расположения может быть полезным при работе с большими наборами данных, потому что это вычисление использует большую память и время.

Пример: true

Типы данных: логический

Информация для аннотирования групп строк, заданных как структура или массив структур.

Если вы задаете одну структуру, каждое поле должно содержать массив ячеек элементов. Если вы задаете массив структур, каждая структура должна иметь один элемент в каждом поле.

Поля

  • GroupNumber — Скаляр, задающий номер группы столбцов, чтобы аннотировать.

  • Аннотация Текст определения вектора символов, чтобы аннотировать группу столбцов.

  • Color — Вектор символов или трехэлементный вектор значений RGB, задающих цвет, чтобы маркировать группу столбцов. Для получения дополнительной информации об определении цветов смотрите Параметры цвета. Если это поле пусто, значением по умолчанию является 'blue'.

Типы данных: struct

Метрика расстояния, чтобы передать pdist функционирует, чтобы вычислить попарные расстояния между строками, заданными как вектор символов или массив ячеек. Задайте массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковскего с экспонентой p, задайте {'minkowski',p}.

Пример: 'jaccard'

Типы данных: char | cell

Отметьте, чтобы показать древовидные схемы древовидной схемы с clustergram, заданным как 'on' или 'off'.

Пример: 'off'

Типы данных: char

Функции объекта

viewОтобразите тепловую карту или clustergram
plotПредставьте тепловую карту или clustergram
addTitleДобавьте заголовок на тепловую карту или clustergram
addXLabelМаркируйте ось X тепловой карты или clustergram
addYLabelМаркируйте ось Y тепловой карты или clustergram
clusterGroupВыберите кластерную группу

Примеры

свернуть все

Загрузите микроданные массива, содержащие уровни экспрессии гена Saccharomyces cerevisiae (дрожжи) во время метаболического сдвига от ферментации до дыхания (Derisi, J. и др., 1997).

load filteredyeastdata

Этот MAT-файл включает три переменные, которые добавляются к рабочей области MATLAB®:

  • yeastvalues - Матрица данных об экспрессии гена из Saccharomyces cerevisiae во время метаболического сдвига от ферментации до дыхания

  • гены - массив ячеек инвентарных номеров GenBank® для маркировки строк в yeastvalues

  • времена - вектор временных стоимостей для маркировки столбцов в yeastvalues

Создайте clustergram, возражают и отображают карту тепла от данных об экспрессии гена в первых 30 строках матрицы yeastvalues и стандартизируют вдоль строк данных.

cgo = clustergram(yeastvalues(1:30,:),'Standardize','Row')
Clustergram object with 30 rows of nodes and 7 columns of nodes.

Используйте метод set и genes и векторы times, чтобы добавить значимые метки строки и столбца в clustergram.

set(cgo,'RowLabels',genes(1:30),'ColumnLabels',times)

Добавьте цветную полосу в clustergram путем нажатия кнопки Insert Colorbar на панели инструментов.

Просмотрите всплывающую подсказку, содержащую значение интенсивности, метку строки и метку столбца для определенной области карты тепла путем нажатия кнопки Data Cursor на панели инструментов, затем нажатия на область в карте тепла. Чтобы удалить эту всплывающую подсказку, щелкните правой кнопкой по нему, затем выберите Delete Current Datatip.

Отобразите значения интенсивности для каждой области карты тепла путем нажатия кнопки Annotate на панели инструментов. Нажмите кнопку Annotate снова, чтобы удалить значения интенсивности.

Tip: If the amount of data is large enough, the cells within the clustergram
are too small to display the intensity annotations. Zoom in to see the
intensity annotations.

Удалите древовидные схемы древовидной схемы от фигуры путем нажатия кнопки Show Dendrogram на панели инструментов. Кликните по нему снова, чтобы отобразить древовидные схемы.

Используйте метод get, чтобы отобразить свойства объекта clustergram, cgo.

get(cgo)
               Cluster: 'ALL'
              RowPDist: {'Euclidean'}
           ColumnPDist: {'Euclidean'}
               Linkage: {'Average'}
            Dendrogram: {}
      OptimalLeafOrder: 1
              LogTrans: 0
          DisplayRatio: [0.2000 0.2000]
        RowGroupMarker: []
     ColumnGroupMarker: []
        ShowDendrogram: 'on'
           Standardize: 'ROW'
             Symmetric: 1
          DisplayRange: 3
              Colormap: [11x3 double]
             ImputeFun: []
          ColumnLabels: {1x7 cell}
             RowLabels: {30x1 cell}
    ColumnLabelsRotate: 90
       RowLabelsRotate: 0
              Annotate: 'off'
        AnnotPrecision: 2
            AnnotColor: 'w'
     ColumnLabelsColor: []
        RowLabelsColor: []
     LabelsWithMarkers: 0

Измените кластеризирующиеся параметры путем изменения метода связи и изменения цвета групп узлов в древовидной схеме, связь которой является меньше, чем порог 3.

set(cgo,'Linkage','complete','Dendrogram',3)

Установите курсор на узел ответвления в древовидной схеме, чтобы подсветить (в синем) группу, сопоставленную с ним. Нажмите и удержите кнопку мыши, чтобы отобразить всплывающую подсказку, перечисляющую номер группы и узлы (гены или выборки) в группе.

Щелкните правой кнопкой по узлу ответвления по древовидной схеме, чтобы отобразить меню опций.

Следующие опции доступны:

  • Цвет Set Group - Изменение кластерный цвет группы.

  • Print Group, чтобы фигурировать - Print группа к Окну рисунка.

  • Copy Group к Новому Clustergram - Copy группа к новому окну Clustergram.

  • Export Group к Рабочей области - Создает clustergram объект группы в рабочем пространстве MATLAB.

  • Информация о Export Group к Рабочей области - Создает структуру, содержащую информацию о группе в рабочем пространстве MATLAB. Структура содержит эти поля:

  1. GroupNames - Массив ячеек из символьных векторов, содержащий имена строки или групп столбцов.

  2. RowNodeNames - Массив ячеек из символьных векторов, содержащий имена узлов строки.

  3. ColumnNodeNames - Массив ячеек векторов текстового символа, содержащих имена узлов столбца.

  4. ExprValues - Матрица M на n значений интенсивности, где M и N являются количеством узлов строки и узлов столбца соответственно. Если матрица содержит данные об экспрессии гена, обычно каждая строка соответствует гену, и каждый столбец соответствует выборке.

Создайте объект clustergram в рабочем пространстве MATLAB Группы 18 путем щелчка правой кнопкой по нему, затем выбора Export Group to Workspace. В диалоговом окне Export to Workspace, типе Group18, затем нажимают ОК.

Используйте метод view, чтобы просмотреть объект clustergram, Group18.

view(Group18)

Просмотрите все данные об экспрессии гена с помощью отличающейся красно-синей палитры и стандартизируйте вдоль строк данных.

cgo_all = clustergram(yeastvalues,'Colormap',redbluecmap,'Standardize','Row')
Clustergram object with 614 rows of nodes and 7 columns of nodes.

Создайте массивы структур, чтобы задать цвета маркера и аннотации для двух групп строк (510 и 593) и двух групп столбцов (4 и 5).

rm = struct('GroupNumber',{510,593},'Annotation',{'A','B'},...
     'Color',{'b','m'});
cm = struct('GroupNumber',{4,5},'Annotation',{'Time1','Time2'},...
     'Color',{[1 1 0],[0.6 0.6 1]});

Используйте свойства 'RowGroupMarker' и 'ColumnGroupMarker' добавить цветовые маркеры и аннотации к clustergram.

set(cgo_all,'RowGroupMarker',rm,'ColumnGroupMarker',cm)

Больше о

развернуть все

Смотрите также

| |

Представлено до R2006a