clustergram

Объект, содержащий иерархические аналитические данные о кластеризации

Описание

clustergram функция создает clustergram объект. Объект содержит иерархические аналитические данные о кластеризации, которые можно просмотреть в тепловой карте и древовидной схеме.

Создание

Описание

пример

cgObj = clustergram(data) выполняет иерархический анализ кластеризации значений в data. Возвращенный объект cgObj кластерграммы содержит аналитические данные и отображает древовидную схему и тепловую карту.

пример

cgObj = clustergram(data,Name,Value) устанавливает свойства объектов с помощью пар "имя-значение". Например, clustergram(data,'Standardize','column') стандартизирует значения вдоль столбцов данных. Можно задать несколько пар "имя-значение". Заключите каждое имя свойства в кавычки.

Входные параметры

развернуть все

Исходные данные в виде объекта DataMatrix или числовой матрицы. Как правило, если матрица содержит данные об экспрессии гена, каждая строка соответствует гену, и каждый столбец соответствует выборке.

Аргументы в виде пар имя-значение

Используйте разделенные от запятой аргументы пары "имя-значение", чтобы установить свойства объектов. Заключите каждое имя свойства в одинарные кавычки.

Пример: cg = clustergram(data,'Colormap',redbluecmap,'Annotate',true)

Свойства

развернуть все

Размерность для стандартизации значений данных в виде вектора символов, строки или положительного целого числа. Выбор:

  • 'column' или 1 — Стандартизируйте вдоль столбцов данных.

  • 'row' или 2 — Стандартизируйте вдоль строк данных.

  • 'none' или 3 — Не стандартизировать.

Если вы задаете 'column' или 'row', функция преобразовывает стандартизированные значения так, чтобы среднее значение было 0, и стандартное отклонение 1 в заданном измерении.

Пример: 'column'

Типы данных: double | char | string

Отметьте, чтобы сделать цветовую шкалу тепловой карты симметричной вокруг нуля в виде true или false.

Пример: false

Типы данных: логический

Имя функции или указателя на функцию, чтобы приписать недостающие данные в виде вектора символов или массива ячеек. Если вы задаете массив ячеек, первым элементом должно быть имя функции или указателя на функцию, и остающимися элементами должны быть пары "имя-значение", используемые в качестве входных параметров к функции. Недостающие точки данных окрашены в серый в тепловой карте.

Если точки данных отсутствуют, используйте это свойство приписать отсутствующие значения.. В противном случае, clustergram функциональные ошибки.

Пример: 'func1'

Типы данных: char

тепловая карта окрашивает в виде с тремя столбцами (M-by-3) матрицу значений "красного зеленого синего" (RGB) или имя указателя на функцию, который возвращает палитру, такой как redgreencmap или redbluecmap.

Палитрой по умолчанию является redgreencmap, в котором красный представляет значения выше среднего значения, черный представляет среднее значение, и зеленый представляет значения ниже среднего значения строки (ген) через все столбцы (выборки).

Пример: redbluecmap

Типы данных: double | char

Столбец помечает в виде вектора строки, массива ячеек из символьных векторов или числового вектора. Размер вектора должен совпадать с количеством столбцов во входе data.

Если количество меток столбца 200 или больше, метки не появляются в графике кластерграммы.

Пример: ["sample1","sample2","sample3"]

Типы данных: double | string | cell

Строка помечает в виде вектора строки, массива ячеек из символьных векторов или числового вектора. Размер вектора должен совпадать с количеством строк во входе data.

Если количество меток строки 200 или больше, метки не появляются в графике кластерграммы.

Пример: ["gene1","gene2","gene3"]

Типы данных: double | string | cell

Ориентация столбца помечает в виде числового скаляра. Задайте значение вращения в градусах (положительные углы вызывают против часовой стрелки вращение).

Пример: 30

Типы данных: double

Ориентация строки помечает в виде числового скаляра. Задайте значение вращения в градусах (положительные углы вызывают против часовой стрелки вращение).

Пример: 30

Типы данных: double

Отметьте, чтобы отобразить значения данных в тепловой карте в виде true или false.

Пример: true

Типы данных: логический

Точность отображения значений данных в тепловой карте в виде числового скаляра. Количеством по умолчанию цифр точности является 2.

Пример 3

Типы данных: double

Отметьте, чтобы отобразиться окрашенный маркерами вместо цветного текста для меток строки и столбца в виде true или false.

Пример: true

Типы данных: логический

Цвет текста отображенных значений данных в тепловой карте в виде вектора символов, строки или трехэлементного числового вектора. Например, чтобы использовать голубой, можно ввести [0 1 1]CCГолубой, или 'cyan'. Для получения дополнительной информации смотрите Параметры цвета.

Пример: 'red'

Типы данных: char | string | double

Отобразитесь область значений стандартизируют значения в виде положительной скалярной величины.

Значение по умолчанию 3средние значения, что существует цветное изменение для значений между -3 и 3, но значения, больше, чем 3 тот же цвет как 3, и значения меньше, чем -3 тот же цвет как -3.

Например, если вы задаете redgreencmap для 'Colormap' свойство, чистый красный представляет значения, больше, чем или равный заданному значению области значений отображения, и чистый зеленый представляет значения, меньше чем или равные отрицанию заданного значения области значений отображения.

Пример 3

Типы данных: double

Предупреждение

Это свойство будет удалено в будущем релизе. Установите LabelsWithMarkers к true для цветных маркеров вместо цветных текстов.

Информация о цвете для столбца помечает в виде структуры или массива структур.

Для одной структуры необходимо задать следующие поля.

  • Labels — Массив ячеек из символьных векторов, задающий метки столбца, перечислен в ColumnLabels свойство.

  • Colors — Вектор символов или строка, задающая цвет для меток столбца. Если это поле пусто, (черный) цвет по умолчанию используется.

Для массива структур необходимо указать один элемент в каждом поле для каждой структуры.

  • Labels — Вектор символов или строка, задающая метку столбца, перечислены в ColumnLabels свойство.

  • Colors — Вектор символов или строка, задающая цвет для меток столбца. Если это поле пусто, (черный) цвет по умолчанию используется.

Для получения дополнительной информации об определении цветов смотрите Параметры цвета.

Типы данных: struct

Предупреждение

Это свойство будет удалено в будущем релизе. Установите LabelsWithMarkers к true для цветных маркеров вместо цветных текстов.

Информация о цвете для строки помечает в виде структуры или массива структур.

Для одной структуры необходимо задать следующие поля.

  • Labels — Массив ячеек из символьных векторов, задающий метки строки, перечислен в RowLabels свойство.

  • Colors — Вектор символов или строка, задающая цвет для меток строки. Если это поле пусто, (черный) цвет по умолчанию используется.

Для массива структур необходимо указать один элемент в каждом поле для каждой структуры.

  • Labels — Вектор символов или строка, задающая метку строки, перечислены в RowLabels свойство.

  • Colors — Вектор символов или строка, задающая цвет для меток строки. Если это поле пусто, (черный) цвет по умолчанию используется.

Для получения дополнительной информации об определении цветов смотрите Параметры цвета.

Размерность для данных, кластеризирующихся в виде положительного целого числа, вектора символов или строки. Выбор:

  • 'column' или 1 — Кластер вдоль столбцов данных только, которые приводят к кластеризованным строкам.

  • 'row' или 2 — Кластер вдоль строк данных только, которые приводят к сгруппированным столбцам.

  • 'all' или 3 — Кластер вдоль столбцов данных, затем кластер вдоль строк кластеризируемых строкой данных.

Пример 2

Типы данных: double | char | string

Информация для аннотирования групп столбцов в виде структуры или массива структур.

Если вы задаете одну структуру, каждое поле должно содержать массив ячеек элементов. Если вы задаете массив структур, каждая структура должна иметь один элемент в каждом поле.

Поля:

  • GroupNumber — Скаляр, задающий номер группы столбцов, чтобы аннотировать.

  • Annotation — Текст определения вектора символов, чтобы аннотировать группу столбцов.

  • Color — Вектор символов или трехэлементный вектор из значений RGB, задающих цвет, чтобы пометить группу столбцов. Для получения дополнительной информации об определении цветов смотрите Параметры цвета. Если это поле пусто, значением по умолчанию является 'blue'.

Типы данных: struct

Метрика расстояния, чтобы передать pdist функция, чтобы вычислить попарные расстояния между столбцами в виде вектора символов или массива ячеек. Задайте массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковскего с экспонентой p, задайте {'minkowski',p}.

Пример: 'jaccard'

Типы данных: char | cell

Информация о цветовом пороге, чтобы передать dendrogram функция, чтобы создать график древовидной схемы в виде скаляра, двухэлементного числового вектора, вектора символов или массива ячеек из символьных векторов. Эта опция устанавливает 'ColorThreshold' свойство графика древовидной схемы. Если вы задаете двухэлементный числовой векторный массив или массив ячеек, первый элемент для строк, и второй элемент для столбцов.

Типы данных: double | cell

Отношение места, которое древовидные схемы строки и столбца занимают относительно тепловой карты в виде скаляра между 0 и 1 или двухэлементный вектор. Если вы задаете скаляр, функция использует его в качестве отношения для обеих древовидных схем строки и столбца. Если вы задаете двухэлементный вектор, функция использует первый элемент для отношения ширины древовидной схемы строки к ширине тепловой карты и второй элемент для отношения высоты древовидной схемы столбца к высоте тепловой карты. Второй элемент проигнорирован для одномерных кластерграмм.

Пример: 0.5

Типы данных: double

Метод рычажного устройства передал linkage функция, чтобы создать иерархическое кластерное дерево для строк и столбцов в виде вектора символов или двухэлементного массива ячеек из символьных векторов. Если вы задаете массив ячеек, функция использует первый элемент для рычажного устройства между строками и второй элемент для рычажного устройства между столбцами.

Пример: 'centroid'

Типы данных: char | cell

Флаг к log2 преобразовывает данные из натурального звукоряда в виде true или false.

Пример: true

Типы данных: логический

Отметьте, чтобы вычислить оптимальный листовой порядок, который максимизирует подобие между соседними листами в виде true или false. Значение по умолчанию зависит от размера входа data. Если количество строк или столбцов в data превышает 1500, значением по умолчанию является false. В противном случае значением по умолчанию является true.

Отключение оптимального листового вычисления упорядоченного расположения может быть полезным при работе с большими наборами данных, потому что это вычисление использует большую память и время.

Пример: true

Типы данных: логический

Информация для аннотирования групп строк в виде структуры или массива структур.

Если вы задаете одну структуру, каждое поле должно содержать массив ячеек элементов. Если вы задаете массив структур, каждая структура должна иметь один элемент в каждом поле.

Поля

  • GroupNumber — Скаляр, задающий номер группы столбцов, чтобы аннотировать.

  • Annotation — Текст определения вектора символов, чтобы аннотировать группу столбцов.

  • Color — Вектор символов или трехэлементный вектор из значений RGB, задающих цвет, чтобы пометить группу столбцов. Для получения дополнительной информации об определении цветов смотрите Параметры цвета. Если это поле пусто, значением по умолчанию является 'blue'.

Типы данных: struct

Метрика расстояния, чтобы передать pdist функция, чтобы вычислить попарные расстояния между строками в виде вектора символов или массива ячеек. Задайте массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковскего с экспонентой p, задайте {'minkowski',p}.

Пример: 'jaccard'

Типы данных: char | cell

Отметьте, чтобы показать древовидные схемы древовидной схемы с кластерграммой в виде 'on' или 'off'.

Пример: 'off'

Типы данных: char

Функции объекта

viewОтобразите тепловую карту или кластерграмму
plotПредставьте тепловую карту или кластерграмму
addTitleДобавьте заголовок на тепловую карту или кластерграмму
addXLabelМаркируйте x - ось тепловой карты или кластерграммы
addYLabelМаркируйте y - ось тепловой карты или кластерграммы
clusterGroupВыберите кластерную группу

Примеры

свернуть все

Загрузите микроданные массива, содержащие уровни экспрессии гена Saccharomyces cerevisiae (дрожжи) во время метаболического сдвига от ферментации до дыхания [1].

load filteredyeastdata

Этот файл MAT включает три переменные, которые добавляются к рабочей области MATLAB®:

- yeastvalues - Матрица A данных об экспрессии гена Saccharomyces - _cerevisiae_ во время метаболического сдвига от ферментации до дыхания - genes - Массив ячеек инвентарных номеров GenBank® для маркировки строк в yeastvalues \times - Вектор из временных стоимостей для маркировки столбцов в yeastvalues

Создайте объект кластерграммы отобразить карту тепла из данных об экспрессии гена в первых 30 строках yeastvalues матрица и стандартизирует вдоль строк данных.

cgo = clustergram(yeastvalues(1:30,:),'Standardize','Row')
Clustergram object with 30 rows of nodes and 7 columns of nodes.

Используйте set метод и genes и times векторы, чтобы добавить значимую строку и столбец помечают к кластерграмме.

set(cgo,'RowLabels',genes(1:30),'ColumnLabels',times)

Добавьте цветную полосу в кластерграмму путем нажатия на Insert Colorbar кнопка на панели инструментов.

Просмотрите всплывающую подсказку, содержащую значение интенсивности, метку строки и метку столбца для определенной области карты тепла путем нажатия на Data Cursor кнопка на панели инструментов, затем кликая по области в карте тепла. Чтобы удалить эту всплывающую подсказку, щелкните правой кнопкой по нему, затем выберите Delete Current Datatip.

Отобразите значения интенсивности для каждой области карты тепла путем нажатия кнопки Annotate на панели инструментов. Нажмите кнопку Annotate снова, чтобы удалить значения интенсивности.

Tip: If the amount of data is large enough, the cells within the clustergram
are too small to display the intensity annotations. Zoom in to see the
intensity annotations.

Удалите древовидные схемы древовидной схемы от фигуры путем нажатия кнопки Show Dendrogram на панели инструментов. Кликните по нему снова, чтобы отобразить древовидные схемы.

Используйте get метод, чтобы отобразить свойства объекта кластерграммы, cgo.

get(cgo)
               Cluster: 'ALL'
              RowPDist: {'Euclidean'}
           ColumnPDist: {'Euclidean'}
               Linkage: {'Average'}
            Dendrogram: {}
      OptimalLeafOrder: 1
              LogTrans: 0
          DisplayRatio: [0.2000 0.2000]
        RowGroupMarker: []
     ColumnGroupMarker: []
        ShowDendrogram: 'on'
           Standardize: 'ROW'
             Symmetric: 1
          DisplayRange: 3
              Colormap: [11x3 double]
             ImputeFun: []
          ColumnLabels: {1x7 cell}
             RowLabels: {30x1 cell}
    ColumnLabelsRotate: 90
       RowLabelsRotate: 0
              Annotate: 'off'
        AnnotPrecision: 2
            AnnotColor: 'w'
     ColumnLabelsColor: []
        RowLabelsColor: []
     LabelsWithMarkers: 0

Измените кластеризирующиеся параметры путем изменения метода рычажного устройства и изменения цвета групп узлов в древовидной схеме, рычажное устройство которой меньше порога 3.

set(cgo,'Linkage','complete','Dendrogram',3)

Установите курсор на узел ветви в древовидной схеме, чтобы подсветить (в синем) группу, сопоставленную с ним. Нажмите и удержите кнопку мыши, чтобы отобразить всплывающую подсказку, перечисляющую номер группы и узлы (гены или выборки) в группе.

Щелкните правой кнопкой по узлу ветви по древовидной схеме, чтобы отобразить меню опций.

Следующие опции доступны:

- Цвет Set Group - Изменение кластерный цвет группы. - Print Group, чтобы фигурировать - Print группа к окну рисунка. - Copy Group к Новой Кластерграмме - Copy группа к новому окну кластерграммы. - Export Group к Рабочей области - Создают объект кластерграммы группы в рабочем пространстве MATLAB. - Информация о Export Group к Рабочей области - Создают структуру, содержащую информацию о группе в рабочем пространстве MATLAB. Структура содержит эти поля:

- GroupNames - Массив ячеек из символьных векторов, содержащий имена строки или групп столбцов. - RowNodeNames - Массив ячеек из символьных векторов, содержащий имена узлов строки. - ColumnNodeNames - Массив ячеек из символьных векторов, содержащий имена узлов столбца. - ExprValues - Матрица M на n значений интенсивности, где M и N являются количеством узлов строки и узлов столбца соответственно. Если матрица содержит данные об экспрессии гена, обычно каждая строка соответствует гену, и каждый столбец соответствует выборке.

Создайте объект кластерграммы для Группы 18 в рабочем пространстве MATLAB. Щелкните правой кнопкой по Group 18, затем выберите Export Group to Workspace. В диалоговом окне Export to Workspace введите Group18, затем нажмите ОК.

Используйте view метод, чтобы просмотреть объект кластерграммы, Group18.

view(Group18)

Просмотрите все данные об экспрессии гена с помощью отличающейся красно-синей палитры и стандартизируйте вдоль строк данных.

cgo_all = clustergram(yeastvalues,'Colormap',redbluecmap,'Standardize','Row')
Clustergram object with 614 rows of nodes and 7 columns of nodes.

Создайте массивы структур, чтобы задать цвета маркера и аннотации для двух групп строк (510 и 593) и двух групп столбцов (4 и 5).

rm = struct('GroupNumber',{510,593},'Annotation',{'A','B'},...
     'Color',{'b','m'});
cm = struct('GroupNumber',{4,5},'Annotation',{'Time1','Time2'},...
     'Color',{[1 1 0],[0.6 0.6 1]});

Используйте RowGroupMarker и ColumnGroupMarker свойства добавить цветовые маркеры и аннотации к кластерграмме.

set(cgo_all,'RowGroupMarker',rm,'ColumnGroupMarker',cm)

Больше о

развернуть все

Ссылки

[1] DeRisi, J. L. “Исследуя Метаболическое и Генетическое Управление Экспрессии гена по Геномной Шкале”. Наука 278, № 5338 (24 октября 1997): 680–86.

Смотрите также

| |

Представлено до R2006a