Объект, содержащий иерархические аналитические данные о кластеризации
Функция clustergram
создает объект clustergram
. Объект содержит иерархические аналитические данные о кластеризации, которые можно просмотреть в тепловой карте и древовидной схеме.
clustergram(data)
clustergram(data,Name,Value)
cgObj
= clustergram(
выполняет иерархический анализ кластеризации значений в data
)data
. Возвращенный clustergram объект cgObj
содержит аналитические данные и отображает древовидную схему и тепловую карту.
cgObj
= clustergram(
устанавливает свойства объектов с помощью пар "имя-значение". Например, data
,Name,Value
)clustergram(data,'Standardize','column')
стандартизирует значения вдоль столбцов данных. Можно задать несколько пар "имя-значение". Заключите каждое имя свойства в кавычки.
данные
Исходные данныеИсходные данные, заданные как объект DataMatrix или числовая матрица. Как правило, если матрица содержит данные об экспрессии гена, каждая строка соответствует гену, и каждый столбец соответствует выборке.
Используйте разделенные от запятой аргументы пары "имя-значение", чтобы установить свойства объектов. Заключите каждое имя свойства в одинарные кавычки.
Пример:cg = clustergram(data,'Colormap',redbluecmap,'Annotate',true)
Standardize
— Размерность для стандартизации значений данных'none'
(значение по умолчанию) | 'row'
| 'column'
| 3
| 2
| 1
Размерность для стандартизации значений данных, заданных как вектор символов, строка или положительное целое число. Выбор:
'column'
или 1
— Стандартизируйте вдоль столбцов данных.
'row'
или 2
— Стандартизируйте вдоль строк данных.
'none'
или 3
— Не стандартизировать.
Если вы задаете 'column'
или 'row'
, функция преобразовывает стандартизированные значения так, чтобы среднее значение было 0, и стандартное отклонение 1 в заданном измерении.
Пример: 'column'
Типы данных: double
| char
| string
Symmetric
— Отметьте, чтобы сделать цветовую шкалу тепловой карты симметричной вокруг нуляtrue
(значение по умолчанию) | false
Отметьте, чтобы сделать цветовую шкалу тепловой карты симметричной вокруг нуля, заданного как true
или false
.
Пример: false
Типы данных: логический
ImputeFun
— Имя функции или указателя на функцию, чтобы приписать недостающие данныеИмя функции или указателя на функцию, чтобы приписать недостающие данные, заданные как вектор символов или массив ячеек. Если вы задаете массив ячеек, первый элемент должен быть именем функции или указателя на функцию, и остающиеся элементы должны быть парами "имя-значение", используемыми в качестве входных параметров к функции. Недостающие точки данных окрашены в серый в тепловой карте.
Пример: 'func1'
Типы данных: char
Палитра
Цвета тепловой картыredgreencmap
(значение по умолчанию) | матрица | имя указателя на функциюцвета тепловой карты, заданные как с тремя столбцами (M-by-3) матрица значений "красного зеленого синего" (RGB) или имя указателя на функцию, который возвращает палитру, такую как redgreencmap
или redbluecmap
.
Палитрой по умолчанию является redgreencmap
, в котором красный представляет значения выше среднего значения, черный представляет среднее значение, и зеленый представляет значения ниже среднего значения строки (ген) через все столбцы (выборки).
Пример: redbluecmap
Типы данных: double
| char
ColumnLabels
— Метки столбца[1x0 double]
(значение по умолчанию) | представляет вектор в виде строки | массив ячеек из символьных векторов | числовой векторМетки столбца, заданные как вектор строки, массив ячеек из символьных векторов или числовой вектор. Размер вектора должен совпадать с количеством столбцов во входе data
.
Пример: ["sample1","sample2","sample3"]
Типы данных: double
| string
| cell
RowLabels
— Метки строки[]
(значение по умолчанию) | представляет вектор в виде строки | массив ячеек из символьных векторов | числовой векторМетки строки, заданные как вектор строки, массив ячеек из символьных векторов или числовой вектор. Размер вектора должен совпадать с количеством строк во входе data
.
Пример: ["gene1","gene2","gene3"]
Типы данных: double
| string
| cell
ColumnLabelsRotate
— Ориентация меток столбца90
(значение по умолчанию) | числовой скалярОриентация меток столбца, заданных в виде числа. Задайте значение вращения в градусах (положительные углы вызывают против часовой стрелки вращение).
Пример: 30
Типы данных: double
RowLabelsRotate
— Ориентация меток строкиОриентация меток строки, заданных в виде числа. Задайте значение вращения в градусах (положительные углы вызывают против часовой стрелки вращение).
Пример: 30
Типы данных: double
Annotate
— Отметьте, чтобы отобразить значения данных в тепловой картеfalse
(значение по умолчанию) | true
Отметьте, чтобы отобразить значения данных в тепловой карте, заданной как true
или false
.
Пример: true
Типы данных: логический
AnnotPrecision
— Точность отображения значений данных2
(значение по умолчанию) | числовой скалярТочность отображения значений данных в тепловой карте, заданной в виде числа. Количеством по умолчанию цифр точности является 2
.
Пример 3
Типы данных: double
LabelsWithMarkers
— Отметьте, чтобы отобразиться окрашенный маркерами для меток строки и столбцаfalse
(значение по умолчанию) | true
Отметьте, чтобы отобразиться окрашенный маркерами вместо цветного текста для меток строки и столбца, заданных как true
или false
.
Пример: true
Типы данных: логический
AnnotColor
— Цвет текста отображенных значений данных'w'
(значение по умолчанию) | вектор символов | представляет в виде строки | трехэлементный числовой векторЦвет текста отображенных значений данных в тепловой карте, заданной как вектор символов, строка или трехэлементный числовой вектор. Например, чтобы использовать голубой, можно ввести [0 1 1]
, 'c'
, "c"
, "cyan"
или 'cyan'
. Для получения дополнительной информации смотрите Параметры цвета.
Пример: 'red'
Типы данных: char
| string
| double
'DisplayRange'
Отобразитесь область значений стандартизируют значенияОтобразитесь область значений стандартизируют значения, заданные как положительная скалярная величина.
Значение по умолчанию 3
означает, что существует цветное изменение для значений между -3
и 3
, но значения, больше, чем 3
, являются тем же цветом как 3
и значения меньше, чем -3
, является тем же цветом как -3
.
Например, если вы задаете redgreencmap
для свойства 'Colormap'
, чистый красный представляет значения, больше, чем или равный заданному значению области значений отображения, и чистый зеленый представляет значения, меньше чем или равные отрицанию заданного значения области значений отображения.
Пример 3
Типы данных: double
ColumnLabelsColor
— Информация о цвете для меток столбца[]
(значение по умолчанию) | структура | массив структурЭто свойство будет удалено в будущем релизе. Установите LabelsWithMarkers
на true
для цветных маркеров вместо цветных текстов.
Информация о цвете для меток столбца, заданных как структура или массив структур.
Для одной структуры необходимо задать следующие поля.
Labels
— Массив ячеек из символьных векторов, задающий метки столбца, перечислен в свойстве ColumnLabels
.
Colors
— Вектор символов или строка, задающая цвет для меток столбца. Если это поле пусто, (черный) цвет по умолчанию используется.
Для массива структур необходимо указать один элемент в каждом поле для каждой структуры.
Labels
— Вектор символов или строка, задающая метку столбца, перечислены в свойстве ColumnLabels
.
Colors
— Вектор символов или строка, задающая цвет для меток столбца. Если это поле пусто, (черный) цвет по умолчанию используется.
Для получения дополнительной информации об определении цветов смотрите Параметры цвета.
Типы данных: struct
RowLabelsColor
— Информация о цвете для меток строки[]
(значение по умолчанию) | структура | массив структурЭто свойство будет удалено в будущем релизе. Установите LabelsWithMarkers
на true
для цветных маркеров вместо цветных текстов.
Информация о цвете для меток строки, заданных как структура или массив структур.
Для одной структуры необходимо задать следующие поля.
Labels
— Массив ячеек из символьных векторов, задающий метки строки, перечислен в свойстве RowLabels
.
Colors
— Вектор символов или строка, задающая цвет для меток строки. Если это поле пусто, (черный) цвет по умолчанию используется.
Для массива структур необходимо указать один элемент в каждом поле для каждой структуры.
Labels
— Вектор символов или строка, задающая метку строки, перечислены в свойстве RowLabels
.
Colors
— Вектор символов или строка, задающая цвет для меток строки. Если это поле пусто, (черный) цвет по умолчанию используется.
Для получения дополнительной информации об определении цветов смотрите Параметры цвета.
Cluster
— Размерность для кластеризации данных'all'
(значение по умолчанию) | 1
| 2
| 3
| 'column'
| 'row'
Размерность для кластеризации данных, заданной как положительное целое число, вектор символов или строка. Выбор:
'column'
или 1
— Кластер вдоль столбцов данных только, которые приводят к кластеризованным строкам.
'row'
или 2
— Кластер вдоль строк данных только, которые приводят к сгруппированным столбцам.
'all'
или 3
— Кластер вдоль столбцов данных, затем кластер вдоль строк кластеризируемых строкой данных.
Пример 2
Типы данных: double
| char
| string
ColumnGroupMarker
— Информация для аннотирования групп столбцовИнформация для аннотирования групп столбцов, заданных как структура или массив структур.
Если вы задаете одну структуру, каждое поле должно содержать массив ячеек элементов. Если вы задаете массив структур, каждая структура должна иметь один элемент в каждом поле.
Поля:
GroupNumber
— Скаляр, задающий номер группы столбцов, чтобы аннотировать.
Аннотация
Текст определения вектора символов, чтобы аннотировать группу столбцов.
Color
— Вектор символов или трехэлементный вектор значений RGB, задающих цвет, чтобы маркировать группу столбцов. Для получения дополнительной информации об определении цветов смотрите Параметры цвета. Если это поле пусто, значением по умолчанию является 'blue'
.
Типы данных: struct
ColumnPDist
— Метрика расстояния, чтобы передать функции pdist
'euclidean'
(значение по умолчанию) | вектор символов | массив ячеекМетрика расстояния, чтобы передать pdist
функционирует, чтобы вычислить попарные расстояния между столбцами, заданными как вектор символов или массив ячеек. Задайте массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковскего с экспонентой p, задайте {'minkowski',p}
.
Пример: 'jaccard'
Типы данных: char | cell
Dendrogram
— Информация о цветовом пороге, чтобы передать функции dendrogram
Информация о цветовом пороге, чтобы передать dendrogram
функционирует, чтобы создать график древовидной схемы, заданный как скаляр, двухэлементный числовой вектор, вектор символов или массив ячеек из символьных векторов. Эта опция устанавливает свойство 'ColorThreshold'
графика древовидной схемы. Если вы задаете двухэлементный числовой векторный массив или массив ячеек, первый элемент для строк, и второй элемент для столбцов.
Типы данных: double
| cell
DisplayRatio
— Отношение места, которое занимают древовидные схемы строки и столбца1/5
(значение по умолчанию) | скаляр между 0
и 1
| двухэлементный векторОтношение места, которое древовидные схемы строки и столбца занимают относительно тепловой карты, заданной как скаляр между 0
и 1
или двухэлементным вектором. Если вы задаете скаляр, функция использует его в качестве отношения для обеих древовидных схем строки и столбца. Если вы задаете двухэлементный вектор, функция использует первый элемент для отношения ширины древовидной схемы строки к ширине тепловой карты и второй элемент для отношения высоты древовидной схемы столбца к высоте тепловой карты. Второй элемент проигнорирован для одномерного clustergrams.
Пример: 0.5
Типы данных: double
Linkage
— Метод связи, чтобы создать иерархическое кластерное дерево'average'
(значение по умолчанию) | вектор символов | двухэлементный массив ячеек из символьных векторовМетод связи передал функции linkage
, чтобы создать иерархическое кластерное дерево для строк и столбцов, заданных как вектор символов или двухэлементный массив ячеек из символьных векторов. Если вы задаете массив ячеек, функция использует первый элемент для связи между строками и второй элемент для связи между столбцами.
Пример: 'centroid'
Типы данных: char | cell
LogTrans
— Флаг к log2 преобразовывает данныеfalse
(значение по умолчанию) | true
Флаг к log2 преобразовывает данные из натурального звукоряда, заданного как true
или false
.
Пример: true
Типы данных: логический
OptimalLeafOrder
— Отметьте, чтобы вычислить оптимальный листовой порядокtrue
| false
Отметьте, чтобы вычислить оптимальный листовой порядок, который максимизирует подобие между соседними листами, заданными как true
или false
. Значение по умолчанию зависит от размера входа data
. Если количество строк или столбцов в data
превышает 1500, значением по умолчанию является false
. В противном случае значением по умолчанию является true
.
Отключение оптимального листового вычисления упорядоченного расположения может быть полезным при работе с большими наборами данных, потому что это вычисление использует большую память и время.
Пример: true
Типы данных: логический
RowGroupMarker
— Информация для аннотирования групп строкИнформация для аннотирования групп строк, заданных как структура или массив структур.
Если вы задаете одну структуру, каждое поле должно содержать массив ячеек элементов. Если вы задаете массив структур, каждая структура должна иметь один элемент в каждом поле.
Поля
GroupNumber
— Скаляр, задающий номер группы столбцов, чтобы аннотировать.
Аннотация
Текст определения вектора символов, чтобы аннотировать группу столбцов.
Color
— Вектор символов или трехэлементный вектор значений RGB, задающих цвет, чтобы маркировать группу столбцов. Для получения дополнительной информации об определении цветов смотрите Параметры цвета. Если это поле пусто, значением по умолчанию является 'blue'
.
Типы данных: struct
RowPDist
— Метрика расстояния, чтобы передать функции pdist
'euclidean'
(значение по умолчанию) | вектор символов | массив ячеекМетрика расстояния, чтобы передать pdist
функционирует, чтобы вычислить попарные расстояния между строками, заданными как вектор символов или массив ячеек. Задайте массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковскего с экспонентой p, задайте {'minkowski',p}
.
Пример: 'jaccard'
Типы данных: char | cell
ShowDendrogram
— Отметьте, чтобы показать древовидные схемы древовидной схемы с clustergram'on'
(значение по умолчанию) | 'off'
Отметьте, чтобы показать древовидные схемы древовидной схемы с clustergram, заданным как 'on'
или 'off'
.
Пример: 'off'
Типы данных: char
view | Отобразите тепловую карту или clustergram |
plot | Представьте тепловую карту или clustergram |
addTitle | Добавьте заголовок на тепловую карту или clustergram |
addXLabel | Маркируйте ось X тепловой карты или clustergram |
addYLabel | Маркируйте ось Y тепловой карты или clustergram |
clusterGroup | Выберите кластерную группу |
Загрузите микроданные массива, содержащие уровни экспрессии гена Saccharomyces cerevisiae (дрожжи) во время метаболического сдвига от ферментации до дыхания (Derisi, J. и др., 1997).
load filteredyeastdata
Этот MAT-файл включает три переменные, которые добавляются к рабочей области MATLAB®:
yeastvalues
- Матрица данных об экспрессии гена из Saccharomyces cerevisiae во время метаболического сдвига от ферментации до дыхания
гены - массив ячеек инвентарных номеров GenBank® для маркировки строк в yeastvalues
времена - вектор временных стоимостей для маркировки столбцов в yeastvalues
Создайте clustergram, возражают и отображают карту тепла от данных об экспрессии гена в первых 30 строках матрицы yeastvalues
и стандартизируют вдоль строк данных.
cgo = clustergram(yeastvalues(1:30,:),'Standardize','Row')
Clustergram object with 30 rows of nodes and 7 columns of nodes.
Используйте метод set
и genes
и векторы times
, чтобы добавить значимые метки строки и столбца в clustergram.
set(cgo,'RowLabels',genes(1:30),'ColumnLabels',times)
Добавьте цветную полосу в clustergram путем нажатия кнопки Insert Colorbar
на панели инструментов.
Просмотрите всплывающую подсказку, содержащую значение интенсивности, метку строки и метку столбца для определенной области карты тепла путем нажатия кнопки Data Cursor
на панели инструментов, затем нажатия на область в карте тепла. Чтобы удалить эту всплывающую подсказку, щелкните правой кнопкой по нему, затем выберите Delete Current Datatip
.
Отобразите значения интенсивности для каждой области карты тепла путем нажатия кнопки Annotate на панели инструментов. Нажмите кнопку Annotate снова, чтобы удалить значения интенсивности.
Tip: If the amount of data is large enough, the cells within the clustergram are too small to display the intensity annotations. Zoom in to see the intensity annotations.
Удалите древовидные схемы древовидной схемы от фигуры путем нажатия кнопки Show Dendrogram на панели инструментов. Кликните по нему снова, чтобы отобразить древовидные схемы.
Используйте метод get
, чтобы отобразить свойства объекта clustergram, cgo
.
get(cgo)
Cluster: 'ALL' RowPDist: {'Euclidean'} ColumnPDist: {'Euclidean'} Linkage: {'Average'} Dendrogram: {} OptimalLeafOrder: 1 LogTrans: 0 DisplayRatio: [0.2000 0.2000] RowGroupMarker: [] ColumnGroupMarker: [] ShowDendrogram: 'on' Standardize: 'ROW' Symmetric: 1 DisplayRange: 3 Colormap: [11x3 double] ImputeFun: [] ColumnLabels: {1x7 cell} RowLabels: {30x1 cell} ColumnLabelsRotate: 90 RowLabelsRotate: 0 Annotate: 'off' AnnotPrecision: 2 AnnotColor: 'w' ColumnLabelsColor: [] RowLabelsColor: [] LabelsWithMarkers: 0
Измените кластеризирующиеся параметры путем изменения метода связи и изменения цвета групп узлов в древовидной схеме, связь которой является меньше, чем порог 3.
set(cgo,'Linkage','complete','Dendrogram',3)
Установите курсор на узел ответвления в древовидной схеме, чтобы подсветить (в синем) группу, сопоставленную с ним. Нажмите и удержите кнопку мыши, чтобы отобразить всплывающую подсказку, перечисляющую номер группы и узлы (гены или выборки) в группе.
Щелкните правой кнопкой по узлу ответвления по древовидной схеме, чтобы отобразить меню опций.
Следующие опции доступны:
Цвет Set Group - Изменение кластерный цвет группы.
Print Group, чтобы фигурировать - Print группа к Окну рисунка.
Copy Group к Новому Clustergram - Copy группа к новому окну Clustergram.
Export Group к Рабочей области - Создает clustergram объект группы в рабочем пространстве MATLAB.
Информация о Export Group к Рабочей области - Создает структуру, содержащую информацию о группе в рабочем пространстве MATLAB. Структура содержит эти поля:
GroupNames
- Массив ячеек из символьных векторов, содержащий имена строки или групп столбцов.
RowNodeNames
- Массив ячеек из символьных векторов, содержащий имена узлов строки.
ColumnNodeNames
- Массив ячеек векторов текстового символа, содержащих имена узлов столбца.
ExprValues
- Матрица M на n значений интенсивности, где M и N являются количеством узлов строки и узлов столбца соответственно. Если матрица содержит данные об экспрессии гена, обычно каждая строка соответствует гену, и каждый столбец соответствует выборке.
Создайте объект clustergram в рабочем пространстве MATLAB Группы 18 путем щелчка правой кнопкой по нему, затем выбора Export Group to Workspace. В диалоговом окне Export to Workspace, типе Group18, затем нажимают ОК.
Используйте метод view
, чтобы просмотреть объект clustergram, Group18
.
view(Group18)
Просмотрите все данные об экспрессии гена с помощью отличающейся красно-синей палитры и стандартизируйте вдоль строк данных.
cgo_all = clustergram(yeastvalues,'Colormap',redbluecmap,'Standardize','Row')
Clustergram object with 614 rows of nodes and 7 columns of nodes.
Создайте массивы структур, чтобы задать цвета маркера и аннотации для двух групп строк (510 и 593) и двух групп столбцов (4 и 5).
rm = struct('GroupNumber',{510,593},'Annotation',{'A','B'},... 'Color',{'b','m'}); cm = struct('GroupNumber',{4,5},'Annotation',{'Time1','Time2'},... 'Color',{[1 1 0],[0.6 0.6 1]});
Используйте свойства 'RowGroupMarker'
и 'ColumnGroupMarker'
добавить цветовые маркеры и аннотации к clustergram.
set(cgo_all,'RowGroupMarker',rm,'ColumnGroupMarker',cm)
Следующие списки предопределенные цвета и их эквиваленты триплета RGB. Краткие названия и длинные имена являются векторами символов, которые задают один из восьми предварительно установленных цветов. Триплет RGB является трехэлементным вектором - строкой, элементы которого задают интенсивность красных, зеленых, и синих компонентов цвета; интенсивность должна быть в области значений [0 1].
Триплет RGB | Краткое название | Длинное имя |
---|---|---|
[1 1 0] |
|
|
[1 0 1] |
|
|
[0 1 1] |
|
|
[1 0 0] |
|
|
[0 1 0] |
|
|
[0 0 1] |
|
|
[1 1 1] |
|
|
[0 0 0] |
|
|
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.