Объект, содержащий иерархические аналитические данные о кластеризации
clustergram
функция создает clustergram
объект. Объект содержит иерархические аналитические данные о кластеризации, которые можно просмотреть в тепловой карте и древовидной схеме.
cgObj
= clustergram(
выполняет иерархический анализ кластеризации значений в data
)data
. Возвращенный объект cgObj
кластерграммы содержит аналитические данные и отображает древовидную схему и тепловую карту.
cgObj
= clustergram(
устанавливает свойства объектов с помощью пар "имя-значение". Например, data
,Name,Value
)clustergram(data,'Standardize','column')
стандартизирует значения вдоль столбцов данных. Можно задать несколько пар "имя-значение". Заключите каждое имя свойства в кавычки.
data
— Исходные данныеИсходные данные в виде объекта DataMatrix или числовой матрицы. Как правило, если матрица содержит данные об экспрессии гена, каждая строка соответствует гену, и каждый столбец соответствует выборке.
Используйте разделенные от запятой аргументы пары "имя-значение", чтобы установить свойства объектов. Заключите каждое имя свойства в одинарные кавычки.
Пример:cg = clustergram(data,'Colormap',redbluecmap,'Annotate',true)
Standardize
— Размерность для стандартизации значений данных'none'
(значение по умолчанию) | 'row'
| 'column'
| 3
| 2
| 1
Размерность для стандартизации значений данных в виде вектора символов, строки или положительного целого числа. Выбор:
'column'
или 1
— Стандартизируйте вдоль столбцов данных.
'row'
или 2
— Стандартизируйте вдоль строк данных.
'none'
или 3
— Не стандартизировать.
Если вы задаете 'column'
или 'row'
, функция преобразовывает стандартизированные значения так, чтобы среднее значение было 0, и стандартное отклонение 1 в заданном измерении.
Пример: 'column'
Типы данных: double |
char
| string
Symmetric
— Отметьте, чтобы сделать цветовую шкалу тепловой карты симметричной вокруг нуляtrue
(значение по умолчанию) | false
Отметьте, чтобы сделать цветовую шкалу тепловой карты симметричной вокруг нуля в виде true
или false
.
Пример: false
Типы данных: логический
ImputeFun
— Имя функции или указателя на функцию, чтобы приписать недостающие данныеИмя функции или указателя на функцию, чтобы приписать недостающие данные в виде вектора символов или массива ячеек. Если вы задаете массив ячеек, первым элементом должно быть имя функции или указателя на функцию, и остающимися элементами должны быть пары "имя-значение", используемые в качестве входных параметров к функции. Недостающие точки данных окрашены в серый в тепловой карте.
Если точки данных отсутствуют, используйте это свойство приписать отсутствующие значения.. В противном случае, clustergram
функциональные ошибки.
Пример: 'func1'
Типы данных: char
Colormap
— Цвета тепловой картыredgreencmap
(значение по умолчанию) | матрица | имя указателя на функциютепловая карта окрашивает в виде с тремя столбцами (M-by-3) матрицу значений "красного зеленого синего" (RGB) или имя указателя на функцию, который возвращает палитру, такой как redgreencmap
или redbluecmap
.
Палитрой по умолчанию является redgreencmap
, в котором красный представляет значения выше среднего значения, черный представляет среднее значение, и зеленый представляет значения ниже среднего значения строки (ген) через все столбцы (выборки).
Пример: redbluecmap
Типы данных: double |
char
ColumnLabels
— Метки столбца[1x0 double]
(значение по умолчанию) | представляет вектор в виде строки | массив ячеек из символьных векторов | числовой векторСтолбец помечает в виде вектора строки, массива ячеек из символьных векторов или числового вектора. Размер вектора должен совпадать с количеством столбцов во входе data
.
Если количество меток столбца 200 или больше, метки не появляются в графике кластерграммы.
Пример: ["sample1","sample2","sample3"]
Типы данных: double |
string
| cell
RowLabels
— Метки строки[]
(значение по умолчанию) | представляет вектор в виде строки | массив ячеек из символьных векторов | числовой векторСтрока помечает в виде вектора строки, массива ячеек из символьных векторов или числового вектора. Размер вектора должен совпадать с количеством строк во входе data
.
Если количество меток строки 200 или больше, метки не появляются в графике кластерграммы.
Пример: ["gene1","gene2","gene3"]
Типы данных: double |
string
| cell
ColumnLabelsRotate
— Ориентация меток столбца
(значение по умолчанию) | числовой скалярОриентация столбца помечает в виде числового скаляра. Задайте значение вращения в градусах (положительные углы вызывают против часовой стрелки вращение).
Пример: 30
Типы данных: double
RowLabelsRotate
— Ориентация меток строкиОриентация строки помечает в виде числового скаляра. Задайте значение вращения в градусах (положительные углы вызывают против часовой стрелки вращение).
Пример: 30
Типы данных: double
Annotate
— Отметьте, чтобы отобразить значения данных в тепловой картеfalse
(значение по умолчанию) | true
Отметьте, чтобы отобразить значения данных в тепловой карте в виде true
или false
.
Пример: true
Типы данных: логический
AnnotPrecision
— Точность отображения значений данных
(значение по умолчанию) | числовой скалярТочность отображения значений данных в тепловой карте в виде числового скаляра. Количеством по умолчанию цифр точности является 2
.
Пример 3
Типы данных: double
LabelsWithMarkers
— Отметьте, чтобы отобразиться окрашенный маркерами для меток строки и столбцаfalse
(значение по умолчанию) | true
Отметьте, чтобы отобразиться окрашенный маркерами вместо цветного текста для меток строки и столбца в виде true
или false
.
Пример: true
Типы данных: логический
AnnotColor
— Цвет текста отображенных значений данных'w'
(значение по умолчанию) | вектор символов | представляет в виде строки | трехэлементный числовой векторЦвет текста отображенных значений данных в тепловой карте в виде вектора символов, строки или трехэлементного числового вектора. Например, чтобы использовать голубой, можно ввести [0 1 1]
C
C
Голубой
, или 'cyan'
. Для получения дополнительной информации смотрите Параметры цвета.
Пример: 'red'
Типы данных: char |
string
| double
DisplayRange
— Отобразитесь область значений стандартизируют значенияОтобразитесь область значений стандартизируют значения в виде положительной скалярной величины.
Значение по умолчанию 3
средние значения, что существует цветное изменение для значений между -3
и 3
, но значения, больше, чем 3
тот же цвет как 3
, и значения меньше, чем -3
тот же цвет как -3
.
Например, если вы задаете redgreencmap
для 'Colormap'
свойство, чистый красный представляет значения, больше, чем или равный заданному значению области значений отображения, и чистый зеленый представляет значения, меньше чем или равные отрицанию заданного значения области значений отображения.
Пример 3
Типы данных: double
ColumnLabelsColor
— Информация о цвете для меток столбца[]
(значение по умолчанию) | структура | массив структурПредупреждение
Это свойство будет удалено в будущем релизе. Установите LabelsWithMarkers
к true
для цветных маркеров вместо цветных текстов.
Информация о цвете для столбца помечает в виде структуры или массива структур.
Для одной структуры необходимо задать следующие поля.
Labels
— Массив ячеек из символьных векторов, задающий метки столбца, перечислен в ColumnLabels
свойство.
Colors
— Вектор символов или строка, задающая цвет для меток столбца. Если это поле пусто, (черный) цвет по умолчанию используется.
Для массива структур необходимо указать один элемент в каждом поле для каждой структуры.
Labels
— Вектор символов или строка, задающая метку столбца, перечислены в ColumnLabels
свойство.
Colors
— Вектор символов или строка, задающая цвет для меток столбца. Если это поле пусто, (черный) цвет по умолчанию используется.
Для получения дополнительной информации об определении цветов смотрите Параметры цвета.
Типы данных: struct
RowLabelsColor
— Информация о цвете для меток строки[]
(значение по умолчанию) | структура | массив структурПредупреждение
Это свойство будет удалено в будущем релизе. Установите LabelsWithMarkers
к true
для цветных маркеров вместо цветных текстов.
Информация о цвете для строки помечает в виде структуры или массива структур.
Для одной структуры необходимо задать следующие поля.
Labels
— Массив ячеек из символьных векторов, задающий метки строки, перечислен в RowLabels
свойство.
Colors
— Вектор символов или строка, задающая цвет для меток строки. Если это поле пусто, (черный) цвет по умолчанию используется.
Для массива структур необходимо указать один элемент в каждом поле для каждой структуры.
Labels
— Вектор символов или строка, задающая метку строки, перечислены в RowLabels
свойство.
Colors
— Вектор символов или строка, задающая цвет для меток строки. Если это поле пусто, (черный) цвет по умолчанию используется.
Для получения дополнительной информации об определении цветов смотрите Параметры цвета.
Cluster
— Размерность для кластеризации данных'all'
(значение по умолчанию) | 1
| 2
| 3
| 'column'
| 'row'
Размерность для данных, кластеризирующихся в виде положительного целого числа, вектора символов или строки. Выбор:
'column'
или 1
— Кластер вдоль столбцов данных только, которые приводят к кластеризованным строкам.
'row'
или 2
— Кластер вдоль строк данных только, которые приводят к сгруппированным столбцам.
'all'
или 3
— Кластер вдоль столбцов данных, затем кластер вдоль строк кластеризируемых строкой данных.
Пример 2
Типы данных: double |
char
| string
ColumnGroupMarker
— Информация для аннотирования групп столбцовИнформация для аннотирования групп столбцов в виде структуры или массива структур.
Если вы задаете одну структуру, каждое поле должно содержать массив ячеек элементов. Если вы задаете массив структур, каждая структура должна иметь один элемент в каждом поле.
Поля:
GroupNumber
— Скаляр, задающий номер группы столбцов, чтобы аннотировать.
Annotation
— Текст определения вектора символов, чтобы аннотировать группу столбцов.
Color
— Вектор символов или трехэлементный вектор из значений RGB, задающих цвет, чтобы пометить группу столбцов. Для получения дополнительной информации об определении цветов смотрите Параметры цвета. Если это поле пусто, значением по умолчанию является 'blue'
.
Типы данных: struct
ColumnPDist
— Метрика расстояния, чтобы передать pdist
функция'euclidean'
(значение по умолчанию) | вектор символов | массив ячеекМетрика расстояния, чтобы передать pdist
функция, чтобы вычислить попарные расстояния между столбцами в виде вектора символов или массива ячеек. Задайте массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковскего с экспонентой p, задайте {'minkowski',p}
.
Пример: 'jaccard'
Типы данных: char |
cell
Dendrogram
— Информация о цветовом пороге, чтобы передать dendrogram
функцияИнформация о цветовом пороге, чтобы передать dendrogram
функция, чтобы создать график древовидной схемы в виде скаляра, двухэлементного числового вектора, вектора символов или массива ячеек из символьных векторов. Эта опция устанавливает 'ColorThreshold'
свойство графика древовидной схемы. Если вы задаете двухэлементный числовой векторный массив или массив ячеек, первый элемент для строк, и второй элемент для столбцов.
Типы данных: double |
cell
DisplayRatio
— Отношение места, которое занимают древовидные схемы строки и столбца
(значение по умолчанию) | скаляр между 0
и 1
| двухэлементный векторОтношение места, которое древовидные схемы строки и столбца занимают относительно тепловой карты в виде скаляра между 0
и 1
или двухэлементный вектор. Если вы задаете скаляр, функция использует его в качестве отношения для обеих древовидных схем строки и столбца. Если вы задаете двухэлементный вектор, функция использует первый элемент для отношения ширины древовидной схемы строки к ширине тепловой карты и второй элемент для отношения высоты древовидной схемы столбца к высоте тепловой карты. Второй элемент проигнорирован для одномерных кластерграмм.
Пример: 0.5
Типы данных: double
Linkage
— Метод рычажного устройства, чтобы создать иерархическое кластерное дерево'average'
(значение по умолчанию) | вектор символов | двухэлементный массив ячеек из символьных векторовМетод рычажного устройства передал linkage
функция, чтобы создать иерархическое кластерное дерево для строк и столбцов в виде вектора символов или двухэлементного массива ячеек из символьных векторов. Если вы задаете массив ячеек, функция использует первый элемент для рычажного устройства между строками и второй элемент для рычажного устройства между столбцами.
Пример: 'centroid'
Типы данных: char |
cell
LogTrans
— Флаг к log2 преобразовывает данныеfalse
(значение по умолчанию) | true
Флаг к log2 преобразовывает данные из натурального звукоряда в виде true
или false
.
Пример: true
Типы данных: логический
OptimalLeafOrder
— Отметьте, чтобы вычислить оптимальный листовой порядокtrue
| false
Отметьте, чтобы вычислить оптимальный листовой порядок, который максимизирует подобие между соседними листами в виде true
или false
. Значение по умолчанию зависит от размера входа data
. Если количество строк или столбцов в data
превышает 1500, значением по умолчанию является false
. В противном случае значением по умолчанию является true
.
Отключение оптимального листового вычисления упорядоченного расположения может быть полезным при работе с большими наборами данных, потому что это вычисление использует большую память и время.
Пример: true
Типы данных: логический
RowGroupMarker
— Информация для аннотирования групп строкИнформация для аннотирования групп строк в виде структуры или массива структур.
Если вы задаете одну структуру, каждое поле должно содержать массив ячеек элементов. Если вы задаете массив структур, каждая структура должна иметь один элемент в каждом поле.
Поля
GroupNumber
— Скаляр, задающий номер группы столбцов, чтобы аннотировать.
Annotation
— Текст определения вектора символов, чтобы аннотировать группу столбцов.
Color
— Вектор символов или трехэлементный вектор из значений RGB, задающих цвет, чтобы пометить группу столбцов. Для получения дополнительной информации об определении цветов смотрите Параметры цвета. Если это поле пусто, значением по умолчанию является 'blue'
.
Типы данных: struct
RowPDist
— Метрика расстояния, чтобы передать pdist
функция'euclidean'
(значение по умолчанию) | вектор символов | массив ячеекМетрика расстояния, чтобы передать pdist
функция, чтобы вычислить попарные расстояния между строками в виде вектора символов или массива ячеек. Задайте массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковскего с экспонентой p, задайте {'minkowski',p}
.
Пример: 'jaccard'
Типы данных: char |
cell
ShowDendrogram
— Отметьте, чтобы показать древовидные схемы древовидной схемы с кластерграммой'on'
(значение по умолчанию) | 'off'
Отметьте, чтобы показать древовидные схемы древовидной схемы с кластерграммой в виде 'on'
или 'off'
.
Пример: 'off'
Типы данных: char
view | Отобразите тепловую карту или кластерграмму |
plot | Представьте тепловую карту или кластерграмму |
addTitle | Добавьте заголовок на тепловую карту или кластерграмму |
addXLabel | Маркируйте x - ось тепловой карты или кластерграммы |
addYLabel | Маркируйте y - ось тепловой карты или кластерграммы |
clusterGroup | Выберите кластерную группу |
Загрузите микроданные массива, содержащие уровни экспрессии гена Saccharomyces cerevisiae (дрожжи) во время метаболического сдвига от ферментации до дыхания [1].
load filteredyeastdata
Этот файл MAT включает три переменные, которые добавляются к рабочей области MATLAB®:
- yeastvalues
- Матрица A данных об экспрессии гена Saccharomyces - _cerevisiae_ во время метаболического сдвига от ферментации до дыхания - genes
- Массив ячеек инвентарных номеров GenBank® для маркировки строк в yeastvalues
\times
- Вектор из временных стоимостей для маркировки столбцов в yeastvalues
Создайте объект кластерграммы отобразить карту тепла из данных об экспрессии гена в первых 30 строках yeastvalues
матрица и стандартизирует вдоль строк данных.
cgo = clustergram(yeastvalues(1:30,:),'Standardize','Row')
Clustergram object with 30 rows of nodes and 7 columns of nodes.
Используйте set
метод и genes
и times
векторы, чтобы добавить значимую строку и столбец помечают к кластерграмме.
set(cgo,'RowLabels',genes(1:30),'ColumnLabels',times)
Добавьте цветную полосу в кластерграмму путем нажатия на Insert Colorbar
кнопка на панели инструментов.
Просмотрите всплывающую подсказку, содержащую значение интенсивности, метку строки и метку столбца для определенной области карты тепла путем нажатия на Data Cursor
кнопка на панели инструментов, затем кликая по области в карте тепла. Чтобы удалить эту всплывающую подсказку, щелкните правой кнопкой по нему, затем выберите Delete Current Datatip
.
Отобразите значения интенсивности для каждой области карты тепла путем нажатия кнопки Annotate на панели инструментов. Нажмите кнопку Annotate снова, чтобы удалить значения интенсивности.
Tip: If the amount of data is large enough, the cells within the clustergram are too small to display the intensity annotations. Zoom in to see the intensity annotations.
Удалите древовидные схемы древовидной схемы от фигуры путем нажатия кнопки Show Dendrogram на панели инструментов. Кликните по нему снова, чтобы отобразить древовидные схемы.
Используйте get
метод, чтобы отобразить свойства объекта кластерграммы, cgo
.
get(cgo)
Cluster: 'ALL' RowPDist: {'Euclidean'} ColumnPDist: {'Euclidean'} Linkage: {'Average'} Dendrogram: {} OptimalLeafOrder: 1 LogTrans: 0 DisplayRatio: [0.2000 0.2000] RowGroupMarker: [] ColumnGroupMarker: [] ShowDendrogram: 'on' Standardize: 'ROW' Symmetric: 1 DisplayRange: 3 Colormap: [11x3 double] ImputeFun: [] ColumnLabels: {1x7 cell} RowLabels: {30x1 cell} ColumnLabelsRotate: 90 RowLabelsRotate: 0 Annotate: 'off' AnnotPrecision: 2 AnnotColor: 'w' ColumnLabelsColor: [] RowLabelsColor: [] LabelsWithMarkers: 0
Измените кластеризирующиеся параметры путем изменения метода рычажного устройства и изменения цвета групп узлов в древовидной схеме, рычажное устройство которой меньше порога 3.
set(cgo,'Linkage','complete','Dendrogram',3)
Установите курсор на узел ветви в древовидной схеме, чтобы подсветить (в синем) группу, сопоставленную с ним. Нажмите и удержите кнопку мыши, чтобы отобразить всплывающую подсказку, перечисляющую номер группы и узлы (гены или выборки) в группе.
Щелкните правой кнопкой по узлу ветви по древовидной схеме, чтобы отобразить меню опций.
Следующие опции доступны:
- Цвет Set Group - Изменение кластерный цвет группы. - Print Group, чтобы фигурировать - Print группа к окну рисунка. - Copy Group к Новой Кластерграмме - Copy группа к новому окну кластерграммы. - Export Group к Рабочей области - Создают объект кластерграммы группы в рабочем пространстве MATLAB. - Информация о Export Group к Рабочей области - Создают структуру, содержащую информацию о группе в рабочем пространстве MATLAB. Структура содержит эти поля:
- GroupNames
- Массив ячеек из символьных векторов, содержащий имена строки или групп столбцов. - RowNodeNames
- Массив ячеек из символьных векторов, содержащий имена узлов строки. - ColumnNodeNames
- Массив ячеек из символьных векторов, содержащий имена узлов столбца. - ExprValues
- Матрица M на n значений интенсивности, где M и N являются количеством узлов строки и узлов столбца соответственно. Если матрица содержит данные об экспрессии гена, обычно каждая строка соответствует гену, и каждый столбец соответствует выборке.
Создайте объект кластерграммы для Группы 18 в рабочем пространстве MATLAB. Щелкните правой кнопкой по Group 18, затем выберите Export Group to Workspace. В диалоговом окне Export to Workspace введите Group18
, затем нажмите ОК.
Используйте view
метод, чтобы просмотреть объект кластерграммы, Group18
.
view(Group18)
Просмотрите все данные об экспрессии гена с помощью отличающейся красно-синей палитры и стандартизируйте вдоль строк данных.
cgo_all = clustergram(yeastvalues,'Colormap',redbluecmap,'Standardize','Row')
Clustergram object with 614 rows of nodes and 7 columns of nodes.
Создайте массивы структур, чтобы задать цвета маркера и аннотации для двух групп строк (510 и 593) и двух групп столбцов (4 и 5).
rm = struct('GroupNumber',{510,593},'Annotation',{'A','B'},... 'Color',{'b','m'}); cm = struct('GroupNumber',{4,5},'Annotation',{'Time1','Time2'},... 'Color',{[1 1 0],[0.6 0.6 1]});
Используйте RowGroupMarker
и ColumnGroupMarker
свойства добавить цветовые маркеры и аннотации к кластерграмме.
set(cgo_all,'RowGroupMarker',rm,'ColumnGroupMarker',cm)
Следующие списки предопределенные цвета и их эквиваленты триплета RGB. Краткие названия и длинные имена являются векторами символов, которые задают один из восьми предварительно установленных цветов. Триплет RGB является трехэлементным вектором-строкой, элементы которого задают интенсивность красных, зеленых, и синих компонентов цвета; интенсивность должна быть в области значений [0 1].
Триплет RGB | Краткое название | Длинное имя |
---|---|---|
[1 1 0] |
|
|
[1 0 1] |
|
|
[0 1 1] |
|
|
[1 0 0] |
|
|
[0 1 0] |
|
|
[0 0 1] |
|
|
[1 1 1] |
|
|
[0 0 0] |
|
|
[1] DeRisi, J. L. “Исследуя Метаболическое и Генетическое Управление Экспрессии гена по Геномной Шкале”. Наука 278, № 5338 (24 октября 1997): 680–86.
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.