Объект, содержащий данные анализа иерархической кластеризации
clustergram функция создает clustergram объект. Объект содержит данные анализа иерархической кластеризации, которые можно просмотреть в тепловой карте и дендрограмме.
cgObj = clustergram( выполняет анализ иерархической кластеризации для значений в data)data. Возвращенный объект кластерграммы cgObj содержит данные анализа и отображает дендрограмму и тепловую карту.
cgObj = clustergram( задает свойства объекта, используя пары имя-значение. Например, data,Name,Value)clustergram(data,'Standardize','column') стандартизирует значения по столбцам данных. Можно указать несколько пар имя-значение. Заключите каждое имя свойства в кавычки.
data - Исходные данныеИсходные данные, указанные как объект DataMatrix или числовая матрица. Обычно, если матрица содержит данные экспрессии генов, каждая строка соответствует гену, а каждая колонка соответствует образцу.
Чтобы задать свойства объекта, используйте аргументы пары имя-значение, разделенные запятыми. Заключите каждое имя свойства в отдельные кавычки.
Пример:cg = clustergram(data,'Colormap',redbluecmap,'Annotate',true)Standardize - Измерение для стандартизации значений данных'none' (по умолчанию) | 'row' | 'column' | 3 | 2 | 1Измерение для стандартизации значений данных, указанное как символьный вектор, строка или положительное целое число. Возможны следующие варианты:
'column' или 1 - Стандартизация по столбцам данных.
'row' или 2 - Стандартизация по строкам данных.
'none' или 3 - Не стандартизируйте.
При указании 'column' или 'row'функция преобразует стандартизированные значения таким образом, что среднее значение равно 0, а стандартное отклонение равно 1 в указанном измерении.
Пример: 'column'
Типы данных: double | char | string
Symmetric - Флажок, чтобы сделать цветовую шкалу тепловой карты симметричной вокруг нуляtrue (по умолчанию) | falseФлажок, чтобы сделать цветовую шкалу тепловой карты симметричной вокруг нуля, указанной как true или false.
Пример: false
Типы данных: logical
ImputeFun - Имя функции или дескриптора функции для расчета отсутствующих данныхИмя дескриптора функции или функции для вычисления отсутствующих данных, указанного как символьный вектор или массив ячеек. Если указан массив ячеек, первый элемент должен быть именем функции или дескриптора функции, а остальные элементы должны быть парами имя-значение, используемыми в качестве входных данных функции. Отсутствующие точки данных окрашены в серый цвет в тепловой карте.
Если точки данных отсутствуют, используйте это свойство для вычисления отсутствующих значений. В противном случае clustergram ошибки функции.
Пример: 'func1'
Типы данных: char
Colormap - Цвета тепловых картredgreencmap (по умолчанию) | matrix | имя дескриптора функциицвета тепловой карты, заданные в виде матрицы из трех столбцов (M-by-3) со значениями красно-зелено-синего цвета (RGB) или именем дескриптора функции, который возвращает карту цветов, например redgreencmap или redbluecmap.
Карта цветов по умолчанию: redgreencmap, в котором красный представляет значения выше среднего, черный представляет среднее, а зеленый представляет значения ниже среднего значения строки (гена) во всех столбцах (образцах).
Пример: redbluecmap
Типы данных: double | char
ColumnLabels - Этикетки столбцов[1x0 double] (по умолчанию) | строковый вектор | массив ячеек символьных векторов | числовой векторМетки столбцов, заданные как строковый вектор, массив ячеек символьных векторов или числовой вектор. Размер вектора должен соответствовать количеству столбцов на входе data.
Если число меток столбцов составляет 200 или более, метки не отображаются на графике кластерграммы.
Пример: ["sample1","sample2","sample3"]
Типы данных: double | string | cell
RowLabels - Метки строк[] (по умолчанию) | строковый вектор | массив ячеек символьных векторов | числовой векторМетки строк, заданные как строковый вектор, массив ячеек символьных векторов или числовой вектор. Размер вектора должен соответствовать количеству строк на входе data.
Если число меток строк составляет 200 или более, метки не отображаются на графике кластерграммы.
Пример: ["gene1","gene2","gene3"]
Типы данных: double | string | cell
ColumnLabelsRotate - Ориентация меток колонн90 (по умолчанию) | числовой скалярОриентация меток столбцов, заданная как числовой скаляр. Задайте значение поворота в градусах (положительные углы вызывают поворот против часовой стрелки).
Пример: 30
Типы данных: double
RowLabelsRotate - Ориентация меток строкОриентация меток строк, заданная как числовой скаляр. Задайте значение поворота в градусах (положительные углы вызывают поворот против часовой стрелки).
Пример: 30
Типы данных: double
Annotate - Флажок для отображения значений данных в тепловой картеfalse (по умолчанию) | trueФлажок для отображения значений данных в тепловой карте, указанный как true или false.
Пример: true
Типы данных: logical
AnnotPrecision - Точность отображения значений данных2 (по умолчанию) | числовой скалярОтображение точности значений данных в тепловой карте, указанных как числовой скаляр. Количество цифр точности по умолчанию: 2.
Пример: 3
Типы данных: double
LabelsWithMarkers - Флажок для отображения цветных маркеров для меток строк и столбцовfalse (по умолчанию) | trueФлажок для отображения цветных маркеров вместо цветного текста для меток строк и столбцов, указанный как true или false.
Пример: true
Типы данных: logical
AnnotColor - Цвет текста отображаемых значений данных'w' (по умолчанию) | символьный вектор | строка | трехэлементный числовой векторЦвет текста отображаемых значений данных в тепловой карте, указанный как символьный вектор, строка или трехэлементный числовой вектор. Например, для использования голубого можно ввести [0 1 1], 'c', "c", "cyan", или 'cyan'. Дополнительные сведения см. в разделе Параметры цвета.
Пример: 'red'
Типы данных: char | string | double
DisplayRange - Отображение диапазона стандартизированных значенийОтображение диапазона стандартизированных значений, заданного как положительный скаляр.
Значение по умолчанию 3означает, что существует изменение цвета для значений между -3 и 3, но значения больше, чем 3 имеют тот же цвет, что и 3, и значения меньше, чем -3 имеют тот же цвет, что и -3.
Например, при указании redgreencmap для 'Colormap' свойство, чистый красный цвет представляет значения, превышающие или равные указанному значению диапазона отображения, а чистый зеленый цвет представляет значения, меньшие или равные отрицательному значению указанного диапазона отображения.
Пример:
3
Типы данных: double
ColumnLabelsColor - Информация о цвете для меток столбцов[] (по умолчанию) | структура | массив структурыПредупреждение
Это свойство будет удалено в следующем выпуске. Набор LabelsWithMarkers кому true для цветных маркеров вместо цветных текстов.
Информация о цвете меток столбцов, заданная как структура или массив структуры.
Для одной структуры необходимо указать следующие поля.
Labels - Массив ячеек символьных векторов, определяющих метки столбцов, перечисленных в ColumnLabels собственность.
Colors - символьный вектор или строка, задающая цвет для меток столбцов. Если это поле пустое, используется цвет по умолчанию (черный).
Для массива структуры необходимо указать один элемент в каждом поле для каждой структуры.
Labels - символьный вектор или строка, указывающая метку столбца, указанную в ColumnLabels собственность.
Colors - символьный вектор или строка, задающая цвет для меток столбцов. Если это поле пустое, используется цвет по умолчанию (черный).
Дополнительные сведения об указании цветов см. в разделе Параметры цвета.
Типы данных: struct
RowLabelsColor - Информация о цвете меток строк[] (по умолчанию) | структура | массив структурыПредупреждение
Это свойство будет удалено в следующем выпуске. Набор LabelsWithMarkers кому true для цветных маркеров вместо цветных текстов.
Информация о цвете меток строк, заданная как структура или массив структуры.
Для одной структуры необходимо указать следующие поля.
Labels - Массив ячеек символьных векторов, задающих метки строк, перечисленные в RowLabels собственность.
Colors - символьный вектор или строка, задающая цвет для меток строк. Если это поле пустое, используется цвет по умолчанию (черный).
Для массива структуры необходимо указать один элемент в каждом поле для каждой структуры.
Labels - символьный вектор или строка, указывающая метку строки, указанную в RowLabels собственность.
Colors - символьный вектор или строка, задающая цвет для меток строк. Если это поле пустое, используется цвет по умолчанию (черный).
Дополнительные сведения об указании цветов см. в разделе Параметры цвета.
Cluster - Измерение для кластеризации данных'all' (по умолчанию) | 1 | 2 | 3 | 'column' | 'row'Измерение для кластеризации данных, указанное как положительное целое число, символьный вектор или строка. Возможны следующие варианты:
'column' или 1 - кластер только по столбцам данных, что приводит к кластеризованным строкам.
'row' или 2 - кластер только по строкам данных, что приводит к кластеризованным столбцам.
'all' или 3 - Кластер по столбцам данных, затем кластер по строкам кластерных данных.
Пример: 2
Типы данных: double | char | string
ColumnGroupMarker - Информация для аннотирования групп столбцовИнформация для аннотирования групп столбцов, заданная как структура или массив структуры.
Если указана одна структура, каждое поле должно содержать массив ячеек элементов. При указании массива структуры каждая структура должна иметь один элемент в каждом поле.
Поля:
GroupNumber - скаляр, указывающий номер группы столбцов для аннотации.
Annotation - символьный вектор, указывающий текст для аннотирования группы столбцов.
Color - символьный вектор или трехэлементный вектор значений RGB, указывающий цвет для маркировки группы столбцов. Дополнительные сведения об указании цветов см. в разделе Параметры цвета. Если это поле пустое, значением по умолчанию является 'blue'.
Типы данных: struct
ColumnPDist - Метрика расстояния для передачи pdist функция'euclidean' (по умолчанию) | символьный вектор | массив ячеекМетрика расстояния для передачи в pdist для вычисления попарных расстояний между столбцами, определяемых как символьный вектор или массив ячеек. Укажите массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковского с показателем степени p, укажите {'minkowski',p}.
Пример: 'jaccard'
Типы данных: char | cell
Dendrogram - Информация о цветовом пороге для передачи dendrogram функцияИнформация о пороговом значении цвета для передачи в dendrogram функция для создания дендрограммного графика, заданного как скалярный, двухэлементный числовой вектор, символьный вектор или клеточный массив символьных векторов. Этот параметр задает 'ColorThreshold' свойство дендрограммного графика. Если указан двухэлементный числовой вектор или массив ячеек, первый элемент предназначен для строк, а второй элемент - для столбцов.
Типы данных: double | cell
DisplayRatio - Отношение пространства, которое занимают дендрограммы строк и столбцов1/5 (по умолчанию) | скаляр между 0 и 1 | двухэлементный векторОтношение пространства, которое занимают дендрограммы строки и столбца относительно тепловой карты, указанное как скаляр между 0 и 1 или двухэлементный вектор. Если указать скаляр, функция использует его как отношение для дендрограмм строк и столбцов. Если задан двухэлементный вектор, функция использует первый элемент для отношения ширины дендрограммы строки к ширине тепловой карты, а второй элемент для отношения высоты дендрограммы столбца к высоте тепловой карты. Второй элемент игнорируется для одномерных кластерграмм.
Пример: 0.5
Типы данных: double
Linkage - Метод связывания для создания иерархического дерева кластера'average' (по умолчанию) | символьный вектор | двухэлементный массив ячеек символьных векторовМетод связывания, переданный linkage создание иерархического дерева кластера для строк и столбцов, заданного как символьный вектор или двухэлементный массив ячеек символьных векторов. При указании массива ячеек функция использует первый элемент для связи между строками и второй элемент для связи между столбцами.
Пример: 'centroid'
Типы данных: char | cell
LogTrans - Флаг для данных преобразования log2false (по умолчанию) | trueФлаг для log2 преобразования данных из естественного масштаба, указанного как true или false.
Пример: true
Типы данных: logical
OptimalLeafOrder - Флаг для расчета оптимального порядка листьевtrue | falseФлаг для вычисления оптимального порядка листьев, который максимизирует сходство между соседними листьями, указанный как true или false. Значение по умолчанию зависит от размера входа data. Если количество строк или столбцов в data превышает 1500, значение по умолчанию: false. В противном случае значением по умолчанию является true.
Отключение расчета оптимального порядка листьев может быть полезно при работе с большими наборами данных, поскольку этот расчет потребляет много памяти и времени.
Пример: true
Типы данных: logical
RowGroupMarker - Информация для аннотирования групп строкИнформация для аннотирования групп строк, заданная как структура или массив структуры.
Если указана одна структура, каждое поле должно содержать массив ячеек элементов. При указании массива структуры каждая структура должна иметь один элемент в каждом поле.
Поля:
GroupNumber - скаляр, указывающий номер группы столбцов для аннотации.
Annotation - символьный вектор, указывающий текст для аннотирования группы столбцов.
Color - символьный вектор или трехэлементный вектор значений RGB, указывающий цвет для маркировки группы столбцов. Дополнительные сведения об указании цветов см. в разделе Параметры цвета. Если это поле пустое, значением по умолчанию является 'blue'.
Типы данных: struct
RowPDist - Метрика расстояния для передачи pdist функция'euclidean' (по умолчанию) | символьный вектор | массив ячеекМетрика расстояния для передачи в pdist для вычисления попарных расстояний между строками, заданных как символьный вектор или массив ячеек. Укажите массив ячеек, если метрика расстояния требует дополнительных аргументов. Например, чтобы использовать расстояние Минковского с показателем степени p, укажите {'minkowski',p}.
Пример: 'jaccard'
Типы данных: char | cell
ShowDendrogram - Флаг для отображения диаграмм дерева дендрограммы с кластерграммой'on' (по умолчанию) | 'off'Флаг для отображения диаграмм дерева дендрограммы с кластерграммой, указанной как 'on' или 'off'.
Пример: 'off'
Типы данных: char
Загрузить данные микрочипов, содержащие уровни экспрессии генов Saccharomyces cerevisiae (дрожжей) во время метаболического перехода от ферментации к дыханию [1].
load filteredyeastdata
Этот файл MAT включает три переменные, которые добавляются в рабочую область MATLAB ®:
- yeastvalues - Матрица данных экспрессии генов Saccharomyces, -_cerevisiae_ во время метаболического сдвига от ферментации к дыханию - genes - Массив ячеек регистрационных номеров GenBank ® для маркировки строк вyeastvalues - times - вектор значений времени для маркировки столбцов в yeastvalues
Создайте объект clustergram для отображения тепловой карты из данных экспрессии генов в первых 30 строках yeastvalues создать матрицу и стандартизировать вдоль строк данных.
cgo = clustergram(yeastvalues(1:30,:),'Standardize','Row')
Clustergram object with 30 rows of nodes and 7 columns of nodes.

Используйте set метод и genes и times векторы для добавления значимых меток строк и столбцов в кластерграмму.
set(cgo,'RowLabels',genes(1:30),'ColumnLabels',times)

Добавьте цветовую панель в кластер, щелкнув значок Insert Colorbar на панели инструментов.
Просмотрите подсказку данных, содержащую значение интенсивности, метку строки и метку столбца для определенной области карты теплопередачи, щелкнув значок Data Cursor на панели инструментов, затем щелкните область на тепловой карте. Чтобы удалить эту подсказку, щелкните ее правой кнопкой мыши и выберите Delete Current Datatip.
Отобразите значения интенсивности для каждой области карты теплопередачи, нажав кнопку Аннотации (Annotate) на панели инструментов. Снова нажмите кнопку Аннотации (Annotate), чтобы удалить значения интенсивности.
Tip: If the amount of data is large enough, the cells within the clustergram are too small to display the intensity annotations. Zoom in to see the intensity annotations.
Удалите диаграммы дерева дендрограмм из рисунка, нажав кнопку Show Dendrogram на панели инструментов. Щелкните его еще раз, чтобы отобразить дендрограммы.
Используйте get метод отображения свойств объекта clustergram, cgo.
get(cgo)
Cluster: 'ALL'
RowPDist: {'Euclidean'}
ColumnPDist: {'Euclidean'}
Linkage: {'Average'}
Dendrogram: {}
OptimalLeafOrder: 1
LogTrans: 0
DisplayRatio: [0.2000 0.2000]
RowGroupMarker: []
ColumnGroupMarker: []
ShowDendrogram: 'on'
Standardize: 'ROW'
Symmetric: 1
DisplayRange: 3
Colormap: [11x3 double]
ImputeFun: []
ColumnLabels: {1x7 cell}
RowLabels: {30x1 cell}
ColumnLabelsRotate: 90
RowLabelsRotate: 0
Annotate: 'off'
AnnotPrecision: 2
AnnotColor: 'w'
ColumnLabelsColor: []
RowLabelsColor: []
LabelsWithMarkers: 0
Измените параметры кластеризации, изменив метод связывания и цвет групп узлов в дендрограмме, связь которых меньше порога 3.
set(cgo,'Linkage','complete','Dendrogram',3)

Поместите курсор на узел ветви в дендрограмме, чтобы выделить (синим цветом) группу, связанную с ней. Нажмите и удерживайте кнопку мыши для отображения подсказки с указанием номера группы и узлов (генов или образцов) в группе.

Щелкните правой кнопкой мыши узел ветви в дендрограмме, чтобы отобразить меню опций.

Доступны следующие опции:
- Set Group Color - изменение цвета группы кластера. - Print Group to Figure - печать группы в окне рисунка. - Копировать группу в новую кластерграмму - копировать группу в новое окно кластерграммы. - Экспортировать группу в рабочую область - создание объекта кластерграммы группы в рабочей области MATLAB. - Экспортировать информацию о группе в рабочую область - создание структуры, содержащей информацию о группе в рабочей области MATLAB. Структура содержит следующие поля:
- GroupNames - массив ячеек символьных векторов, содержащих имена групп строк или столбцов. - RowNodeNames - массив ячеек символьных векторов, содержащих имена узлов строк. - ColumnNodeNames - массив ячеек символьных векторов, содержащих имена узлов столбцов. - ExprValues - матрица M-на-N значений интенсивности, где M и N - количество узлов строк и узлов столбцов соответственно. Если матрица содержит данные экспрессии генов, обычно каждая строка соответствует гену, а каждая колонка соответствует образцу.
Создайте объект кластерграммы для группы 18 в рабочей области MATLAB. Щелкните правой кнопкой мыши группу 18 и выберите Экспортировать группу в рабочую область. В диалоговом окне «Экспорт в рабочую область» введите Group18и нажмите кнопку «ОК».
Используйте view метод просмотра объекта clustergram, Group18.
view(Group18)

Просмотрите все данные экспрессии генов с помощью расходящейся красной и синей карты цветов и стандартизируйте вдоль рядов данных.
cgo_all = clustergram(yeastvalues,'Colormap',redbluecmap,'Standardize','Row')
Clustergram object with 614 rows of nodes and 7 columns of nodes.

Создайте массивы структуры, чтобы задать цвета маркеров и аннотации для двух групп строк (510 и 593) и двух групп столбцов (4 и 5).
rm = struct('GroupNumber',{510,593},'Annotation',{'A','B'},... 'Color',{'b','m'}); cm = struct('GroupNumber',{4,5},'Annotation',{'Time1','Time2'},... 'Color',{[1 1 0],[0.6 0.6 1]});
Используйте RowGroupMarker и ColumnGroupMarker свойства для добавления цветовых маркеров и аннотаций к кластерграмме.
set(cgo_all,'RowGroupMarker',rm,'ColumnGroupMarker',cm)

Ниже перечислены предопределенные цвета и их эквиваленты RGB-триплетов. Краткие и длинные имена являются векторами символов, задающими один из восьми заданных цветов. Триплет RGB представляет собой трехэлементный вектор строки, элементы которого задают интенсивности красной, зеленой и синей составляющих цвета; интенсивности должны находиться в диапазоне [0 1].
Триплет RGB | Краткое имя | Длинное имя |
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
[1] DeRisi, J. L. «Исследование метаболического и генетического контроля экспрессии генов в геномном масштабе». Наука 278, № 5338 (24 октября 1997): 680-86.
Имеется измененная версия этого примера. Открыть этот пример с помощью изменений?
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.