exponenta event banner

Визуализация и оценка кластеров

Построение графиков кластеров данных и оценка оптимального количества кластеров

Кластерный анализ объединяет данные в группы на основе сходства точек данных. Иногда данные содержат естественные деления, которые указывают на соответствующее количество кластеров. В других случаях данные не содержат естественных делений, или естественные деления неизвестны. В этом случае определяется оптимальное количество кластеров для группирования данных.

Чтобы определить, насколько хорошо данные помещаются в определенное количество кластеров, вычислите значения индекса с использованием различных критериев оценки, таких как разрыв или силуэт. Визуализация кластеров путем создания графика дендрограммы для отображения иерархического двоичного дерева кластеров. Оптимизируйте порядок листьев, чтобы максимизировать сумму сходств между соседними листьями. Для сгруппированных данных с несколькими измерениями для каждой группы создайте график дендрограммы на основе значения группы, вычисленного с использованием многомерного дисперсионного анализа (MANOVA).

Функции

развернуть все

dendrogramДендрограммный график
optimalleaforderОптимальный порядок листьев для иерархической кластеризации
manovaclusterДендрограмма групповых средних кластеров после MANOVA
silhouetteСилуэтный участок
evalclustersОценка решений кластеризации
addKОценка дополнительного количества кластеров
compactКомпактный объект оценки кластеризации
increaseBУвеличить наборы ссылочных данных
plot Печать значений критериев объекта оценки кластеризации

Классы

CalinskiHarabaszEvaluationОбъект оценки кластеризации критериев Калинского-Харабаша
DaviesBouldinEvaluationОбъект оценки кластеризации критериев Дейвиса-Булдина
GapEvaluationОбъект оценки кластеризации критериев разрыва
SilhouetteEvaluationОбъект оценки кластеризации критериев силуэта

Темы

Кластерная оценка

В этом примере показано, как идентифицировать кластеры с помощью evalclusters.