Кластерная визуализация и оценка

Постройте кластеры данных и оцените оптимальное количество кластеров

Кластерный анализ организует данные в группы на основе общих черт между точками данных. Иногда данные содержат естественные деления, которые указывают на соответствующее количество кластеров. Другие времена, данные не содержат естественные деления, или естественные деления неизвестны. В таком случае вы определяете оптимальное количество кластеров, чтобы сгруппировать ваши данные.

Чтобы определить как хорошо совпадения данных в конкретное количество кластеров, вычислите значения индекса с помощью различных критериев оценки, таких как разрыв или контур. Визуализируйте кластеры путем создания графика древовидной схемы отобразить иерархическое бинарное кластерное дерево. Оптимизируйте листовой порядок максимизировать сумму общих черт между смежными листами. Для сгруппированных данных с несколькими измерениями для каждой группы создайте график древовидной схемы на основе средних значений группы, вычисленных с помощью многомерного дисперсионного анализа (MANOVA).

Функции

развернуть все

dendrogramГрафик древовидной схемы
optimalleaforderОптимальное листовое упорядоченное расположение для иерархической кластеризации
manovaclusterДревовидная схема группы означает кластеры после MANOVA
silhouetteГрафик контура
evalclustersОцените решения по кластеризации
addKОцените дополнительные количества кластеров
compactКомпактный объект оценки кластеризации
increaseBУвеличьте наборы справочных данных
plot Постройте кластеризирующиеся значения критерия объекта оценки

Классы

CalinskiHarabaszEvaluationКритерий Calinski-Harabasz, кластеризирующий объект оценки
DaviesBouldinEvaluationКритерий Дэвиса-Булдина, кластеризирующий объект оценки
GapEvaluationРазорвите критерий, кластеризирующий объект оценки
SilhouetteEvaluationКритерий контура, кластеризирующий объект оценки

Темы

Кластерная оценка

В этом примере показано, как идентифицировать кластеры при помощи evalclusters.