Кластерный анализ организует данные в группы на основе общих черт между точками данных. Иногда данные содержат естественные деления, которые указывают на соответствующее количество кластеров. Другие времена, данные не содержат естественные деления, или естественные деления неизвестны. В таком случае вы можете, чтобы определить оптимальное количество кластеров, чтобы сгруппировать ваши данные.
Чтобы определить как хорошо совпадения данных в конкретное количество кластеров, вычислите индексные значения с помощью различных критериев оценки, таких как разрыв или контур. Визуализируйте кластеры путем создания графика древовидной схемы отобразить иерархическое бинарное кластерное дерево. Оптимизируйте листовой порядок максимизировать сумму общих черт между смежными листами. Для сгруппированных данных с несколькими измерениями для каждой группы создайте график древовидной схемы на основе средних значений группы, вычисленных с помощью многомерного дисперсионного анализа (МАНОВА).
CalinskiHarabaszEvaluation | Критерий Calinski-Harabasz, кластеризирующий объект оценки |
DaviesBouldinEvaluation | Критерий Дэвиса-Булдина, кластеризирующий объект оценки |
GapEvaluation | Разорвите критерий, кластеризирующий объект оценки |
SilhouetteEvaluation | Критерий контура, кластеризирующий объект оценки |