Создайте объект оценки кластеризации с помощью evalclusters
, затем используйте addK
для оценки дополнительного количества кластеров.
Загрузите выборочные данные.
Данные содержат измерения длины и ширины чашелистиков и лепестков трех видов цветков радужки.
Группируйте данные измерений цветов с помощью kmeans
, и использовать критерий Калински-Харабаша для оценки предлагаемых решений от одного до пяти кластеров.
eva =
CalinskiHarabaszEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5]
CriterionValues: [Inf 513.9245 561.6278 530.4871 456.1279]
OptimalK: 1
Объект оценки кластеризации eva
содержит данные по каждому предложенному решению кластеризации. Возвращенное значение OptimalK
указывает, что оптимальным решением является три кластера.
Оцените предлагаемые решения от 6 до 10 кластеров по тем же критериям. Добавьте эти оценки к исходному объекту оценки кластеризации eva
.
eva =
CalinskiHarabaszEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5 6 7 8 9 10]
CriterionValues: [1x10 double]
OptimalK: 1
Обновленные значения для InspectedK
и CriterionValues
показать, что eva
теперь оценивает предлагаемые решения от 1 до 10 кластеров. The OptimalK
значение все еще равняется 3
, что указывает на то, что три кластера остаются оптимальным решением.