Создайте кластеризирующийся объект оценки использование evalclusters
, затем используйте addK
, чтобы оценить дополнительные количества кластеров.
Загрузите выборочные данные.
Данные содержат измерения длины и ширины от чашелистиков и лепестков трех разновидностей ирисовых цветов.
Кластеризируйте цветочные данные об измерении с помощью kmeans
и используйте критерий Calinski-Harabasz, чтобы оценить предлагаемые решения одного - пяти кластеров.
eva =
CalinskiHarabaszEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5]
CriterionValues: [NaN 513.9245 561.6278 530.4871 456.1279]
OptimalK: 3
Кластеризирующийся объект eva
оценки содержит данные по каждому предложенному решению по кластеризации. Возвращенное значение OptimalK
указывает, что оптимальное решение является тремя кластерами.
Оцените предлагаемые решения 6 - 10 кластеров с помощью тех же критериев. Добавьте эти оценки в исходный объект eva
оценки кластеризации.
eva =
CalinskiHarabaszEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5 6 7 8 9 10]
CriterionValues: [1x10 double]
OptimalK: 3
Обновленные значения для InspectedK
и CriterionValues
показывают, что eva
теперь оценивает предлагаемые решения 1 - 10 кластеров. Значение OptimalK
все еще равняется 3
, указывая, что три кластера остаются оптимальное решение.