Создайте кластеризирующийся объект оценки использование evalclusters
, затем используйте addK
оценивать дополнительные количества кластеров.
Загрузите выборочные данные.
Данные содержат измерения длины и ширины от чашелистиков и лепестков трех разновидностей ирисовых цветов.
Кластеризируйте цветочные данные об измерении с помощью kmeans
, и используйте критерий Calinski-Harabasz, чтобы оценить предлагаемые решения одного - пяти кластеров.
eva =
CalinskiHarabaszEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5]
CriterionValues: [NaN 513.9245 561.6278 530.4871 456.1279]
OptimalK: 3
Кластеризирующийся объект eva
оценки
содержит данные по каждому предложенному решению по кластеризации. Возвращенное значение OptimalK
указывает, что оптимальное решение является тремя кластерами.
Оцените предлагаемые решения 6 - 10 кластеров с помощью тех же критериев. Добавьте эти оценки в исходный объект eva
оценки кластеризации
.
eva =
CalinskiHarabaszEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5 6 7 8 9 10]
CriterionValues: [NaN 513.9245 561.6278 530.4871 456.1279 469.5068 ... ]
OptimalK: 3
Обновленные значения для InspectedK
и CriterionValues
покажите тот eva
теперь оценивает предлагаемые решения 1 - 10 кластеров. OptimalK
значение все еще равняется 3
, указание, что три кластера остаются оптимальное решение.