exponenta event banner

addK

Класс: clustering.evaluation.ClusterCriterion
Пакет: clustering.evaluation

Оценка дополнительного количества кластеров

Синтаксис

eva_out = addK(eva,klist)

Описание

eva_out = addK(eva,klist) возвращает объект оценки кластеризации eva_out который содержит оценочные данные, сохраненные в объекте ввода eva, плюс дополнительные данные оценки для предлагаемого количества кластеров, указанных в klist.

Входные аргументы

развернуть все

Данные оценки кластеризации, указанные как объект оценки кластеризации. Создание объекта оценки кластеризации с помощью evalclusters.

Дополнительные количества кластеров для вычисления, заданные как вектор положительных целых значений. При наличии значений в klist перекрытие с решениями кластеризации, уже оцененными во входном объекте eva, то addK игнорирует перекрывающиеся значения.

Выходные аргументы

развернуть все

Обновленные данные оценки кластеризации, возвращенные как объект оценки кластеризации. eva_out содержит данные о предлагаемых решениях кластеризации, включенных в объект оценки входной кластеризации eva, плюс данные о дополнительных предлагаемых количествах кластеров, указанных в klist.

Для всех классов объектов оценки кластеризации: addK обновляет InspectedK и CriterionValues для включения предлагаемых решений кластеризации, указанных в klist и соответствующие им значения критериев. addK может также обновить OptimalK и OptimalY свойства для отражения нового оптимального числа кластеров и оптимального решения кластеризации.

Для определенных классов объектов оценки кластера addK может также обновить следующие дополнительные значения свойств:

  • Для объектов анализа разрывов - LogW, ExpectedLogW, StdLogW, и SE

  • Для объектов оценки силуэта - ClusterSilhouettes

Примеры

развернуть все

Создание объекта оценки кластеризации с помощью evalclusters, затем использовать addK для оценки дополнительного количества кластеров.

Загрузите образцы данных.

load fisheriris

Данные содержат измерения длины и ширины по чашелистикам и лепесткам трёх видов цветков радужки.

Кластеризация данных измерений цветка с помощью kmeansи использовать критерий Калински-Харабаша для оценки предлагаемых решений от одного до пяти кластеров.

eva = evalclusters(meas,'kmeans','calinski','klist',1:5)
eva = 
  CalinskiHarabaszEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [Inf 513.9245 561.6278 530.4871 456.1279]
           OptimalK: 1

Объект оценки кластеризации eva содержит данные по каждому предлагаемому решению кластеризации. Возвращенное значение OptimalK указывает, что оптимальным решением являются три кластера.

Оценка предлагаемых решений от 6 до 10 кластеров с использованием одних и тех же критериев. Добавление этих оценок в исходный объект оценки кластеризации eva.

eva = addK(eva,6:10)
eva = 
  CalinskiHarabaszEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5 6 7 8 9 10]
    CriterionValues: [1x10 double]
           OptimalK: 1

Обновленные значения для InspectedK и CriterionValues показать, что eva теперь оценивает предлагаемые решения кластеров от 1 до 10. OptimalK значение по-прежнему равно 3, указывая, что три кластера остаются оптимальным решением.