addK

Класс: clustering.evaluation.ClusterCriterion
Пакет: clustering.evaluation

Оцените дополнительное количество кластеров

Синтаксис

eva_out = addK(eva,klist)

Описание

eva_out = addK(eva,klist) возвращает объект оценки кластеризации eva_out который содержит оценочные данные, хранящиеся в объекте входа eva, плюс дополнительные данные оценки предлагаемого количества кластеров, указанных в klist.

Входные параметры

расширить все

Оценка данных кластеризации, заданная как объект оценки кластеризации. Создайте объект оценки кластеризации с помощью evalclusters.

Дополнительное количество кластеров для вычисления, заданное как вектор положительных целочисленных значений. Если какие-либо значения в klist перекрытие с решениями кластеризации, уже оцененными в вход объекте eva, затем addK игнорирует перекрывающиеся значения.

Выходные аргументы

расширить все

Обновленные данные оценки кластеризации, возвращенные как объект оценки кластеризации. eva_out содержит данные о предлагаемых решениях кластеризации, включенных в вход объект оценки кластеризации eva, плюс данные о дополнительных предлагаемых количествах кластеров, указанных в klist.

Для всех классов объектов оценки кластеризации, addK обновляет InspectedK и CriterionValues свойства, включающие предлагаемые кластерные решения, указанные в klist и их соответствующие значения критериев. addK может также обновить OptimalK и OptimalY свойства для отражения нового оптимального количества кластеров и оптимального решения кластеризации.

Для некоторых классов объектов оценки кластеров addK можно также обновить следующие значения дополнительного свойства:

  • Для объектов оценки погрешностей - LogW, ExpectedLogW, StdLogW, и SE

  • Для объектов оценки силуэта - ClusterSilhouettes

Примеры

расширить все

Создайте объект оценки кластеризации с помощью evalclusters, затем используйте addK для оценки дополнительного количества кластеров.

Загрузите выборочные данные.

load fisheriris

Данные содержат измерения длины и ширины чашелистиков и лепестков трех видов цветков радужки.

Группируйте данные измерений цветов с помощью kmeans, и использовать критерий Калински-Харабаша для оценки предлагаемых решений от одного до пяти кластеров.

eva = evalclusters(meas,'kmeans','calinski','klist',1:5)
eva = 
  CalinskiHarabaszEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [Inf 513.9245 561.6278 530.4871 456.1279]
           OptimalK: 1

Объект оценки кластеризации eva содержит данные по каждому предложенному решению кластеризации. Возвращенное значение OptimalK указывает, что оптимальным решением является три кластера.

Оцените предлагаемые решения от 6 до 10 кластеров по тем же критериям. Добавьте эти оценки к исходному объекту оценки кластеризации eva.

eva = addK(eva,6:10)
eva = 
  CalinskiHarabaszEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5 6 7 8 9 10]
    CriterionValues: [1x10 double]
           OptimalK: 1

Обновленные значения для InspectedK и CriterionValues показать, что eva теперь оценивает предлагаемые решения от 1 до 10 кластеров. The OptimalK значение все еще равняется 3, что указывает на то, что три кластера остаются оптимальным решением.