addK

Класс: clustering.evaluation.ClusterCriterion
Пакет: clustering.evaluation

Оцените дополнительные количества кластеров

Синтаксис

eva_out = addK(eva,klist)

Описание

eva_out = addK(eva,klist) возвращает кластеризирующийся объект eva_out оценки это содержит данные об оценке, хранимые во входном объекте eva, плюс дополнительные данные об оценке для предложенного количества кластеров, заданных в klist.

Входные параметры

развернуть все

Кластеризация данных об оценке в виде кластеризирующегося объекта оценки. Создайте кластеризирующееся использование объекта оценки evalclusters.

Дополнительные количества кластеров, чтобы оценить в виде вектора из положительных целочисленных значений. Если любые значения в klist перекройтесь с решениями по кластеризации, уже оцененными во входном объекте eva, затем addK игнорирует перекрывающиеся значения.

Выходные аргументы

развернуть все

Обновленные данные об оценке кластеризации, возвращенные как кластеризирующийся объект оценки. eva_out содержит данные по предложенным решениям по кластеризации, включенным во вход, кластеризирующий объект eva оценки, плюс данные по дополнительным предложенным количествам кластеров, заданных в klist.

Для всех классов объектов оценки кластеризации, addK обновляет InspectedK и CriterionValues свойства включать предложенные решения по кластеризации, заданные в klist и их соответствующие значения критерия. addK может также обновить OptimalK и OptimalY свойства отразить новое оптимальное количество кластеров и оптимальное решение по кластеризации.

Поскольку определенная кластерная оценка возражает классам, addK может также обновить следующие значения дополнительного свойства:

  • Для объектов оценки разрыва — LogW, ExpectedLogW, StdLogW, и SE

  • Для объектов оценки контура — ClusterSilhouettes

Примеры

развернуть все

Создайте кластеризирующийся объект оценки использование evalclusters, затем используйте addK оценивать дополнительные количества кластеров.

Загрузите выборочные данные.

load fisheriris

Данные содержат измерения длины и ширины от чашелистиков и лепестков трех разновидностей ирисовых цветов.

Кластеризируйте цветочные данные об измерении с помощью kmeans, и используйте критерий Calinski-Harabasz, чтобы оценить предлагаемые решения одного - пяти кластеров.

eva = evalclusters(meas,'kmeans','calinski','klist',1:5)
eva = 
  CalinskiHarabaszEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [NaN 513.9245 561.6278 530.4871 456.1279]
           OptimalK: 3

Кластеризирующийся объект eva оценки содержит данные по каждому предложенному решению по кластеризации. Возвращенное значение OptimalK указывает, что оптимальное решение является тремя кластерами.

Оцените предлагаемые решения 6 - 10 кластеров с помощью тех же критериев. Добавьте эти оценки в исходный объект eva оценки кластеризации.

eva = addK(eva,6:10)
eva = 
  CalinskiHarabaszEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5 6 7 8 9 10]
    CriterionValues: [NaN 513.9245 561.6278 530.4871 456.1279 469.5068 ... ]
           OptimalK: 3

Обновленные значения для InspectedK и CriterionValues покажите тот eva теперь оценивает предлагаемые решения 1 - 10 кластеров. OptimalK значение все еще равняется 3, указание, что три кластера остаются оптимальное решение.