addK

Класс: clustering.evaluation.ClusterCriterion
Пакет: clustering.evaluation

Оцените дополнительные количества кластеров

Синтаксис

eva_out = addK(eva,klist)

Описание

eva_out = addK(eva,klist) возвращает кластеризирующийся объект eva_out оценки это содержит данные об оценке, хранимые во входном объекте eva, плюс дополнительные данные об оценке для предложенного количества кластеров, заданных в klist.

Входные параметры

развернуть все

Кластеризация данных об оценке, заданных как кластеризирующийся объект оценки. Создайте кластеризирующийся объект оценки использование evalclusters.

Дополнительные количества кластеров, чтобы оценить, заданный как вектор положительных целочисленных значений. Если любые значения в klist наложитесь с решениями по кластеризации, уже оцененными во входном объекте eva, затем addK игнорирует перекрывающиеся значения.

Выходные аргументы

развернуть все

Обновленные данные об оценке кластеризации, возвращенные как кластеризирующийся объект оценки. eva_out содержит данные по предложенным решениям по кластеризации, включенным во вход, кластеризирующий объект eva оценки, плюс данные по дополнительным предложенным количествам кластеров, заданных в klist.

Для всех классов объектов оценки кластеризации, addK обновляет InspectedK и CriterionValues свойства включать предложенные решения по кластеризации, заданные в klist и их соответствующие значения критерия. addK может также обновить OptimalK и OptimalY свойства отразить новое оптимальное количество кластеров и оптимальное решение по кластеризации.

Поскольку определенная кластерная оценка возражает классам, addK может также обновить следующие значения дополнительного свойства:

  • Для объектов оценки разрыва — LogW, ExpectedLogW, StdLogW, и SE

  • Для объектов оценки контура — ClusterSilhouettes

Примеры

развернуть все

Создайте кластеризирующийся объект оценки использование evalclusters, затем используйте addK оценивать дополнительные количества кластеров.

Загрузите выборочные данные.

load fisheriris

Данные содержат измерения длины и ширины от чашелистиков и лепестков трех разновидностей ирисовых цветов.

Кластеризируйте цветочные данные об измерении с помощью kmeans, и используйте критерий Calinski-Harabasz, чтобы оценить предлагаемые решения одного - пяти кластеров.

eva = evalclusters(meas,'kmeans','calinski','klist',1:5)
eva = 
  CalinskiHarabaszEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [NaN 513.9245 561.6278 530.4871 456.1279]
           OptimalK: 3

Кластеризирующийся объект eva оценки содержит данные по каждому предложенному решению по кластеризации. Возвращенное значение OptimalK указывает, что оптимальное решение является тремя кластерами.

Оцените предлагаемые решения 6 - 10 кластеров с помощью тех же критериев. Добавьте эти оценки в исходный объект eva оценки кластеризации.

eva = addK(eva,6:10)
eva = 
  CalinskiHarabaszEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5 6 7 8 9 10]
    CriterionValues: [1x10 double]
           OptimalK: 3

Обновленные значения для InspectedK и CriterionValues покажите тот eva теперь оценивает предлагаемые решения 1 - 10 кластеров. OptimalK значение все еще равняется 3, указание, что три кластера остаются оптимальное решение.