addK

Класс: clustering.evaluation. ClusterCriterion
Пакет: clustering.evaluation

Оцените дополнительные количества кластеров

Синтаксис

eva_out = addK(eva,klist)

Описание

eva_out = addK(eva,klist) возвращает кластеризирующийся объект eva_out оценки, который содержит данные об оценке, хранимые во входном объекте eva плюс дополнительные данные об оценке для предложенного количества кластеров, заданных в klist.

Входные параметры

развернуть все

Кластеризация данных об оценке, заданных как кластеризирующийся объект оценки. Создайте кластеризирующийся объект оценки использование evalclusters.

Дополнительные количества кластеров, чтобы оценить, заданный как вектор положительных целочисленных значений. Если какие-либо значения в перекрытии klist с решениями по кластеризации уже оценили во входном объекте eva, то addK игнорирует перекрывающиеся значения.

Выходные аргументы

развернуть все

Обновленные данные об оценке кластеризации, возвращенные как кластеризирующийся объект оценки. eva_out содержит данные по предложенным решениям по кластеризации, включенным во вход, кластеризирующий объект eva оценки плюс данные по дополнительным предложенным количествам кластеров, заданных в klist.

Для всех классов объектов оценки кластеризации addK обновляет свойства InspectedK и CriterionValues включать предложенные решения по кластеризации, заданные в klist и их соответствующие значения критерия. addK может также обновить свойства OptimalK и OptimalY отразить новое оптимальное количество кластеров и оптимальное решение по кластеризации.

Для определенных кластерных классов объектов оценки addK может также обновить следующие значения дополнительного свойства:

  • Для объектов оценки разрыва — LogW, ExpectedLogW, StdLogW и SE

  • Для объектов оценки контура — ClusterSilhouettes

Примеры

развернуть все

Создайте кластеризирующийся объект оценки использование evalclusters, затем используйте addK, чтобы оценить дополнительные количества кластеров.

Загрузите выборочные данные.

load fisheriris

Данные содержат измерения длины и ширины от чашелистиков и лепестков трех разновидностей ирисовых цветов.

Кластеризируйте цветочные данные об измерении с помощью kmeans и используйте критерий Calinski-Harabasz, чтобы оценить предлагаемые решения одного - пяти кластеров.

eva = evalclusters(meas,'kmeans','calinski','klist',1:5)
eva = 
  CalinskiHarabaszEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [NaN 513.9245 561.6278 530.4871 456.1279]
           OptimalK: 3

Кластеризирующийся объект eva оценки содержит данные по каждому предложенному решению по кластеризации. Возвращенное значение OptimalK указывает, что оптимальное решение является тремя кластерами.

Оцените предлагаемые решения 6 - 10 кластеров с помощью тех же критериев. Добавьте эти оценки в исходный объект eva оценки кластеризации.

eva = addK(eva,6:10)
eva = 
  CalinskiHarabaszEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5 6 7 8 9 10]
    CriterionValues: [1x10 double]
           OptimalK: 3

Обновленные значения для InspectedK и CriterionValues показывают, что eva теперь оценивает предлагаемые решения 1 - 10 кластеров. Значение OptimalK все еще равняется 3, указывая, что три кластера остаются оптимальное решение.