increaseB

Класс: clustering.evaluation. GapEvaluation
Пакет: clustering.evaluation

Увеличьте наборы справочных данных

Синтаксис

eva_out = increaseB(eva,nref)

Описание

eva_out = increaseB(eva,nref) возвращает критерий разрыва, кластеризирующий объект eva_out оценки, который использует те же критерии оценки в качестве входного объекта eva и дополнительное количество наборов справочных данных, как задано nref.

Входные параметры

развернуть все

Кластеризация данных об оценке, заданных как кластеризирующийся объект оценки. Создайте кластеризирующийся объект оценки использование evalclusters.

Количество дополнительных наборов справочных данных, заданных как положительное целочисленное значение.

Выходные аргументы

развернуть все

Обновленные данные об оценке кластеризации, возвращенные как критерий разрыва, кластеризирующий объект оценки. eva_out содержит полученное использование данных об оценке наборов справочных данных от входного объекта eva плюс много дополнительных наборов справочных данных, как задано в nref.

increaseB обновляет свойство B входного объекта eva, чтобы отразить, что увеличение количества наборов справочных данных раньше вычисляло значения критерия разрыва. increaseB также обновляет свойство CriterionValues со значениями критерия разрыва, вычисленными с помощью общего количества наборов справочных данных. increaseB может также обновить свойства OptimalK и OptimalY отразить оптимальное количество кластеров и оптимальное решение по кластеризации, как определено использование общего количества наборов справочных данных. Кроме того, increaseB может также обновить LogW, ExpectedLogW, StdLogW и свойства SE.

Примеры

развернуть все

Создайте разрыв, кластеризирующий объект оценки использование evalclusters, затем используйте increaseB, чтобы увеличить число наборов справочных данных, используемых, чтобы вычислить значения критерия разрыва.

Загрузите выборочные данные.

load fisheriris

Данные содержат измерения длины и ширины от чашелистиков и лепестков трех разновидностей ирисовых цветов.

Кластеризируйте цветочные данные об измерении с помощью kmeans и используйте критерий разрыва, чтобы оценить предлагаемые решения одного - пяти кластеров. Используйте 50 наборов справочных данных.

rng('default') % For reproducibility
eva = evalclusters(meas,'kmeans','gap','klist',1:5,'B',50)
eva = 
  GapEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [0.0870 0.5822 0.8766 1.0007 1.0465]
           OptimalK: 4

Кластеризирующийся объект eva оценки содержит данные по каждому предложенному решению по кластеризации. Возвращенные результаты показывают, что оптимальное количество кластеров равняется четырем.

Значение свойства B eva показывает 50 наборов справочных данных.

eva.B
ans = 50

Увеличьте число наборов справочных данных 100 для в общей сложности 150 наборов.

eva = increaseB(eva,100)
eva = 
  GapEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [0.0794 0.5850 0.8738 1.0034 1.0508]
           OptimalK: 5

Возвращенные результаты теперь показывают, что оптимальное количество кластеров равняется пяти.

Значение свойства B eva теперь показывает 150 наборов справочных данных.

eva.B
ans = 150

Смотрите также