increaseB

Класс: clustering.evaluation.GapEvaluation
Пакет: clustering.evaluation

Увеличьте наборы ссылочных данных

Синтаксис

eva_out = increaseB(eva,nref)

Описание

eva_out = increaseB(eva,nref) возвращает объект оценки кластеризации критерия погрешности eva_out который использует те же критерии оценки, что и входной объект eva и дополнительное количество эталонных наборов данных, заданное nref.

Входные параметры

расширить все

Оценка данных кластеризации, заданная как объект оценки кластеризации. Создайте объект оценки кластеризации с помощью evalclusters.

Количество дополнительных наборов ссылочных данных, заданное как положительное целое значение.

Выходные аргументы

расширить все

Обновленные данные оценки кластеризации, возвращенные как объект оценки кластеризации критерия разрыва. eva_out содержит оценочные данные, полученные с помощью ссылки наборов данных из объекта входа eva плюс ряд дополнительных ссылок данных, как указано в nref.

increaseB обновляет B свойство входного объекта eva для отражения увеличения количества ссылочных наборов данных, используемых для вычисления значений критерия погрешности. increaseB также обновляет CriterionValues свойство со значениями критерия погрешности, вычисленными с использованием общего количества ссылочных наборов данных. increaseB может также обновить OptimalK и OptimalY свойства для отражения оптимального количества кластеров и оптимального решения кластеризации, как определено с использованием общего количества ссылочных наборов данных. Кроме того, increaseB может также обновить LogW, ExpectedLogW, StdLogW, и SE свойства.

Примеры

расширить все

Создайте объект оценки кластеризации погрешностей с помощью evalclusters, затем используйте increaseB увеличение количества ссылочных наборов данных, используемых для вычисления значений критерия погрешности.

Загрузите выборочные данные.

load fisheriris

Данные содержат измерения длины и ширины чашелистиков и лепестков трех видов цветков радужки.

Группируйте данные измерений цветов с помощью kmeans, и использовать критерий разрыва для оценки предлагаемых решений с одного по пять кластеров. Используйте 50 ссылки данных.

rng('default') % For reproducibility
eva = evalclusters(meas,'kmeans','gap','klist',1:5,'B',50)
eva = 
  GapEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [0.0870 0.5822 0.8766 1.0007 1.0465]
           OptimalK: 4

Объект оценки кластеризации eva содержит данные по каждому предложенному решению кластеризации. Возвращенные результаты показывают, что оптимальное количество кластеров составляет четыре.

Значение B свойство eva показывает 50 ссылки данных.

eva.B
ans = 50

Увеличьте количество ссылок данных на 100, в общей сложности на 150 наборов.

eva = increaseB(eva,100)
eva = 
  GapEvaluation with properties:

    NumObservations: 150
         InspectedK: [1 2 3 4 5]
    CriterionValues: [0.0794 0.5850 0.8738 1.0034 1.0508]
           OptimalK: 5

Возвращенные результаты теперь указывают, что оптимальное количество кластеров составляет пять.

Значение B свойство eva Теперь показаны 150 ссылки данных.

eva.B
ans = 150

См. также