Создайте объект оценки кластеризации погрешностей с помощью evalclusters
, затем используйте increaseB
увеличение количества ссылочных наборов данных, используемых для вычисления значений критерия погрешности.
Загрузите выборочные данные.
Данные содержат измерения длины и ширины чашелистиков и лепестков трех видов цветков радужки.
Группируйте данные измерений цветов с помощью kmeans
, и использовать критерий разрыва для оценки предлагаемых решений с одного по пять кластеров. Используйте 50 ссылки данных.
eva =
GapEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5]
CriterionValues: [0.0870 0.5822 0.8766 1.0007 1.0465]
OptimalK: 4
Объект оценки кластеризации eva
содержит данные по каждому предложенному решению кластеризации. Возвращенные результаты показывают, что оптимальное количество кластеров составляет четыре.
Значение B
свойство eva
показывает 50 ссылки данных.
Увеличьте количество ссылок данных на 100, в общей сложности на 150 наборов.
eva =
GapEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5]
CriterionValues: [0.0794 0.5850 0.8738 1.0034 1.0508]
OptimalK: 5
Возвращенные результаты теперь указывают, что оптимальное количество кластеров составляет пять.
Значение B
свойство eva
Теперь показаны 150 ссылки данных.