Создайте разрыв, кластеризирующий объект оценки использование evalclusters
, затем используйте increaseB
увеличивать число наборов справочных данных использовалось для расчета значений критерия разрыва.
Загрузите выборочные данные.
Данные содержат измерения длины и ширины от чашелистиков и лепестков трех разновидностей ирисовых цветов.
Кластеризируйте цветочные данные об измерении с помощью kmeans
, и используйте критерий разрыва, чтобы оценить предлагаемые решения одного - пяти кластеров. Используйте 50 наборов справочных данных.
eva =
GapEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5]
CriterionValues: [0.0870 0.5822 0.8766 1.0007 1.0465]
OptimalK: 4
Кластеризирующийся объект eva
оценки
содержит данные по каждому предложенному решению по кластеризации. Возвращенные результаты показывают, что оптимальное количество кластеров равняется четырем.
Значение B
свойство eva
показывает 50 наборов справочных данных.
Увеличьте число наборов справочных данных 100 для в общей сложности 150 наборов.
eva =
GapEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5]
CriterionValues: [0.0794 0.5850 0.8738 1.0034 1.0508]
OptimalK: 5
Возвращенные результаты теперь показывают, что оптимальное количество кластеров равняется пяти.
Значение B
свойство eva
теперь показывает 150 наборов справочных данных.