Создание объекта оценки кластеризации зазоров с помощью evalclusters, затем использовать increaseB для увеличения числа наборов опорных данных, используемых для вычисления значений критерия зазора.
Загрузите образцы данных.
Данные содержат измерения длины и ширины по чашелистикам и лепесткам трёх видов цветков радужки.
Кластеризация данных измерений цветка с помощью kmeansи использовать критерий разрыва для оценки предлагаемых решений от одного до пяти кластеров. Используйте 50 наборов ссылочных данных.
eva =
GapEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5]
CriterionValues: [0.0870 0.5822 0.8766 1.0007 1.0465]
OptimalK: 4
Объект оценки кластеризации eva содержит данные по каждому предлагаемому решению кластеризации. Возвращенные результаты показывают, что оптимальное число кластеров равно четырем.
Значение B имущество eva показаны 50 наборов опорных данных.
Увеличьте количество наборов опорных данных на 100, в общей сложности 150 наборов.
eva =
GapEvaluation with properties:
NumObservations: 150
InspectedK: [1 2 3 4 5]
CriterionValues: [0.0794 0.5850 0.8738 1.0034 1.0508]
OptimalK: 5
Возвращенные результаты теперь показывают, что оптимальное количество кластеров равно пяти.
Значение B имущество eva Теперь показаны 150 наборов ссылочных данных.