Пакет: clustering.evaluation
Суперклассы: ClusterCriterion
Объект оценки кластеризации критерия погрешности
GapEvaluation
является объектом, состоящим из выборочных данных, данных кластеризации и значений критерия погрешности, используемых для оценки оптимального количества кластеров. Создайте объект оценки кластеризации критерия погрешности с помощью evalclusters
.
создает объект оценки кластеризации критерия погрешности.eva
= evalclusters(x
,clust
,'Gap')
создает объект оценки кластеризации критерия погрешности с помощью дополнительных опций, заданных одним или несколькими аргументами пары "имя-значение".eva
= evalclusters(x
,clust
,'Gap',Name,Value
)
|
Количество наборов данных, сгенерированных из ссылочного распределения, сохраненных в виде положительного целого значения. |
|
Алгоритм кластеризации, используемый для кластеризации входных данных, хранится как допустимое имя алгоритма кластеризации или указатель на функцию. Если решения кластеризации предусмотрены во входе, |
|
Имя критерия, используемого для оценки кластеризации, сохраненное как допустимое имя критерия. |
|
Значения критериев, соответствующие каждому предложенному количеству кластеров в |
|
Метрика расстояния, используемая для кластеризации данных, сохраненная как допустимое имя метрики расстояния. |
|
Ожидание естественного логарифма W на основе сгенерированных ссылочных данных, сохраненных как вектор скалярных значений. W дисперсия внутри кластера вычисляется с помощью метрики расстояния |
|
Список предложенных кластеров, для которых нужно вычислить значения критериев, сохраненный как вектор положительных целочисленных значений. |
|
Естественный логарифм W на основе входных данных, сохраненный как вектор скалярных значений. W дисперсия внутри кластера вычисляется с помощью метрики расстояния |
|
Логический флаг для исключенных данных, сохраненный как вектор-столбец логических значений. Если |
|
Количество наблюдений в матричной |
|
Оптимальное количество кластеров, сохраненных в виде положительного целого значения. |
|
Оптимальное решение кластеризации, соответствующее |
|
Ссылочный метод генерации данных, сохраненный как допустимое ссылочное имя распределения. |
|
Стандартная ошибка естественного логарифма W относительно ссылочных данных для каждого количества кластеров в |
|
Метод для определения оптимального количества кластеров, сохраненный как допустимое имя метода поиска. |
|
Стандартное отклонение естественного логарифма W относительно эталонных данных для каждого количества кластеров в |
|
Данные, используемые для кластеризации, хранятся как матрица числовых значений. |
increaseB | Увеличьте наборы ссылочных данных |
addK | Оцените дополнительное количество кластеров |
компактный | Компактный объект оценки кластеризации |
график | Постройте графики значений критериев объекта оценки кластеризации |
[1] Тибширани, Р., Г. Вальтер и Т. Хасти. «Оценка количества кластеров в наборе данных через статистику разрыва». Журнал Королевского статистического общества: Серия B. Vol. 63, Part 2, 2001, pp. 411-423.