Пакет: clustering.evaluation
Суперклассы: ClusterCriterion
Объект оценки кластеризации критериев разрыва
GapEvaluation является объектом, состоящим из данных выборки, данных кластеризации и значений критерия разрыва, используемых для оценки оптимального количества кластеров. Создание объекта оценки кластеризации критериев разрыва с помощью evalclusters.
создает объект оценки кластеризации критериев разрыва.eva = evalclusters(x,clust,'Gap')
создает объект оценки кластеризации критерия разрыва с использованием дополнительных параметров, заданных одним или несколькими аргументами пары имя-значение.eva = evalclusters(x,clust,'Gap',Name,Value)
|
Количество наборов данных, созданных из справочного распределения, сохраненных как положительное целое значение. |
|
Алгоритм кластеризации, используемый для кластеризации входных данных, хранящихся как допустимое имя алгоритма кластеризации или дескриптор функции. Если решения кластеризации представлены на входе, |
|
Имя критерия, используемого для оценки кластеризации, сохраненное как допустимое имя критерия. |
|
Значения критериев, соответствующие каждому предложенному количеству кластеров в |
|
Метрика расстояния, используемая для кластеризации данных, сохраненная как допустимое имя метрики расстояния. |
|
Ожидание натурального логарифма W на основе сгенерированных опорных данных, хранящихся в виде вектора скалярных значений. W - дисперсия внутри кластера, вычисленная с использованием метрики расстояния. |
|
Список количества предлагаемых кластеров, для которых вычисляются значения критериев, хранящихся в виде вектора положительных целых значений. |
|
Натуральный логарифм W на основе входных данных, хранящихся как вектор скалярных значений. W - дисперсия внутри кластера, вычисленная с использованием метрики расстояния. |
|
Логический флаг для исключенных данных, хранящийся в виде вектора столбца логических значений. Если |
|
Количество наблюдений в матрице данных |
|
Оптимальное количество кластеров, хранящихся как положительное целое значение. |
|
Оптимальное решение для кластеризации, соответствующее |
|
Метод формирования ссылочных данных, сохраненный как допустимое имя ссылочного распределения. |
|
Стандартная ошибка натурального логарифма W относительно опорных данных для каждого числа кластеров в |
|
Способ определения оптимального количества кластеров, сохраненный в качестве действительного имени метода поиска. |
|
Стандартное отклонение натурального логарифма W от эталонных данных для каждого числа кластеров в |
|
Данные, используемые для кластеризации, хранятся в виде матрицы числовых значений. |
| increaseB | Увеличить наборы ссылочных данных |
| addK | Оценка дополнительного количества кластеров |
| компактный | Компактный объект оценки кластеризации |
| график | Печать значений критериев объекта оценки кластеризации |
[1] Тибширани, Р., Г. Уолтер и Т. Хасти. «Оценка количества кластеров в наборе данных с помощью статистики разрыва». Журнал Королевского статистического общества: Серия B. Том 63, Часть 2, 2001, стр. 411-423.