Построение агломерационных кластеров на основе данных
возвращает индексы кластера для каждого наблюдения (строки) матрицы входных данных T = clusterdata(X,cutoff)X, с учетом порогового значения cutoff для разрезания агломеративного иерархического дерева, linkage функция генерирует из X.
clusterdata поддерживает агломерационную кластеризацию и включает в себя pdist, linkage, и cluster функции, которые можно использовать отдельно для более подробного анализа. Дополнительные сведения см. в разделе Описание алгоритма.
Если 'Linkage' является 'centroid' или 'median', то linkage может создать дерево кластера, которое не является монотонным. Этот результат возникает, когда расстояние от объединения двух кластеров, r и s, до третьего кластера меньше, чем расстояние между r и s. В этом случае в дендрограмме, нарисованной с ориентацией по умолчанию, путь от листа к корневому узлу делает некоторые шаги вниз. Чтобы избежать этого результата, укажите другое значение для 'Linkage'. На следующем рисунке показано немонотонное дерево кластера.

В этом случае кластер 1 и кластер 3 объединяются в новый кластер, в то время как расстояние между этим новым кластером и кластером 2 меньше, чем расстояние между кластером 1 и кластером 3.
Если указано значение c для cutoff входной аргумент, затем выполняет следующие шаги:T = clusterdata(X,c)
Создайте вектор евклидова расстояния между парами наблюдений в X с помощью pdist.
Y = pdist(X,'euclidean')
Создание агломеративного иерархического дерева кластера из Y с помощью linkage с 'single' способ вычисления кратчайшего расстояния между кластерами.
Z = linkage(Y,'single')
Если 0 < c < 2, использовать cluster для определения кластеров из Z когда противоречивые значения меньше, чем c.
T = cluster(Z,'Cutoff',c)
Если c - целое значение ≥ 2, использовать cluster чтобы найти максимум c кластеры из Z.
T = cluster(Z,'MaxClust',c)
При наличии иерархического дерева кластера Z (выходные данные linkage функция для матрицы входных данных X), можно использовать cluster для выполнения агломеративной кластеризации на Z и вернуть назначение кластера для каждого наблюдения (строки) в X.
cluster | dendrogram | inconsistent | kmeans | linkage | pdist