Кофенетический коэффициент корреляции
c = cophenet(Z,Y)
[c,d] = cophenet(Z,Y)
c = cophenet(Z,Y)
вычисляет кофенетический коэффициент корреляции для иерархического дерева кластера, представленного Z
. Z
- выход linkage
функция. Y
содержит расстояния или неоднородности, используемые для построения Z
, как выводится pdist
функция. Z
- матрица размера (m-1) -на-3, с информацией о расстоянии в третьем столбце. Y
является вектором размера m * (m -1 )/2.
[c,d] = cophenet(Z,Y)
возвращает кофенетические расстояния d
в том же формате вектора нижнего треугольного расстояния, что и Y
.
Копенетическая корреляция для дерева кластеров определяется как линейный коэффициент корреляции между копенетическими расстояниями, полученными из дерева, и исходными расстояниями (или неоднородностями), используемыми для построения дерева. Таким образом, это мера того, насколько верно дерево представляет различия между наблюдениями.
Копенетическое расстояние между двумя наблюдениями представлено в дендрограмме высотой ссылки, на котором эти два наблюдения впервые соединены. Эта высота является расстоянием между двумя подкластерами, которые объединяются этой ссылкой.
Выходное значение, c
, - кофенетический коэффициент корреляции. Величина этого значения должна быть очень близка к 1 для высококачественного решения. Эта мера может использоваться, чтобы сравнить альтернативные кластерные решения, полученные с использованием различных алгоритмов.
Кофенетическая корреляция между Z(:,3)
и Y
определяется как
где:
Y ij является расстоянием между объектами i и j в Y
.
Z ij является кофенетическим расстоянием между объектами i и j, от Z(:,3)
.
y и z средние значения Y
и Z(:,3)
, соответственно.
X = [rand(10,3); rand(10,3)+1; rand(10,3)+2]; Y = pdist(X); Z = linkage(Y,'average'); % Compute Spearman's rank correlation between the % dissimilarities and the cophenetic distances [c,D] = cophenet(Z,Y); r = corr(Y',D','type','spearman') r = 0.8279
cluster
| dendrogram
| inconsistent
| linkage
| pdist
| squareform