Кофенетический коэффициент корреляции
c = cophenet(Z,Y)
[c,d] = cophenet(Z,Y)
c = cophenet(Z,Y) вычисляет кофенетический коэффициент корреляции для иерархического дерева кластера, представленного Z. Z - выход linkage функция. Y содержит расстояния или неоднородности, используемые для построения Z, как выводится pdist функция. Z - матрица размера (m-1) -на-3, с информацией о расстоянии в третьем столбце. Y является вектором размера m * (m -1 )/2.
[c,d] = cophenet(Z,Y) возвращает кофенетические расстояния d в том же формате вектора нижнего треугольного расстояния, что и Y.
Копенетическая корреляция для дерева кластеров определяется как линейный коэффициент корреляции между копенетическими расстояниями, полученными из дерева, и исходными расстояниями (или неоднородностями), используемыми для построения дерева. Таким образом, это мера того, насколько верно дерево представляет различия между наблюдениями.
Копенетическое расстояние между двумя наблюдениями представлено в дендрограмме высотой ссылки, на котором эти два наблюдения впервые соединены. Эта высота является расстоянием между двумя подкластерами, которые объединяются этой ссылкой.
Выходное значение, c, - кофенетический коэффициент корреляции. Величина этого значения должна быть очень близка к 1 для высококачественного решения. Эта мера может использоваться, чтобы сравнить альтернативные кластерные решения, полученные с использованием различных алгоритмов.
Кофенетическая корреляция между Z(:,3) и Y определяется как
где:
Y ij является расстоянием между объектами i и j в Y.
Z ij является кофенетическим расстоянием между объектами i и j, от Z(:,3).
y и z средние значения Y и Z(:,3), соответственно.
X = [rand(10,3); rand(10,3)+1; rand(10,3)+2]; Y = pdist(X); Z = linkage(Y,'average'); % Compute Spearman's rank correlation between the % dissimilarities and the cophenetic distances [c,D] = cophenet(Z,Y); r = corr(Y',D','type','spearman') r = 0.8279
cluster | dendrogram | inconsistent | linkage | pdist | squareform