Кофенетический коэффициент корреляции
c = cophenet(Z,Y)
[c,d] = cophenet(Z,Y)
c = cophenet(Z,Y) вычисляет коэффициент кофенетической корреляции для иерархического дерева кластера, представленного Z. Z - выходной сигнал linkage функция. Y содержит расстояния или различия, используемые для построения Z, в качестве выходных данных pdist функция. Z является матрицей размера (m-1) -by-3, с информацией о расстояниях в третьем столбце .Y является вектором размера m * (m-1 )/2.
[c,d] = cophenet(Z,Y) возвращает кофенетические расстояния d в том же формате вектора нижнего треугольного расстояния, что и Y.
Кофенетическая корреляция для дерева кластера определяется как коэффициент линейной корреляции между кофенетическими расстояниями, полученными из дерева, и исходными расстояниями (или разнородностями), используемыми для построения дерева. Таким образом, это мера того, насколько верно дерево представляет различия между наблюдениями.
Кофенетическое расстояние между двумя наблюдениями представлено в дендрограмме высотой звена, на котором эти два наблюдения сначала соединяются. Эта высота представляет собой расстояние между двумя подкластерами, объединенными этой связью.
Выходное значение, c, - коэффициент кофенетической корреляции. Величина этого значения должна быть очень близка к 1 для высококачественного решения. Эта мера может использоваться для сравнения альтернативных кластерных решений, полученных с использованием различных алгоритмов.
Кофенетическая корреляция между Z(:,3) и Y определяется как
2∑i<j (Zij − z) 2
где:
Yij - расстояние между объектами i и j в Y.
Zij - кофенетическое расстояние между объектами i и j, от Z(:,3).
y и z - среднее значение Y и Z(:,3)соответственно.
X = [rand(10,3); rand(10,3)+1; rand(10,3)+2]; Y = pdist(X); Z = linkage(Y,'average'); % Compute Spearman's rank correlation between the % dissimilarities and the cophenetic distances [c,D] = cophenet(Z,Y); r = corr(Y',D','type','spearman') r = 0.8279
cluster | dendrogram | inconsistent | linkage | pdist | squareform