Коэффициент корреляции Cophenetic
c = cophenet(Z,Y)
[c,d] = cophenet(Z,Y)
c = cophenet(Z,Y) вычисляет cophenetic коэффициент корреляции для иерархического кластерного дерева, представленного ZZ выход linkage функция. Y содержит расстояния, или несходства раньше создавали Z, как выведено pdist функция. Z матрица размера (m–1)-by-3, с информацией о расстоянии в третьем столбце. Y вектор из размера m* (m –1)/2.
[c,d] = cophenet(Z,Y) возвращает cophenetic расстояния d в том же нижнем треугольном векторном формате расстояния как Y.
cophenetic корреляция для кластерного дерева задана как коэффициент линейной корреляции между cophenetic расстояниями, полученными из дерева, и исходные расстояния (или несходства) раньше создавали дерево. Таким образом это - мера того, как искренне дерево представляет несходства среди наблюдений.
cophenetic расстояние между двумя наблюдениями представлено в древовидной схеме высотой ссылки, в которой сначала соединяют к тем двум наблюдениям. Та высота является расстоянием между двумя подкластерами, которые объединены той ссылкой.
Выходное значение, c, cophenetic коэффициент корреляции. Величина этого значения должна быть очень близко к 1 для высококачественного решения. Эта мера может использоваться, чтобы сравнить альтернативные кластерные решения, полученные с помощью различных алгоритмов.
cophenetic корреляция между Z(:,3) и Y задан как
где:
Y ij является расстоянием между объектами i и j в Y.
Z ij является cophenetic расстоянием между объектами i и j от Z(:,3).
y и z являются средним значением Y и Z(:,3), соответственно.
X = [rand(10,3); rand(10,3)+1; rand(10,3)+2]; Y = pdist(X); Z = linkage(Y,'average'); % Compute Spearman's rank correlation between the % dissimilarities and the cophenetic distances [c,D] = cophenet(Z,Y); r = corr(Y',D','type','spearman') r = 0.8279
cluster | dendrogram | inconsistent | linkage | pdist | squareform