Коэффициент корреляции Cophenetic
c = cophenet(Z,Y)
[c,d] = cophenet(Z,Y)
c = cophenet(Z,Y)
вычисляет cophenetic коэффициент корреляции для иерархического кластерного дерева, представленного Z
Z
выход linkage
функция. Y
содержит расстояния, или несходства раньше создавали Z
, как выведено pdist
функция. Z
матрица размера (m–1)-by-3, с информацией о расстоянии в третьем столбце. Y
вектор из размера m* (m –1)/2.
[c,d] = cophenet(Z,Y)
возвращает cophenetic расстояния d
в том же нижнем треугольном векторном формате расстояния как Y
.
cophenetic корреляция для кластерного дерева задана как коэффициент линейной корреляции между cophenetic расстояниями, полученными из дерева, и исходные расстояния (или несходства) раньше создавали дерево. Таким образом это - мера того, как искренне дерево представляет несходства среди наблюдений.
cophenetic расстояние между двумя наблюдениями представлено в древовидной схеме высотой ссылки, в которой сначала соединяют к тем двум наблюдениям. Та высота является расстоянием между двумя подкластерами, которые объединены той ссылкой.
Выходное значение, c
, cophenetic коэффициент корреляции. Величина этого значения должна быть очень близко к 1 для высококачественного решения. Эта мера может использоваться, чтобы сравнить альтернативные кластерные решения, полученные с помощью различных алгоритмов.
cophenetic корреляция между Z(:,3)
и Y
задан как
где:
Y ij является расстоянием между объектами i и j в Y
.
Z ij является cophenetic расстоянием между объектами i и j от Z(:,3)
.
y и z являются средним значением Y
и Z(:,3)
, соответственно.
X = [rand(10,3); rand(10,3)+1; rand(10,3)+2]; Y = pdist(X); Z = linkage(Y,'average'); % Compute Spearman's rank correlation between the % dissimilarities and the cophenetic distances [c,D] = cophenet(Z,Y); r = corr(Y',D','type','spearman') r = 0.8279
cluster
| dendrogram
| inconsistent
| linkage
| pdist
| squareform