cophenet

Коэффициент корреляции Cophenetic

Синтаксис

c = cophenet(Z,Y)
[c,d] = cophenet(Z,Y)

Описание

c = cophenet(Z,Y) вычисляет cophenetic коэффициент корреляции для иерархического кластерного дерева, представленного Z. Z является вывод функции linkage. Y содержит расстояния, или несходства раньше создавали Z, как выведено функцией pdist. Z является матрицей размера (m–1)-by-3 с информацией о расстоянии в третьем столбце. Y является вектором размера m* (m –1)/2.

[c,d] = cophenet(Z,Y) возвращает cophenetic расстояния d в том же нижнем треугольном векторном формате расстояния как Y.

cophenetic корреляция для кластерного дерева задана как коэффициент линейной корреляции между cophenetic расстояниями, полученными из дерева, и исходные расстояния (или несходства) раньше создавали дерево. Таким образом это - мера того, как искренне дерево представляет несходства среди наблюдений.

cophenetic расстояние между двумя наблюдениями представлено в древовидной схеме высотой ссылки, в которой сначала соединяют к тем двум наблюдениям. Та высота является расстоянием между двумя подкластерами, которые объединены той ссылкой.

Выходное значение, c, является cophenetic коэффициентом корреляции. Значение этого значения должно быть очень близко к 1 для высококачественного решения. Эта мера может использоваться, чтобы сравнить альтернативные кластерные решения, полученные с помощью различных алгоритмов.

cophenetic корреляция между Z(:,3) и Y задана как

c=i<j(Yijy)(Zijz)i<j(Yijy)2i<j(Zijz)2

где:

  • Y ij является расстоянием между объектами i и j в Y.

  • Z ij является cophenetic расстоянием между объектами i и j от Z(:,3).

  • y и z являются средним значением Y и Z(:,3), соответственно.

Примеры

X = [rand(10,3); rand(10,3)+1; rand(10,3)+2];
Y = pdist(X);
Z = linkage(Y,'average');

% Compute Spearman's rank correlation between the
% dissimilarities and the cophenetic distances
[c,D] = cophenet(Z,Y);
r = corr(Y',D','type','spearman')
r =
   0.8279 

Смотрите также

| | | | |

Представлено до R2006a