противоречивый

Коэффициент несоответствия

Синтаксис

Y = inconsistent(Z)
Y = inconsistent(Z,d)

Описание

пример

Y = inconsistent(Z) возвращает коэффициент несоответствия для каждой ссылки иерархического кластерного древовидного Z, сгенерированного функцией linkage. inconsistent вычисляет коэффициент несоответствия для каждой ссылки путем сравнения ее высоты со средней высотой других ссылок на том же уровне иерархии. Чем больше коэффициент, тем больше различие между объектами, соединенными ссылкой. Для получения дополнительной информации см. Алгоритмы.

пример

Y = inconsistent(Z,d) возвращает коэффициент несоответствия для каждой ссылки в древовидном Z путем поиска на глубину d ниже каждой ссылки.

Примеры

свернуть все

Исследуйте содействующее вычисление несоответствия на иерархическое кластерное дерево.

Загрузите набор данных examgrades.

load examgrades

Создайте иерархическое кластерное дерево.

Z = linkage(grades);

Создайте матрицу информации о коэффициенте несоответствия с помощью inconsistent. Исследуйте информацию на 84-ю ссылку.

Y = inconsistent(Z);
Y(84,:)
ans = 1×4

    7.2741    0.3624    3.0000    0.5774

Четвертый столбец Y содержит коэффициент несоответствия, который вычисляется с помощью среднего значения в первом столбце Y и стандартного отклонения во втором столбце Y.

Поскольку строки Y соответствуют строкам Z, исследуют 84-ю ссылку в Z.

Z(84,:)
ans = 1×3

  190.0000  203.0000    7.4833

84-я ссылка соединяет 190-е и 203-и кластеры в дереве и имеет высоту 7.4833. 190-й кластер соответствует ссылке индекса 190-120=70, где 120 количество наблюдений. 203-й кластер соответствует 83-й ссылке.

По умолчанию inconsistent использует два уровня дерева, чтобы вычислить Y. Поэтому это использует только 70-е, 83-и, и 84-е ссылки, чтобы вычислить коэффициент несоответствия для 84-й ссылки. Сравните значения в Y(84,:) с соответствующими вычислениями при помощи высот ссылки в Z.

mean84 = mean([Z(70,3) Z(83,3) Z(84,3)])
mean84 = 7.2741
std84 = std([Z(70,3) Z(83,3) Z(84,3)])
std84 = 0.3624
inconsistent84 = (Z(84,3)-mean84)/std84
inconsistent84 = 0.5774

Создайте выборочные данные.

X = gallery('uniformdata',[10 2],12);
Y = pdist(X);

Сгенерируйте иерархическое кластерное дерево.

Z = linkage(Y,'single');

Сгенерируйте график древовидной схемы иерархического кластерного дерева.

dendrogram(Z)

Вычислите коэффициент несоответствия для каждой ссылки в кластерном дереве Z на глубину 3.

W = inconsistent(Z,3)
W = 9×4

    0.1313         0    1.0000         0
    0.1386         0    1.0000         0
    0.1463    0.0109    2.0000    0.7071
    0.2391         0    1.0000         0
    0.1951    0.0568    4.0000    0.9425
    0.2308    0.0543    4.0000    0.9320
    0.2395    0.0748    4.0000    0.7636
    0.2654    0.0945    4.0000    0.9203
    0.3769    0.0950    3.0000    1.1040

Входные параметры

свернуть все

Агломерационное иерархическое кластерное дерево, заданное как числовая матрица, возвращенная linkage. Z (m – 1)-by-3 матрица, где m является количеством наблюдений. Столбцы 1 и 2 Z содержат кластерные индексы, соединенные в парах, чтобы сформировать двоичное дерево. Z(I,3) содержит расстояния связи между этими двумя кластерами, объединенными в строке Z(I,:).

Типы данных: single | double

Глубина, заданная как положительный целочисленный скаляр. Для каждой ссылки k inconsistent вычисляет соответствующий коэффициент несоответствия с помощью всех ссылок в дереве в уровнях d ниже k.

Типы данных: single | double

Выходные аргументы

свернуть все

Информация о коэффициенте несоответствия, возвращенная как (m – 1)-by-4 матрица, где (m – 1) строки соответствуют строкам Z. Эта таблица описывает столбцы Y.

СтолбецОписание

1

Среднее значение высот всех ссылок включено в вычисление

2

Стандартное отклонение высот всех ссылок включено в вычисление

3

Количество ссылок включено в вычисление

4

Коэффициент несоответствия

Типы данных: double

Алгоритмы

Для каждой ссылки k коэффициент несоответствия вычисляется как

Y(k,4)=(Z(k,3)Y(k,1))/Y(k,2),

где Y является информацией о коэффициенте несоответствия для ссылок в иерархическом кластерном древовидном Z.

Для ссылок, которые не имеют никаких дальнейших ссылок ниже их, коэффициент несоответствия установлен в 0.

Ссылки

[1] Джайн, А., и Р. Дубес. Алгоритмы для кластеризации данных. Верхний Сэддл-Ривер, NJ: Prentice Hall, 1988.

[2] Зан, C. T. “Теоретические графиком методы для обнаружения и описания кластеров Гештальта”. Транзакции IEEE на Компьютерах. Издание C-20, Выпуск 1, 1971, стр 68–86.

Представлено до R2006a