inconsistent

Коэффициент несоответствия

Описание

пример

Y = inconsistent(Z) возвращает коэффициент несоответствия для каждой ссылки иерархического кластерного древовидного Z сгенерированный linkage функция. inconsistent вычисляет коэффициент несоответствия для каждой ссылки путем сравнения ее высоты со средней высотой других ссылок на том же уровне иерархии. Чем больше коэффициент, тем больше различие между объектами, соединенными ссылкой. Для получения дополнительной информации см. Алгоритмы.

пример

Y = inconsistent(Z,d) возвращает коэффициент несоответствия для каждой ссылки в древовидном Z путем поиска на глубину d ниже каждой ссылки.

Примеры

свернуть все

Исследуйте содействующее вычисление несоответствия на иерархическое кластерное дерево.

Загрузите examgrades набор данных.

load examgrades

Создайте иерархическое кластерное дерево.

Z = linkage(grades);

Создайте матрицу информации о коэффициенте несоответствия с помощью inconsistent. Исследуйте информацию на 84-ю ссылку.

Y = inconsistent(Z);
Y(84,:)
ans = 1×4

    7.2741    0.3624    3.0000    0.5774

Четвертый столбец Y содержит коэффициент несоответствия, который вычисляется с помощью среднего значения в первом столбце Y и стандартное отклонение во втором столбце Y.

Поскольку строки Y соответствуйте строкам Z, исследуйте 84-ю ссылку в Z.

Z(84,:)
ans = 1×3

  190.0000  203.0000    7.4833

84-я ссылка соединяет 190-е и 203-и кластеры в дереве и имеет высоту 7.4833. 190-й кластер соответствует ссылке индекса 190-120=70, где 120 количество наблюдений. 203-й кластер соответствует 83-й ссылке.

По умолчанию, inconsistent использование два уровня дерева, чтобы вычислить Y. Поэтому это использует только 70-е, 83-и, и 84-е ссылки, чтобы вычислить коэффициент несоответствия для 84-й ссылки. Сравните значения в Y(84,:) с соответствующими расчетами при помощи высот ссылки в Z.

mean84 = mean([Z(70,3) Z(83,3) Z(84,3)])
mean84 = 7.2741
std84 = std([Z(70,3) Z(83,3) Z(84,3)])
std84 = 0.3624
inconsistent84 = (Z(84,3)-mean84)/std84
inconsistent84 = 0.5774

Создайте выборочные данные.

X = gallery('uniformdata',[10 2],12);
Y = pdist(X);

Сгенерируйте иерархическое кластерное дерево.

Z = linkage(Y,'single');

Сгенерируйте график древовидной схемы иерархического кластерного дерева.

dendrogram(Z)

Вычислите коэффициент несоответствия для каждой ссылки в кластерном дереве Z на глубину 3.

W = inconsistent(Z,3)
W = 9×4

    0.1313         0    1.0000         0
    0.1386         0    1.0000         0
    0.1463    0.0109    2.0000    0.7071
    0.2391         0    1.0000         0
    0.1951    0.0568    4.0000    0.9425
    0.2308    0.0543    4.0000    0.9320
    0.2395    0.0748    4.0000    0.7636
    0.2654    0.0945    4.0000    0.9203
    0.3769    0.0950    3.0000    1.1040

Входные параметры

свернуть все

Агломерационное иерархическое кластерное дерево в виде числовой матрицы, возвращенной linkageZ (m – 1)-by-3 матрица, где m является количеством наблюдений. Столбцы 1 и 2 Z содержите кластерные индексы, соединенные в парах, чтобы сформировать двоичное дерево. Z(I,3) содержит расстояния рычажного устройства между этими двумя кластерами, объединенными в строке Z(I,:).

Типы данных: single | double

Глубина в виде положительного целочисленного скаляра. Для каждой ссылки k, inconsistent вычисляет соответствующий коэффициент несоответствия с помощью всех ссылок в дереве в d уровни ниже k.

Типы данных: single | double

Выходные аргументы

свернуть все

Информация о коэффициенте несоответствия, возвращенная как (m – 1)-by-4 матрица, где (m – 1) строки соответствуют строкам Z. Эта таблица описывает столбцы Y.

СтолбецОписание

1

Среднее значение высот всех ссылок включено в вычисление

2

Стандартное отклонение высот всех ссылок включено в вычисление

3

Количество ссылок включено в вычисление

4

Коэффициент несоответствия

Типы данных: double

Алгоритмы

Для каждой ссылки k коэффициент несоответствия вычисляется как

Y(k,4)=(Z(k,3)Y(k,1))/Y(k,2),

где Y информация о коэффициенте несоответствия для ссылок в иерархическом кластерном древовидном Z.

Для ссылок, которые не имеют никаких дальнейших ссылок ниже их, коэффициент несоответствия установлен в 0.

Ссылки

[1] Джайн, А., и Р. Дубес. Алгоритмы для кластеризации данных. Верхний Сэддл-Ривер, NJ: Prentice Hall, 1988.

[2] Зан, C. T. “Теоретические графиком методы для обнаружения и описания кластеров Гештальта”. Транзакции IEEE на Компьютерах. Издание C-20, Выпуск 1, 1971, стр 68–86.

Представлено до R2006a