inconsistent

Коэффициент несогласованности

Описание

пример

Y = inconsistent(Z) возвращает коэффициент несоответствия для каждой ссылки иерархического дерева кластеров Z сгенерирован linkage функция. inconsistent вычисляет коэффициент несоответствия для каждой ссылки путем сравнения его высоты со средней высотой других ссылок на том же уровне иерархии. Чем больше коэффициент, тем больше различие между объектами, соединенными ссылкой. Для получения дополнительной информации см. «Алгоритмы».

пример

Y = inconsistent(Z,d) возвращает коэффициент несоответствия для каждой ссылки в дереве Z путем поиска по глубине d под каждой ссылкой.

Примеры

свернуть все

Исследуйте вычисление коэффициента несоответствия для иерархического дерева кластера.

Загрузите examgrades набор данных.

load examgrades

Создайте иерархическое дерево кластеров.

Z = linkage(grades);

Создайте матрицу информации коэффициента несоответствия с помощью inconsistent. Исследуйте информацию для 84-ой ссылки.

Y = inconsistent(Z);
Y(84,:)
ans = 1×4

    7.2741    0.3624    3.0000    0.5774

Четвертый столбец Y содержит коэффициент несоответствия, который вычисляется с помощью среднего значения в первом столбце Y и стандартное отклонение во втором столбце Y.

Потому что строки Y соответствуют строкам Z, исследуйте 84-ую ссылку в Z.

Z(84,:)
ans = 1×3

  190.0000  203.0000    7.4833

84-ая ссылка соединяет 190-е и 203-е кластеры в дереве и имеет высоту 7.4833. 190-й кластер соответствует ссылке индекса 190-120=70, где 120 - количество наблюдений. 203-й кластер соответствует 83-ьей ссылке.

По умолчанию inconsistent использует два уровня дерева для вычисления Y. Поэтому он использует только 70-е, 83-е и 84-е ссылки, чтобы вычислить коэффициент несоответствия для 84-ой ссылки. Сравните значения в Y(84,:) с соответствующими расчетами при помощи высот ссылки в Z.

mean84 = mean([Z(70,3) Z(83,3) Z(84,3)])
mean84 = 7.2741
std84 = std([Z(70,3) Z(83,3) Z(84,3)])
std84 = 0.3624
inconsistent84 = (Z(84,3)-mean84)/std84
inconsistent84 = 0.5774

Создайте выборочные данные.

X = gallery('uniformdata',[10 2],12);
Y = pdist(X);

Сгенерируйте иерархическое дерево кластеров.

Z = linkage(Y,'single');

Сгенерируйте график дендрограммы иерархического дерева кластера.

dendrogram(Z)

Figure contains an axes. The axes contains 9 objects of type line.

Вычислите коэффициент несоответствия для каждой ссылки в дереве кластера Z до глубины 3.

W = inconsistent(Z,3)
W = 9×4

    0.1313         0    1.0000         0
    0.1386         0    1.0000         0
    0.1463    0.0109    2.0000    0.7071
    0.2391         0    1.0000         0
    0.1951    0.0568    4.0000    0.9425
    0.2308    0.0543    4.0000    0.9320
    0.2395    0.0748    4.0000    0.7636
    0.2654    0.0945    4.0000    0.9203
    0.3769    0.0950    3.0000    1.1040

Входные параметры

свернуть все

Агломеративное иерархическое дерево кластера, заданное в виде числовой матрицы, возвращаемой linkage. Z является (m - 1) -на-3 матрицей, где m - количество наблюдений. Столбцы 1 и 2 Z содержат индексы кластера, связанные парами, для формирования двоичного дерева. Z(I,3) содержит редактирование расстояния между двумя кластерами, объединенными в строку Z(I,:).

Типы данных: single | double

Глубина, заданная как положительный целочисленный скаляр. Для каждой ссылки k, inconsistent вычисляет соответствующий коэффициент несоответствия, используя все ссылки в дереве d уровни ниже k.

Типы данных: single | double

Выходные аргументы

свернуть все

Информация коэффициента несоответствия, возвращенная как (m - 1) -на-4 матрица, где (m - 1) строки соответствуют строкам Z. Эта таблица описывает столбцы Y.

СтолбецОписание

1

Среднее значение высот всех ссылок, включенных в расчет

2

Стандартное отклонение высот всех ссылок, включенных в расчет

3

Количество ссылок, включенных в расчет

4

Коэффициент несогласованности

Типы данных: double

Алгоритмы

Для каждой < reservedrangesplaceholder0 > ссылки коэффициент несоответствия вычисляется как

Y(k,4)=(Z(k,3)Y(k,1))/Y(k,2),

где Y - информация коэффициента несоответствия для ссылок в иерархическом дереве кластеров Z.

Для ссылок, которые не имеют дальнейших ссылок ниже них, коэффициент несоответствия устанавливается на 0.

Ссылки

[1] Jain, A., and R. Dubes. Алгоритмы кластеризации данных. Верхняя Седл-Ривер, Нью-Джерси: Prentice Hall, 1988.

[2] Zahn, C. T. «Graph-теоретические методы обнаружения и описания кластеров Гештальта». Транзакции IEEE на компьютерах. Том C-20, выпуск 1, 1971, стр. 68-86.

Представлено до R2006a
Для просмотра документации необходимо авторизоваться на сайте