exponenta event banner

непоследовательный

Коэффициент несогласованности

Описание

пример

Y = inconsistent(Z) возвращает коэффициент несогласованности для каждого звена иерархического дерева кластера Z генерируемой системой linkage функция. inconsistent вычисляет коэффициент несогласованности для каждого звена путем сравнения его высоты со средней высотой других звеньев на том же уровне иерархии. Чем больше коэффициент, тем больше разница между объектами, соединенными линией связи. Дополнительные сведения см. в разделе Алгоритмы.

пример

Y = inconsistent(Z,d) возвращает коэффициент несогласованности для каждой ссылки в дереве Z путем поиска на глубину d под каждой ссылкой.

Примеры

свернуть все

Проверьте расчет коэффициента несогласованности для иерархического дерева кластера.

Загрузить examgrades набор данных.

load examgrades

Создание иерархического дерева кластера.

Z = linkage(grades);

Создание матрицы информации о коэффициентах несогласованности с помощью inconsistent. Проверьте информацию для 84-го канала.

Y = inconsistent(Z);
Y(84,:)
ans = 1×4

    7.2741    0.3624    3.0000    0.5774

Четвертый столбец Y содержит коэффициент несогласованности, который вычисляется с использованием среднего значения в первом столбце Y и стандартное отклонение во втором столбце Y.

Потому что строки Y соответствуют строкам Z, осмотрите 84-е звено в Z.

Z(84,:)
ans = 1×3

  190.0000  203.0000    7.4833

84-е звено соединяет 190-й и 203-й кластеры в дереве и имеет высоту 7.4833. 190-й кластер соответствует звену индекса 190-120 = 70, где 120 - количество наблюдений. 203-й кластер соответствует 83-му звену.

По умолчанию inconsistent использует два уровня дерева для вычисления Y. Поэтому для вычисления коэффициента несогласованности для 84-й линии связи используется только 70-я, 83-я и 84-я линии связи. Сравнение значений в Y(84,:) с соответствующими вычислениями с использованием высот линий связи в Z.

mean84 = mean([Z(70,3) Z(83,3) Z(84,3)])
mean84 = 7.2741
std84 = std([Z(70,3) Z(83,3) Z(84,3)])
std84 = 0.3624
inconsistent84 = (Z(84,3)-mean84)/std84
inconsistent84 = 0.5774

Создайте образец данных.

X = gallery('uniformdata',[10 2],12);
Y = pdist(X);

Создайте иерархическое дерево кластера.

Z = linkage(Y,'single');

Создайте график дендрограммы иерархического дерева кластера.

dendrogram(Z)

Figure contains an axes. The axes contains 9 objects of type line.

Вычислите коэффициент несогласованности для каждой линии связи в дереве Z кластера до глубины 3.

W = inconsistent(Z,3)
W = 9×4

    0.1313         0    1.0000         0
    0.1386         0    1.0000         0
    0.1463    0.0109    2.0000    0.7071
    0.2391         0    1.0000         0
    0.1951    0.0568    4.0000    0.9425
    0.2308    0.0543    4.0000    0.9320
    0.2395    0.0748    4.0000    0.7636
    0.2654    0.0945    4.0000    0.9203
    0.3769    0.0950    3.0000    1.1040

Входные аргументы

свернуть все

Агломерирующее иерархическое дерево кластера, указанное как числовая матрица, возвращаемая linkage. Z - матрица (m-1) -by-3, где m - число наблюдений. Столбцы 1 и 2 изZ содержат индексы кластера, связанные парами для формирования двоичного дерева. Z(I,3) содержит расстояния связи между двумя кластерами, объединенными в строку Z(I,:).

Типы данных: single | double

Глубина, заданная как положительный целочисленный скаляр. Для каждой линии k, inconsistent вычисляет соответствующий коэффициент несогласованности, используя все ссылки в дереве в d уровни ниже k.

Типы данных: single | double

Выходные аргументы

свернуть все

Информация о коэффициенте несоответствия, возвращаемая в виде матрицы (m-1) -by-4, где (m-1) строки соответствуют строкам Z. В этой таблице описаны столбцы Y.

КолонкаОписание

1

Среднее значение высоты всех звеньев, включенных в расчет

2

Стандартное отклонение высот всех звеньев, включенных в расчет

3

Количество ссылок, включенных в расчет

4

Коэффициент несогласованности

Типы данных: double

Алгоритмы

Для каждой линии k коэффициент несоответствия вычисляется как

Y (k, 4) = (Z (k, 3) Y (k, 1) )/Y (k, 2),

где Y является информацией коэффициента несогласованности для ссылок в иерархическом дереве кластера Z.

Для звеньев, не имеющих дополнительных звеньев под ними, коэффициент несогласованности устанавливается равным 0.

Ссылки

[1] Джейн, А. и Р. Дюбес. Алгоритмы кластеризации данных. Река Верхнее Седло, Нью-Джерси: Прентис-Холл, 1988.

[2] Zahn, C. T. «Графо-теоретические методы обнаружения и описания кластеров гештальта». Транзакции IEEE на компьютерах. т. C-20, выпуск 1, 1971, стр. 68-86.

Представлен до R2006a