clusterDBSCAN.discoverClusters

Найдите кластерную иерархию в данных

Описание

пример

[order,reachdist] = clusterDBSCAN.discoverClusters(X,maxepsilon,minnumpoints) возвращает упорядоченный кластеру список точек, order, и расстояния достижимости, reachdist, для каждой точки в данных X. Задайте максимальный эпсилон, maxepsilon, и минимальное число точек, minnumpoints. Метод реализует Точки Упорядоченного расположения, Чтобы Идентифицировать Кластеризирующуюся Структуру (OPTICS) алгоритм. Алгоритм OPTICS полезен, когда кластеры имеют различную плотность.

clusterDBSCAN.discoverClusters(X,maxepsilon,minnumpoints) отображает столбчатый график, представляющий кластерную иерархию.

Примеры

свернуть все

Создайте целевые данные со случайными обнаружениями в xy Декартовых координатах. Используйте clusterDBSCAN.discoverClusters возразите функциям, чтобы показать базовую кластерную иерархию.

Во-первых, установите clusterDBSCAN.discoverClusters параметры.

maxEpsilon = 10;
minNumPoints = 6;

Создайте случайные целевые данные.

X = [randn(20,2) + [11.5,11.5]; randn(20,2) + [25,15]; randn(20,2) + [8,20]; 10*rand(10,2) + [20,20]];
plot(X(:,1),X(:,2),'.')
axis equal
grid

Figure contains an axes object. The axes object contains an object of type line.

Постройте кластерную иерархию.

clusterDBSCAN.discoverClusters(X,maxEpsilon,minNumPoints)

Figure Reachability Distances contains an axes object. The axes object with title Reachability Distances contains an object of type bar.

От визуального осмотра графика выберите Epsilon как 2 и затем выполняют кластеризацию с помощью clusterDBSCAN возразите и постройте результирующие кластеры.

clusterer = clusterDBSCAN('MinNumPoints',6,'Epsilon',2, ...
    'EnableDisambiguation',false);
[idx,cidx] = clusterer(X);
plot(clusterer,X,idx)

Figure Clusters contains an axes object. The axes object with title Clusters contains 5 objects of type line, scatter, text.

Входные параметры

свернуть все

Введите данные о функции в виде N с действительным знаком-by-P матрица. Строки N соответствуют характерным точкам в P - размерное пространство признаков. Столбцы P содержат значения функций, по которым происходит кластеризация. Алгоритм DBSCAN может кластеризировать любой тип данных с соответствующим MinNumPoints и Epsilon настройки. Например, вход 2D столбца может содержать Декартовы координаты xy или расположиться и Доплер.

Типы данных: double

Максимальный размер эпсилона, чтобы использовать в кластерной иерархии ищет в виде положительной скалярной величины. Параметр эпсилона задает кластеризирующееся окружение вокруг точки. Сокращение maxepsilon результаты в более короткое время выполнения. Установка maxepsilon к inf идентифицирует все возможные кластеры.

Алгоритм OPTICS относительно нечувствителен к установкам параметров, но выбор больших параметров может улучшить результаты.

Пример: 5.0

Типы данных: double

Минимальное число точек, используемое в качестве порога в виде положительного целого числа. Порог устанавливает минимальное число точек для кластера.

Алгоритм OPTICS относительно нечувствителен к установкам параметров, но выбор больших параметров может улучшить результаты.

Пример: 10

Типы данных: double

Выходные аргументы

свернуть все

Кластер заказал список демонстрационных индексов, возвращенных как 1 с целочисленным знаком N вектором-строкой. N является количеством строк в матрице входных данных X.

Расстояние достижимости, возвращенное как положительный, 1 с действительным знаком N вектором-строкой. N является количеством строк в матрице входных данных X.

Типы данных: double

Алгоритмы

Выходные параметры clusterDBSCAN.discoverClusters позвольте вам создать график достижимости, из которого может визуализироваться иерархическая структура кластеров. График достижимости содержит упорядоченные точки на x - ось и расстояния достижимости на y - ось. Используйте выходные параметры, чтобы исследовать кластерную структуру по широкому диапазону установок параметров. Можно использовать выход, чтобы помочь оценить соответствующие пороги кластеризации эпсилона для алгоритма DBSCAN. Точки, принадлежащие кластеру, имеют маленькие расстояния достижимости до своего самого близкого соседа, и кластеры появляются как овраги в графике достижимости. Более глубокие овраги соответствуют более плотным кластерам. Определите эпсилон из ординаты нижней части оврагов.

OPTICS принимает, что плотные кластеры полностью содержатся в менее плотных кластерах. OPTICS обрабатывает данные в правильном порядке путем отслеживания окружений плотности точки. Этот процесс выполняется путем упорядоченного расположения точек данных самыми короткими расстояниями достижимости, гарантии, что кластеры с более высокой плотностью идентифицированы сначала.

Расширенные возможности

Введенный в R2021a