clusterDBSCAN.discoverClusters

Найдите кластерную иерархию в данных

Описание

пример

[order,reachdist] = clusterDBSCAN.discoverClusters(X,maxepsilon,minnumpoints) возвращает упорядоченный кластеру список точек, order, и расстояния достижимости, reachdist, для каждой точки в данных X. Задайте максимальный эпсилон, maxepsilon, и минимальное число точек, minnumpoints. Метод реализует Точки Упорядоченного расположения, Чтобы Идентифицировать Кластеризирующуюся Структуру (OPTICS) алгоритм. Алгоритм OPTICS полезен, когда кластеры имеют различную плотность.

clusterDBSCAN.discoverClusters(X,maxepsilon,minnumpoints) отображает столбчатый график, представляющий кластерную иерархию.

Примеры

свернуть все

Создайте целевые данные со случайными обнаружениями в xy Декартовых координатах. Используйте clusterDBSCAN.discoverClusters возразите функции, чтобы показать базовую кластерную иерархию.

Во-первых, установите clusterDBSCAN.discoverClusters параметры.

maxEpsilon = 10;
minNumPoints = 6;

Создайте случайные целевые данные.

X = [randn(20,2) + [11.5,11.5]; randn(20,2) + [25,15]; randn(20,2) + [8,20]; 10*rand(10,2) + [20,20]];
plot(X(:,1),X(:,2),'.')
axis equal
grid

Постройте кластерную иерархию.

clusterDBSCAN.discoverClusters(X,maxEpsilon,minNumPoints)

От визуального осмотра графика выберите Epsilon как 1,5 и затем выполняют кластеризацию с помощью clusterDBSCAN и постройте результирующие кластеры.

clusterer = clusterDBSCAN('MinNumPoints',6,'Epsilon',1.5,'EnableDisambiguation',false);
[idx,cidx] = clusterer(X);
plot(clusterer,X,idx)

Входные параметры

свернуть все

Введите данные о функции, заданные как N с действительным знаком-by-P матрица. Строки N соответствуют характерным точкам в P - размерное пространство признаков. Столбцы P содержат значения функций, по которым происходит кластеризация. Алгоритм DBSCAN может кластеризировать любой тип данных с соответствующим MinNumPoints и Epsilon настройки. Например, вход 2D столбца может содержать Декартовы координаты xy или расположиться и Доплер.

Типы данных: double

Максимальный размер эпсилона, чтобы использовать в кластерном поиске иерархии, заданном как положительная скалярная величина. Параметр эпсилона задает кластеризирующееся окружение вокруг точки. Сокращение maxepsilon результаты в более короткое время выполнения. Установка maxepsilon к inf идентифицирует все возможные кластеры.

Алгоритм OPTICS относительно нечувствителен к установкам параметров, но выбор больших параметров может улучшить результаты.

Пример: 5.0

Типы данных: double

Минимальное число точек используется в качестве порога, заданного как положительное целое число. Порог устанавливает минимальное число точек для кластера.

Алгоритм OPTICS относительно нечувствителен к установкам параметров, но выбор больших параметров может улучшить результаты.

Пример: 10

Типы данных: double

Выходные аргументы

свернуть все

Кластер заказал список демонстрационных индексов, возвращенных как 1 с целочисленным знаком N вектором-строкой. N является количеством строк в матрице входных данных X.

Расстояние достижимости, возвращенное как положительный, 1 с действительным знаком N вектором-строкой. N является количеством строк в матрице входных данных X.

Типы данных: double

Алгоритмы

Выходные параметры clusterDBSCAN.discoverClusters позвольте вам создать график достижимости, из которого может визуализироваться иерархическая структура кластеров. График достижимости содержит упорядоченные точки на x - ось и расстояния достижимости на y - ось. Используйте выходные параметры, чтобы исследовать кластерную структуру по широкому диапазону установок параметров. Можно использовать выход, чтобы помочь оценить соответствующие пороги кластеризации эпсилона для алгоритма DBSCAN. Точки, принадлежащие кластеру, имеют маленькие расстояния достижимости до своего самого близкого соседа, и кластеры появляются как овраги в графике достижимости. Более глубокие овраги соответствуют более плотным кластерам. Определите эпсилон из ординаты нижней части оврагов.

OPTICS принимает, что плотные кластеры полностью содержатся в менее плотных кластерах. OPTICS обрабатывает данные в правильном порядке путем отслеживания окружений плотности точки. Этот процесс выполняется путем упорядоченного расположения точек данных самыми короткими расстояниями достижимости, гарантии, что кластеры с более высокой плотностью идентифицированы сначала.

Расширенные возможности

Смотрите также

| |

Введенный в R2019b