exponenta event banner

Кластеризация данных с помощью средства кластеризации

Инструмент кластеризации реализует функции кластеризации нечетких данных fcm и subclustи позволяет выполнять кластеризацию данных. Дополнительные сведения о методах кластеризации см. в разделе Нечеткая кластеризация.

Чтобы открыть инструмент, в командной строке MATLAB ® введите:

findcluster

By default, the Clustering tool shows an empty plot on the left, clustering options on the right, and a button for loading data in the top right corner.

Используйте инструмент кластеризации для выполнения следующих задач.

  1. Загрузите и постройте график данных.

  2. Выполните кластеризацию.

  3. Сохраните центр кластеров.

Откройте разделы интерактивной справки, щелкнув Сведения или воспользовавшись меню Справка.

Загрузка и печать данных

Чтобы загрузить набор данных, выполните одно из следующих действий:

  • Щелкните Загрузить данные (Load Data) и выберите файл, содержащий данные.

  • Откройте инструмент кластеризации с набором данных непосредственно путем вызова findcluster с набором данных в качестве входного аргумента.

    Например, введите:

    findcluster('clusterdemo.dat')

Файл набора данных должен иметь расширение .dat. Каждая строка файла набора данных содержит одну точку данных. Например, если имеются 5-мерные данные со 100 точками данных, файл содержит 100 строк, а каждая строка содержит пять значений.

Инструмент кластеризации работает с многомерными наборами данных, но отображает только два из этих размеров на графике. Для выбора других размеров в наборе данных для печати можно использовать раскрывающиеся списки под осями X и Y.

Кластерные данные

Чтобы начать кластеризацию данных:

  1. Выберите функцию кластеризации fcm (нечеткая кластеризация C-Means) или subtractiv (вычитание кластеризации) из раскрывающегося меню в разделе Методы.

  2. Задать параметры для:

    • Нечеткая c-означает кластеризацию с использованием полей Номер кластера (Cluster Num), Максимальная итерация (Max Iteration), Мин (Min) и Экспонента (Exponent). Сведения об этих параметрах см. в разделе fcm.

    • Вычитание кластеризации с использованием полей Диапазон влияния, Сквош, Пропорции и Коэффициент отклонения. Сведения об этих параметрах см. в разделе subclust.

  3. Скопируйте данные, нажав кнопку Пуск.

    После завершения кластеризации центры кластеров отображаются черным цветом, как показано на следующем рисунке.

    The clustering tool shows a two-dimensional plot of the data points in red with cluster centers in black. Change the X and Y axis data using the drop-down lists below the plot.

Совет

С помощью инструмента кластеризации можно получить только вычисленные центры кластеров. Для получения дополнительной информации:

  • Нечеткая кластеризация c-означает кластеризацию, такую как матрица нечеткого разбиения, кластеризацию данных с использованием fcm.

  • Субтрактивная кластеризация, такая как диапазон влияния в каждом измерении данных, кластеризация данных с помощью subclust.

Использование одних и тех же данных кластеризации fcm или subclustсначала загрузите файл данных в рабочую область MATLAB. Например, в командной строке MATLAB введите:

load clusterdemo.dat

Сохранить центры кластеров

Чтобы сохранить центры кластеров, щелкните Сохранить центр.

См. также

| |

Связанные темы