Нечеткая кластеризация

Что такое кластеризация данных?

Кластеризация численных данных формирует базис многих алгоритмов классификации и системного моделирования. Цель кластеризации состоит в том, чтобы идентифицировать естественные группировки данных из большого набора данных, чтобы получить краткое представление поведения системы.

Инструменты Fuzzy Logic Toolbox™ позволяют вам находить кластеры в обучающих данных ввода-вывода. Можно использовать информацию о кластере, чтобы сгенерировать систему нечеткого вывода Sugeno-type, которая лучше всего моделирует поведение данных с помощью минимального количества правил. Правила разбиваются сами по себе в соответствии с нечеткими качествами, связанными с каждым из кластеров данных. чтобы автоматически сгенерировать этот тип FIS, используйте genfis команда.

Нечеткая кластеризация C-означает

Нечеткое c-средство (FCM) является методом кластеризации данных, в котором каждая точка данных принадлежит кластеру до некоторой степени, которая задается классом принадлежности. Этот метод был первоначально представлен Джимом Бездеком в 1981 году [1] как улучшение более ранних методов кластеризации. Он предоставляет метод, который показывает, как сгруппировать точки данных, которые заполняют некоторое многомерное пространство в определенное количество различных кластеров.

Функция командной строки fcm начинается с начального предположения для центров кластеров, которые предназначены для маркировки среднего местоположения каждого кластера. Первоначальное предположение для этих центров кластера, скорее всего, неверно. Дополнительно, fcm присваивает каждой точке данных класс принадлежности для каждого кластера. Путем итерационного обновления центров кластеров и классов принадлежности для каждой точки данных, fcm итерационно перемещает центры кластера в нужное место в наборе данных. Эта итерация основана на минимизации целевой функции, которая представляет расстояние от любой заданной точки данных до центра кластера, взвешенного по уровню принадлежности этой точки данных.

Функция командной строки fcm выводит список центров кластеров и несколько классов принадлежности для каждой точки данных. Вы можете использовать информацию, возвращенную fcm чтобы помочь вам создать систему нечеткого вывода путем создания функций принадлежности, чтобы представлять нечеткие качества каждого кластера. Чтобы сгенерировать систему нечеткого вывода Sugeno-типа, которая моделирует поведение входных/выходных данных, можно сконфигурировать genfis команда для использования кластеризации FCM.

Вычитание кластеризации

Если у вас нет четкого представления о том, сколько кластеров должно быть для данного набора данных, вычитающая кластеризация является быстрым, однопроходным алгоритмом для оценки количества кластеров и центров кластеров для набора данных [2]. Оценки кластеров, которые получаются из subclust function, может использоваться для инициализации итерационных основанных на оптимизации методов кластеризации (fcm) и методы идентификации моделей (например, anfis). subclust функция находит кластеры с помощью метода вычитающей кластеризации.

Чтобы сгенерировать систему нечеткого вывода Sugeno-типа, которая моделирует поведение входных/выходных данных, можно сконфигурировать genfis команда для использования вычитающей кластеризации.

Ссылки

[1] Bezdek, J.C., Pattern Recognition with Fuzzy Objective Function Algorithms, Plenum Press, New York, 1981.

[2] Chiu, S., «Fuzzy Model Identification Based on Cluster Estimation», Journal of Intelligent & Fuzzy Systems, Vol. 2, No3, Sept. 1994.

См. также

| |

Похожие темы