Кластеризация числовых данных составляет основу многих алгоритмов классификации и системного моделирования. Целью кластеризации является идентификация естественных группировок данных из большого набора данных для получения краткого представления поведения системы.
Инструменты Fuzzy Logic Toolbox™ позволяют находить кластеры в учебных данных ввода-вывода. Можно использовать кластерную информацию для создания системы нечеткого вывода Sugeno-типа, которая наилучшим образом моделирует поведение данных с использованием минимального количества правил. Сами правила делятся в соответствии с нечеткими качествами, связанными с каждым из кластеров данных. для автоматического создания этого типа FIS используйте genfis команда.
Нечеткие c-средства (FCM) - это метод кластеризации данных, в котором каждая точка данных принадлежит кластеру в некоторой степени, которая определена уровнем членства. Этот метод был первоначально представлен Джимом Бездеком в 1981 году [1] как усовершенствование более ранних методов кластеризации. Он предоставляет метод, показывающий, как группировать точки данных, которые заполняют несколько многомерных пространств, в определенное количество различных кластеров.
Функция командной строки fcm начинается с начального предположения для центров кластера, которые предназначены для обозначения среднего местоположения каждого кластера. Первоначальное предположение для этих центров кластеров, скорее всего, неверно. Дополнительно, fcm назначает каждой точке данных уровень членства для каждого кластера. Путем итеративного обновления центров кластеров и классов членства для каждой точки данных, fcm итеративно перемещает центры кластеров в нужное местоположение в наборе данных. Эта итерация основана на минимизации целевой функции, которая представляет расстояние от любой заданной точки данных до центра кластеров, взвешенное по уровню членства этой точки данных.
Функция командной строки fcm выводит список центров кластеров и несколько классов членства для каждой точки данных. Можно использовать информацию, возвращенную fcm помогает создать систему нечеткого вывода путем создания функций членства для представления нечетких качеств каждого кластера. Чтобы создать систему нечеткого вывода Sugeno-типа, которая моделирует поведение входных/выходных данных, можно настроить genfis для использования кластеризации FCM.
Если у вас нет четкого представления, сколько кластеров должно быть для данного набора данных, то вычитание кластеров - это быстрый, однопроходный алгоритм оценки количества кластеров и центров кластеров для набора данных [2]. Кластерные оценки, которые получены из subclust функция, может использоваться для инициализации итеративных методов кластеризации на основе оптимизации (fcm) и методы идентификации модели (например, anfis). subclust функция находит кластеры с помощью метода вычитания кластеров.
Чтобы создать систему нечеткого вывода Sugeno-типа, которая моделирует поведение входных/выходных данных, можно настроить genfis для использования вычитаемой кластеризации.
[1] Бездек, J.C., Распознавание образов с нечеткими алгоритмами целевой функции, Пленум Пресс, Нью-Йорк, 1981.
[2] Чиу, С., «Идентификация нечеткой модели на основе кластерной оценки», Журнал интеллектуальных и нечетких систем, том 2, № 3, сентябрь 1994 года.