Нечеткая кластеризация

Что кластеризируют данные?

Кластеризация числовых данных формирует основание из многих классификация и системные алгоритмы моделирующего. Цель кластеризироваться состоит в том, чтобы идентифицировать естественные группировки данных из большого набора данных, чтобы произвести краткое представление поведения системы.

Инструменты Fuzzy Logic Toolbox™ позволяют вам находить кластеры в данных тренировки ввода - вывода. Можно использовать кластерную информацию, чтобы сгенерировать Sugeno-тип нечеткая система вывода что лучшие модели поведение данных с помощью минимального количества правил. Раздел правил самостоятельно согласно нечетким качествам сопоставлен с каждым из кластеров данных. чтобы автоматически сгенерировать этот тип FIS, используйте команду genfis.

Нечеткая кластеризация C-средств

Нечеткие c-средние-значения (FCM) являются методом кластеризации данных, где каждая точка данных принадлежит кластеру до некоторой степени, который задан классом членства. Этот метод был первоначально введен Джимом Бездеком в 1 981 [1] как улучшение на более ранних методах кластеризации. Это предоставляет метод, который показывает, как сгруппировать точки данных, которые заполняют некоторый многомерный пробел в определенное количество различных кластеров.

fcm функции командной строки запускается с исходного предположения для кластерных центров, которые предназначаются, чтобы отметить среднее местоположение каждого кластера. Исходное предположение для этих кластерных центров является, скорее всего, неправильным. Кроме того, fcm присваивает каждую точку данных класс членства для каждого кластера. Путем итеративного обновления кластерных центров и классов членства для каждой точки данных, fcm итеративно перемещает кластерные центры в правильное местоположение в наборе данных. Эта итерация основана на минимизации целевой функции, которая представляет расстояние от любой точки определенных данных до кластерного центра, взвешенного классом членства той точки данных.

fcm функции командной строки выходные параметры список кластерных центров и нескольких классов членства для каждой точки данных. Можно использовать информацию, возвращенную fcm, чтобы помочь вам создать нечеткую систему вывода путем создания функций принадлежности, чтобы представлять нечеткие качества каждого кластера. Чтобы сгенерировать Sugeno-тип нечеткая система вывода, которая моделирует поведение данных о вводе/выводе, можно сконфигурировать команду genfis, чтобы использовать кластеризацию FCM.

Отнимающая кластеризация

Если у вас нет четкого представления сколько кластеров, там должен быть для данного набора данных, отнимающая кластеризация является быстрым, алгоритмом с одной передачей для оценки количества кластеров и кластерных центров набора данных [2]. Кластерные оценки, которые получены из функции subclust, могут использоваться, чтобы инициализировать итеративные основанные на оптимизации методы кластеризации (fcm) и образцовые методы идентификации (как anfis). Функция subclust находит кластеры с помощью отнимающего метода кластеризации.

Чтобы сгенерировать Sugeno-тип нечеткая система вывода, которая моделирует поведение данных о вводе/выводе, можно сконфигурировать команду genfis, чтобы использовать отнимающую кластеризацию.

Ссылки

[1] Bezdek, J.C., распознавание образов с нечеткими алгоритмами целевой функции, Пленум-Пресс, Нью-Йорк, 1981.

[2] Чю, S., "Нечеткая образцовая идентификация на основе кластерной оценки", журнал Intelligent & Fuzzy Systems, издания 2, № 3, сентябрь 1994.

Смотрите также

| |

Похожие темы