exponenta event banner

Классификатор

Обучение моделей классификации данных с помощью контролируемого машинного обучения

Описание

Приложение Classification Learner обучает модели классификации данных. С помощью этого приложения вы можете исследовать контролируемое машинное обучение с помощью различных классификаторов. Можно исследовать данные, выбрать элементы, указать схемы проверки, обучить модели и оценить результаты. Вы можете выполнить автоматизированное обучение для поиска лучшего типа модели классификации, включая деревья решений, дискриминантный анализ, машины поддержки векторов, логистическую регрессию, ближайшие соседи, наивный Байес, ансамбль и нейронную сетевую классификацию.

Вы можете выполнять контролируемое машинное обучение, предоставляя известный набор входных данных (наблюдения или примеры) и известные ответы на данные (например, метки или классы). Данные используются для обучения модели, которая генерирует прогнозы для ответа на новые данные. Чтобы использовать модель с новыми данными или узнать о программной классификации, можно экспортировать модель в рабочую область или создать код MATLAB ® для воссоздания обученной модели.

Совет

Чтобы начать, в списке Классификатор (Classifier) попробуйте Все быстро обучить (All Quick-To-Train), чтобы обучить выбор моделей. См. раздел Обучение автоматическому классификатору.

Необходимые продукты

  • MATLAB

  • Статистика и машинное обучение Toolbox™

Примечание.При использовании Classification Learner в MATLAB Online™ можно параллельно обучать модели с помощью кластера Cloud Center (требуется Parallel Computing Toolbox™). Дополнительные сведения см. в разделе Использование панели инструментов параллельных вычислений с кластером Cloud Center в MATLAB Online (Панель инструментов параллельных вычислений).

Classification Learner app

Откройте приложение «Классификатор»

  • MATLAB Toolstrip: На вкладке Приложения в разделе Машинное обучение щелкните значок приложения.

  • командная строка MATLAB: Enter classificationLearner.

Программное использование

развернуть все

classificationLearner открывает приложение Classification Learner или переносит фокус на приложение, если оно уже открыто.

classificationLearner(Tbl,ResponseVarName) открывает приложение Classification Learner и заполняет диалоговое окно New Session from Arguments данными, содержащимися в таблице Tbl. ResponseVarName аргумент, указанный как вектор символов или скаляр строки, является именем переменной ответа в Tbl который содержит метки класса. Остальные переменные в Tbl являются переменными предиктора.

classificationLearner(Tbl,Y) открывает приложение Classification Learner и заполняет диалоговое окно New Session from Arguments переменными предиктора в таблице Tbl и метки класса в векторе Y. Можно указать ответ Y как категориальный массив, символьный массив, строковый массив, логический вектор, числовой вектор или массив ячеек символьных векторов.

classificationLearner(X,Y) открывает приложение Classification Learner и заполняет диалоговое окно New Session from Arguments матрицей предиктора n-by-p X и метки n-класса в векторе Y. Каждая строка X соответствует одному наблюдению, и каждый столбец соответствует одной переменной. Длина Y и количество строк X должно быть равным.

classificationLearner(___,Name,Value) задает параметры перекрестной проверки с использованием одного или нескольких из следующих аргументов «имя-значение» в дополнение к любой из комбинаций входных аргументов в предыдущих синтаксисах. Например, можно указать 'KFold',10 для использования 10-кратной схемы перекрестной проверки.

  • 'CrossVal', указано как 'on' (по умолчанию) или 'off', - флаг перекрестной проверки. При указании 'on'затем приложение использует пятикратную перекрестную проверку. При указании 'off', затем приложение использует проверку повторного замещения.

    Можно переопределить 'CrossVal' настройки перекрестной проверки с помощью 'Holdout' или 'KFold' аргумент «имя-значение». Одновременно можно указать только один из этих аргументов.

  • 'Holdout', указанный как числовой скаляр в диапазоне [0.05.0.5], является долей данных, используемых для проверки отсутствия. Остальные данные используются приложением для обучения.

  • 'KFold', указанное как положительное целое число в диапазоне [2,50], - количество складок, используемых для перекрестной проверки.

См. также

Приложения

Функции

Представлен в R2015a