exponenta event banner

Обучение классификационным моделям в приложении Classifier Learner

Classification Learner можно использовать для обучения моделей этих классификаторов: деревья решений, дискриминантный анализ, машины поддержки векторов, логистическая регрессия, ближайшие соседи, наивные Байес, ансамбли и нейронные сети. В дополнение к обучающим моделям можно изучить данные, выбрать элементы, указать схемы проверки и оценить результаты. Можно экспортировать модель в рабочую область для использования модели с новыми данными или создать код MATLAB ® для изучения программной классификации.

Обучение модели в Classification Learner состоит из двух частей:

  • Проверенная модель: подготовка модели со схемой проверки. По умолчанию приложение защищает от переоборудования, применяя перекрестную проверку. Кроме того, можно выбрать проверку удержания. Проверенная модель отображается в приложении.

  • Полная модель: подготовка модели на основе полных данных без проверки. Приложение обучает эту модель одновременно с проверенной моделью. Однако модель, обученная работе с полными данными, не отображается в приложении. При выборе классификатора для экспорта в рабочую область модуль Classification Learner экспортирует полную модель.

Приложение отображает результаты проверенной модели. Диагностические измерения, такие как точность модели и графики, такие как график рассеяния или матричная диаграмма путаницы, отражают проверенные результаты модели. Можно автоматически обучить выбор или все классификаторы, сравнить результаты проверки и выбрать лучшую модель, которая подходит для проблемы классификации. При выборе модели для экспорта в рабочую область модуль Classification Learner экспортирует полную модель. Поскольку Classification Learner создает объект модели полной модели во время обучения, при экспорте модели не возникает задержки. Экспортированную модель можно использовать для прогнозирования новых данных.

Чтобы начать обучение по различным типам моделей, см. раздел Обучение автоматическому классификатору. Если уже известно, какой тип классификатора требуется обучить, см. раздел Обучение классификатору вручную.

Обучение автоматическим классификаторам

Можно использовать Classification Learner для автоматического обучения выбора различных классификационных моделей в данных.

  • Начните с автоматического обучения сразу нескольким моделям. Можно быстро попробовать выбрать модели, а затем изучить перспективные модели в интерактивном режиме.

  • Если вы уже знаете, какой тип классификатора вы хотите, обучите отдельные классификаторы. См. раздел Обучение классификатору вручную.

  1. На вкладке Приложения в группе Машинное обучение щелкните Классификатор.

  2. Щелкните Создать сессию (New Session) и выберите данные из рабочей области или из файла. Укажите переменную ответа и переменные для использования в качестве предикторов. См. раздел Выбор данных и проверка для проблемы классификации.

  3. На вкладке «Ученик по классификации» в разделе «Тип модели» выберите «Все быстрые для обучения». Эта опция обучает все доступные для набора данных стили модели, которые быстро подгоняются.

  4. Щелкните Поезд (Train).

    Примечание

    При наличии Toolbox™ Parallel Computing можно параллельно обучать модели. См. раздел Обучение работе с параллельными классификаторами.

    Выбор типов модели появляется на панели Модели (Models). По окончании обучения в рамке выделяется наилучший процент оценки точности (проверки).

  5. Щелкните модели на панели Модели (Models), чтобы просмотреть результаты на графиках.

    Следующие шаги см. в разделе Обучение классификатору вручную или Сравнение и улучшение моделей классификации.

  6. Чтобы попробовать все неоптимизуемые стили модели классификатора, доступные для набора данных, щелкните Все (All), а затем щелкните Поезд (Train).

Обучение классификатору вручную

Если вы хотите исследовать отдельные типы моделей или уже знаете, какой тип классификатора вы хотите, вы можете обучить классификаторы по одному или обучить группу того же типа.

  1. Выберите классификатор. На вкладке «Классификатор» в разделе «Тип модели» выберите тип классификатора. Чтобы просмотреть все доступные опции классификатора, щелкните стрелку справа от раздела Тип модели (Model Type), чтобы развернуть список классификаторов. Неоптимизируемые опции модели в галерее Тип модели (Model Type) являются предварительно заданными начальными точками с различными настройками, подходящими для различных проблем классификации.

    Чтобы прочитать описание каждого классификатора, перейдите к ракурсу подробных данных.

    Дополнительные сведения о каждом варианте см. в разделе Выбор параметров классификатора.

  2. После выбора классификатора нажмите кнопку «Поезд».

    Повторите попытку, чтобы попробовать другие классификаторы.

    Совет

    Сначала попробуйте использовать деревья решений и дискриминанты. Если модели недостаточно точно предсказывают отклик, попробуйте другие классификаторы с более высокой гибкостью. Чтобы избежать переоборудования, найдите модель меньшей гибкости, которая обеспечивает достаточную точность.

  3. Если требуется попробовать все неоптимизируемые модели одного или разных типов, выберите одну из опций Все (All) в галерее Тип модели (Model Type).

    Кроме того, если требуется автоматически настроить гиперпараметры определенного типа модели, выберите соответствующую модель Optimizable и выполните оптимизацию гиперпараметров. Дополнительные сведения см. в разделе Оптимизация гиперпараметров в приложении Classification Learner.

Следующие шаги см. в разделе Сравнение и улучшение классификационных моделей.

Обучение работе с параллельными классификаторами

Модели можно обучать параллельно с помощью программы Classification Learner при наличии панели инструментов Parallel Computing Toolbox. Параллельное обучение позволяет обучать сразу несколько классификаторов и продолжать работу.

Чтобы управлять параллельным обучением, переключите кнопку «Использовать параллельное» на панели инструментов приложения. Кнопка Использовать параллельные (Use Parallel) доступна только при наличии панели инструментов параллельных вычислений.

  1. При первом нажатии кнопки «» Обучение «» появляется диалоговое окно, в котором открывается параллельный пул работников. После открытия пула можно обучить сразу несколько классификаторов.

  2. Когда классификаторы обучаются параллельно, на панели Модели (Models) отображаются индикаторы хода выполнения для каждой модели обучения и поставленной в очередь, и при необходимости можно отменить отдельные модели. Во время обучения можно изучить результаты и графики из моделей и начать обучение большего количества классификаторов.

Если у вас есть панель инструментов Parallel Computing Toolbox, то параллельное обучение доступно в Classification Learner, и вам не нужно устанавливать UseParallel вариант statset функция.

Примечание

Параллельная оптимизация гиперпараметров невозможна. Приложение отключает кнопку «Использовать параллель» при выборе оптимизируемой модели. Если выбрать неоптимизируемую модель, кнопка по умолчанию выключена.

Сравнение и улучшение классификационных моделей

  1. Щелкните модели на панели Модели (Models), чтобы просмотреть результаты на графиках. Сравните производительность модели, проверив результаты в диаграмме рассеяния и матрице путаницы. Проверьте показатель точности (проверки), сообщенный для каждой модели.

    Кроме того, можно сравнить модели с помощью опций Сортировать по (Sort by) на панели Модели (Models). Удалите любую нежелательную модель, выбрав модель и нажав кнопку Удалить выбранную модель (Delete selected model) в верхней правой части панели или щелкнув модель правой кнопкой мыши и выбрав Удалить модель (Delete model).

    См. раздел Оценка производительности классификатора в программе Classification Learner.

  2. Выберите лучшую модель на панели Модели (Models), а затем попробуйте включить и исключить в модель различные элементы. Щелкните Выбор элемента (Feature Selection).

    Используйте график параллельных координат, чтобы определить удаляемые элементы. Узнайте, можно ли улучшить модель, удалив элементы с низкой прогнозируемой мощностью. Укажите предикторы для включения в модель и обучите новые модели с помощью новых опций. Сравните результаты между моделями на панели Модели (Models).

    Для уменьшения размерности можно также попытаться преобразовать элементы с помощью PCA.

    См. раздел Выбор и преобразование функций с помощью приложения Classification Learner.

  3. Чтобы улучшить модель, можно попробовать изменить настройки параметров классификатора в диалоговом окне Дополнительно (Advanced), а затем обучить с помощью новых опций. Сведения об управлении гибкостью модели см. в разделе Выбор параметров классификатора. Сведения об автоматической настройке параметров модели см. в разделе Оптимизация гиперпараметров в приложении Classification Learner.

  4. Если выбор элементов, параметры PCA или новые параметры улучшают модель, попробуйте обучить все типы моделей новым настройкам. Проверьте, лучше ли работать с новыми настройками для другого типа модели.

Совет

Чтобы избежать переоборудования, найдите модель меньшей гибкости, которая обеспечивает достаточную точность. Например, ищите простые модели, такие как деревья решений и дискриминанты, которые быстро и легко интерпретировать. Если модели недостаточно точно предсказывают отклик, выберите другие классификаторы с более высокой гибкостью, например ансамбли. Сведения о гибкости модели см. в разделе Выбор параметров классификатора.

На рисунке показано приложение с панелью Модели, содержащей различные типы классификаторов.

Совет

Пошаговый пример сравнения различных классификаторов см. в разделе Подготовка деревьев принятия решений с помощью приложения Classification Learner App.

Для выполнения следующих шагов создайте код для обучения модели другим данным или экспортируйте обученные модели в рабочую область, чтобы сделать прогнозы с использованием новых данных. См. раздел Экспорт модели классификации для прогнозирования новых данных.

Связанные темы