Обучите модель регрессии Используя гипероптимизацию параметров управления в приложении Regression Learner

В этом примере показано, как настроить гиперпараметры ансамбля регрессии при помощи гипероптимизации параметров управления в приложении Regression Learner. Сравните эффективность набора тестов обученного optimizable ансамбля к той из лучше всего выполняющей предварительно установленной модели ансамбля.

  1. В MATLAB® Командное окно, загрузите carbig набор данных, и составляет таблицу, содержащую большинство переменных. Разделите таблицу на наборы обучающих данных и наборы тестов.

    load carbig
    cartable = table(Acceleration,Cylinders,Displacement, ...
        Horsepower,Model_Year,Weight,Origin,MPG);
    
    rng('default') % For reproducibility of the data split
    n = length(MPG);
    partition = cvpartition(n,'Holdout',0.15);
    idxTrain = training(partition); % Indices for the training set
    cartableTrain = cartable(idxTrain,:);
    cartableTest = cartable(~idxTrain,:);
  2. Открытый Regression Learner. Кликните по вкладке Apps, и затем кликните по стреле справа от раздела Apps, чтобы открыть галерею Apps. В группе Machine Learning and Deep Learning нажмите Regression Learner.

  3. На вкладке Regression Learner, в разделе File, выбирают New Session > From Workspace.

  4. В диалоговом окне New Session from Workspace выберите cartableTrain таблица из списка Data Set Variable.

    Как показано в диалоговом окне, приложение выбирает переменные отклика и переменные предикторы. Переменной отклика по умолчанию является MPG. Опция валидации по умолчанию является 5-кратной перекрестной проверкой, чтобы защитить от сверхподбора кривой. В данном примере не изменяйте настройки по умолчанию.

    New Session from Workspace dialog box

  5. Чтобы принять опции по умолчанию и продолжиться, нажмите Start Session.

  6. Обучите все предварительно установленные модели ансамбля. На вкладке Regression Learner, в разделе Model Type, кликают по стреле, чтобы открыть галерею. В группе Ensembles of Trees нажмите All Ensembles. В разделе Training нажмите Train. Приложение обучает один из каждого типа модели ансамбля и отображает модели в панели Models.

    Совет

    Если у вас есть Parallel Computing Toolbox™, можно обучить все модели ансамбля (All Ensembles) одновременно путем нажатия кнопки Use Parallel в разделе Training перед нажатием Train. После того, как вы нажимаете Train, диалоговое окно Opening Parallel Pool открывается и остается открытым, в то время как приложение открывает параллельный пул рабочих. В это время вы не можете взаимодействовать с программным обеспечением. После того, как пул открывается, приложение обучает модели ансамбля одновременно.

    Response plot of the car data modeled by a boosted trees ensemble model

    Отображения приложения график отклика для первой модели (модель 1.1). Синие точки являются истинными значениями, и желтые точки являются ожидаемыми значениями. Панель Models слева показывает валидации RMSE для каждой модели.

    Примечание

    Валидация вводит некоторую случайность в результаты. Ваши результаты проверки допустимости модели могут варьироваться от результатов, показанных в этом примере.

  7. Выберите optimizable модель ансамбля, чтобы обучаться. На вкладке Regression Learner, в разделе Model Type, кликают по стреле, чтобы открыть галерею. В группе Ensembles of Trees нажмите Optimizable Ensemble. Приложение отключает кнопку Use Parallel, когда вы выбираете optimizable модель.

  8. Выберите гиперпараметры модели, чтобы оптимизировать. В разделе Model Type выберите Advanced > Advanced. Приложение открывает диалоговое окно, в котором можно установить флажки Optimize для гиперпараметров, которые вы хотите оптимизировать. По умолчанию все флажки устанавливаются. В данном примере примите выборы по умолчанию и нажмите OK.

    Select Ensemble Hyperparameters to Optimize dialog box

  9. В разделе Training нажмите Train.

  10. Отображения приложения Minimum MSE Plot, когда это запускает процесс оптимизации. В каждой итерации приложение пробует различную комбинацию гиперзначений параметров и обновляет график с минимальной среднеквадратической ошибкой (MSE) валидации, наблюдаемой до той итерации, обозначенной в темно-синем. Когда приложение завершает процесс оптимизации, оно выбирает набор оптимизированных гиперпараметров, обозначенных красным квадратом. Для получения дополнительной информации см. Минимальный График MSE.

    Списки приложений оптимизированные гиперпараметры и в разделе Optimization Results справа от графика и в разделе Optimized Hyperparameters панели Current Model Summary.

    Minimum MSE plot for the optimizable ensemble model

    Примечание

    В общем случае результаты оптимизации не восстанавливаемы.

  11. Сравните обученные предварительно установленные модели ансамбля с обученной optimizable моделью. В панели Models приложение подсвечивает самый низкий RMSE (Validation) (среднеквадратическая ошибка валидации) путем выделения его в поле. В этом примере обученный optimizable ансамбль превосходит две предварительно установленных модели по характеристикам.

    Обученная optimizable модель не всегда имеет более низкий RMSE, чем обученные предварительно установленные модели. Если обученная optimizable модель не выполняет хорошо, можно попытаться получить лучшие результаты путем выполнения оптимизации для дольше. В разделе Model Type выберите Advanced > Optimizer Options. В диалоговом окне увеличьте значение Iterations. Например, можно дважды кликнуть значение по умолчанию 30 и введите значение 60. Затем нажмите OK.

  12. Поскольку гиперпараметр, настраивающийся часто, приводит к сверхподобранным моделям, проверяйте эффективность optimizable модели ансамбля на наборе тестов и сравните его с эффективностью лучшей предварительно установленной модели ансамбля. Начните путем импорта тестовых данных в приложение.

    На вкладке Regression Learner, в разделе Testing, выбирают Test Data > From Workspace.

  13. В диалоговом окне Import Test Data выберите cartableTest таблица из списка Test Data Set Variable.

    Как показано в диалоговом окне, приложение идентифицирует переменные отклика и переменные предикторы.

    Import Test Data dialog box

  14. Нажмите Import.

  15. Вычислите RMSE лучшей предварительно установленной модели и optimizable модели на cartableTest данные.

    Во-первых, в панели Models, кликните по значкам звезды рядом с моделью Bagged Trees и моделью Optimizable Ensemble.

  16. Для каждой модели выберите модель в панели Models, и затем выберите Test All > Test Selected в разделе Testing. Приложение вычисляет эффективность набора тестов модели, обученной на полном наборе данных, включая данные об обучении и валидации.

  17. Сортировка моделей на основе набора тестов RMSE. В панели Models откройте список Sort by и выберите RMSE (Test).

    В этом примере обученный optimizable ансамбль все еще превосходит обученную предварительно установленную модель по характеристикам на данных о наборе тестов.

    Trained models sorted by test RMSE

Похожие темы