exponenta event banner

Модель регрессии с использованием оптимизации гиперпараметров в приложении для учащихся с регрессией

В этом примере показано, как настроить гиперпараметры регрессионного ансамбля с помощью оптимизации гиперпараметров в приложении «Обучающийся регрессии». Сравните производительность тестового набора обучаемого оптимизируемого ансамбля с производительностью модели наилучшего предустановленного ансамбля.

  1. В окне команд MATLAB ® загрузите carbig и создайте таблицу, содержащую большинство переменных. Разделите таблицу на учебные и тестовые наборы.

    load carbig
    cartable = table(Acceleration,Cylinders,Displacement, ...
        Horsepower,Model_Year,Weight,Origin,MPG);
    
    rng('default') % For reproducibility of the data split
    n = length(MPG);
    partition = cvpartition(n,'Holdout',0.15);
    idxTrain = training(partition); % Indices for the training set
    cartableTrain = cartable(idxTrain,:);
    cartableTest = cartable(~idxTrain,:);
  2. Открыть обучающегося регрессии. Перейдите на вкладку Приложения и щелкните стрелку справа от раздела Приложения, чтобы открыть галерею приложений. В группе Machine Learning and Deep Learning выберите Regression Learner.

  3. На вкладке Обучающийся регрессии в разделе Файл выберите Создать сеанс > Из рабочей области.

  4. В диалоговом окне «Новая сессия из рабочей области» выберите cartableTrain из списка «Переменная набора данных».

    Как показано в диалоговом окне, приложение выбирает переменные ответа и предиктора. Переменная ответа по умолчанию: MPG. Для защиты от переоборудования по умолчанию используется пятикратная перекрестная проверка. В этом примере не изменяйте параметры по умолчанию.

    New Session from Workspace dialog box

  5. Чтобы принять параметры по умолчанию и продолжить, щелкните Начать сеанс (Start Session).

  6. Обучение всех предустановленных моделей ансамбля. На вкладке Обучающийся регрессии (Regression Learner) в разделе Тип модели (Model Type) щелкните стрелку, чтобы открыть галерею. В группе «Ансамбли деревьев» выберите «Все ансамбли». В разделе Обучение щелкните Обучение. Приложение обучает одну из моделей каждого типа и отображает модели на панели Модели.

    Совет

    При наличии Toolbox™ параллельных вычислений можно одновременно обучить все модели ансамблей (все ансамбли), нажав кнопку Использовать параллельные (Use Parallel) в разделе Обучение (Training), прежде чем нажать кнопку Обучить (Train). После нажатия кнопки Обучить открывается диалоговое окно Открытие параллельного пула, которое остается открытым, пока приложение открывает параллельный пул работников. В течение этого времени взаимодействие с программным обеспечением невозможно. После открытия пула приложение одновременно обучает модели ансамбля.

    Response plot of the car data

    Приложение отображает график ответа на данные автомобиля. Синие точки являются истинными значениями, а желтые - прогнозируемыми значениями. На панели Модели (Models) слева отображается RMSE проверки для каждой модели.

    Примечание

    Проверка вносит некоторую случайность в результаты. Результаты проверки модели могут отличаться от результатов, показанных в этом примере.

  7. Выберите оптимизируемую модель ансамбля для обучения. На вкладке Обучающийся регрессии (Regression Learner) в разделе Тип модели (Model Type) щелкните стрелку, чтобы открыть галерею. В группе «Ансамбли деревьев» выберите «Оптимизируемый ансамбль». Приложение отключает кнопку «Использовать параллель» при выборе оптимизируемой модели.

  8. Выберите гиперпараметры модели для оптимизации. В разделе Тип модели (Model Type) выберите Дополнительно (Advanced) > Дополнительно (Advanced). Приложение открывает диалоговое окно, в котором можно установить флажки Оптимизировать для гиперпараметров, которые требуется оптимизировать. По умолчанию установлены все флажки. В этом примере примите значения по умолчанию и закройте диалоговое окно.

    Select Ensemble Hyperparameters to Optimize dialog box

  9. В разделе Обучение щелкните Обучение.

  10. Приложение отображает график Minimum MSE при выполнении процесса оптимизации. При каждой итерации приложение пробует различную комбинацию значений гиперпараметров и обновляет график с минимальной среднеквадратичной ошибкой (MSE), наблюдаемой до этой итерации, обозначенной темно-синим цветом. Когда приложение завершает процесс оптимизации, оно выбирает набор оптимизированных гиперпараметров, обозначенных красным квадратом. Дополнительные сведения см. в разделе Минимальный график MSE.

    Приложение перечисляет оптимизированные гиперпараметры в разделе «Результаты оптимизации» справа от графика и в разделе «Оптимизированные гиперпараметры» панели «Сводка текущей модели».

    Minimum MSE plot for the optimizable ensemble model

    Примечание

    В общем, результаты оптимизации не воспроизводимы.

  11. Сравните обучаемые модели предустановленных ансамблей с обучаемыми оптимизируемыми моделями. На панели Модели приложение выделяет наименьший RMSE (Validation) (среднеквадратичная ошибка корня проверки), помещая его в рамку. В этом примере обучаемый оптимизируемый ансамбль превосходит две заданные модели.

    Обученная оптимизируемая модель не всегда имеет более низкий RMSE, чем обученные предустановленные модели. Если обученная оптимизируемая модель работает плохо, можно попытаться получить лучшие результаты, выполнив оптимизацию дольше. В разделе «Тип модели» выберите «Дополнительно» > «Параметры оптимизатора». В диалоговом окне увеличьте значение Итерации (Iterations). Например, можно дважды щелкнуть значение по умолчанию 30 и введите значение 60.

  12. Поскольку гиперпараметрическая настройка часто приводит к переполненным моделям, проверьте производительность оптимизируемой модели ансамбля на тестовом наборе и сравните ее с производительностью лучшей заданной модели ансамбля. Начните с импорта тестовых данных в приложение.

    На вкладке Обучающийся регрессии в разделе Тестирование выберите Тестовые данные > Из рабочей области.

  13. В диалоговом окне Import Test Data выберите cartableTest из списка Test Data Set Variable.

    Как показано в диалоговом окне, приложение идентифицирует переменные ответа и предиктора.

    Import Test Data dialog box

  14. Щелкните Импорт (Import).

  15. Вычислите RMSE лучшей предустановленной модели и оптимизируемой модели на cartableTest данные.

    Сначала на панели «Модели» щелкните звездочки рядом с моделью «Деревья в мешках» и моделью «Оптимизируемый ансамбль».

  16. Для каждой модели выберите модель на панели Модели (Models), а затем выберите Проверить все (Test All) > Проверить выбранные (Test Selected) в разделе Тестирование (Testing). Приложение вычисляет производительность тестового набора модели, обученной на полном наборе данных, включая данные обучения и проверки.

  17. Сортируйте модели на основе тестового набора RMSE. На панели Модели (Models) откройте список Сортировать по (Sort by) и выберите RMSE (Test).

    В этом примере обучаемый оптимизируемый ансамбль все еще превосходит обучаемую предварительно заданную модель на данных тестового набора.

    Trained models sorted by test RMSE

Связанные темы