exponenta event banner

Проверка производительности модели с помощью тестового набора в приложении для учащихся с регрессией

В этом примере показано, как обучить несколько моделей в модуле Regression Learner и определить наиболее эффективные модели на основе их метрик проверки. Проверьте метрики теста для наиболее эффективных моделей, обученных полному набору данных, включая данные обучения и проверки.

  1. В окне команд MATLAB ® загрузите carbig и создайте таблицу, содержащую большинство переменных. Разделите таблицу на учебные и тестовые наборы.

    load carbig
    cartable = table(Acceleration,Cylinders,Displacement, ...
        Horsepower,Model_Year,Weight,Origin,MPG);
    
    rng('default') % For reproducibility of the data split
    n = length(MPG);
    partition = cvpartition(n,'Holdout',0.15);
    idxTrain = training(partition); % Indices for the training set
    cartableTrain = cartable(idxTrain,:);
    cartableTest = cartable(~idxTrain,:);
  2. Открыть обучающегося регрессии. Перейдите на вкладку Приложения и щелкните стрелку справа от раздела Приложения, чтобы открыть галерею приложений. В группе Machine Learning and Deep Learning выберите Regression Learner.

  3. На вкладке Обучающийся регрессии (Regression Learner) в разделе Файл (File) щелкните Создать сеанс (New Session) и выберите Из рабочей области (From Workspace).

  4. В диалоговом окне «Новая сессия из рабочей области» выберите cartableTrain из списка «Переменная набора данных».

    Как показано в диалоговом окне, приложение выбирает переменные ответа и предиктора. Переменная ответа по умолчанию: MPG. Для защиты от переоборудования по умолчанию используется пятикратная перекрестная проверка. В этом примере не изменяйте параметры по умолчанию.

    New Session from Workspace dialog box

  5. Чтобы принять параметры по умолчанию и продолжить, щелкните Начать сеанс (Start Session).

  6. Обучение всех предустановленных моделей. На вкладке Обучающийся регрессии (Regression Learner) в разделе Тип модели (Model Type) щелкните стрелку, чтобы открыть галерею. В группе Начало работы щелкните Все. В разделе Обучение щелкните Обучение. Приложение обучает один из предустановленных типов моделей и отображает модели на панели Модели.

    Совет

    При наличии Toolbox™ Параллельные вычисления (Parallel Computing) можно одновременно обучить все модели (Все), нажав кнопку Использовать параллельные (Use Parallel) в разделе Обучение (Training), прежде чем нажать кнопку Поезд (Train). После нажатия кнопки Обучить открывается диалоговое окно Открытие параллельного пула, которое остается открытым, пока приложение открывает параллельный пул работников. В течение этого времени взаимодействие с программным обеспечением невозможно. После открытия пула приложение одновременно обучает модели.

  7. Сортируйте обученные модели на основе среднеквадратичной ошибки (RMSE). На панели Модели (Models) откройте список Сортировать по (Sort by) и выберите RMSE (Validation).

  8. На панели Модели (Models) щелкните звездообразные значки рядом с тремя моделями с наименьшей проверкой RMSE. Приложение выделяет самый низкий RMSE проверки, указывая его в рамке. В этом примере обученная модель Rational Quadratic GPR имеет самый низкий RMSE проверки.

    Response plot of the car data

    Приложение отображает график ответа на данные автомобиля. Синие точки являются истинными значениями, а желтые - прогнозируемыми значениями. На панели Модели (Models) слева отображается RMSE проверки для каждой модели.

    Примечание

    Проверка вносит некоторую случайность в результаты. Результаты проверки модели могут отличаться от результатов, показанных в этом примере.

  9. Проверьте производительность тестового набора наиболее эффективных моделей. Начните с импорта тестовых данных в приложение.

    На вкладке Обучающийся регрессии в разделе Тестирование щелкните Тестовые данные и выберите Из рабочей области.

  10. В диалоговом окне Import Test Data выберите cartableTest из списка Test Data Set Variable.

    Как показано в диалоговом окне, приложение идентифицирует переменные ответа и предиктора.

    Import Test Data dialog box

  11. Щелкните Импорт (Import).

  12. Вычислите RMSE лучших предустановленных моделей на cartableTest данные. Для удобства вычислите набор тестов RMSE для всех моделей одновременно. На вкладке Regression Learner в разделе Testing нажмите Test All и выберите Test All. Приложение вычисляет производительность тестового набора модели, обученной на полном наборе данных, включая данные обучения и проверки.

  13. Сортируйте модели на основе тестового набора RMSE. На панели Модели (Models) откройте список Сортировать по (Sort by) и выберите RMSE (Test). Приложение по-прежнему описывает метрику для модели с самым низким RMSE проверки, несмотря на отображение тестового RMSE.

  14. Визуально проверьте характеристики тестового набора моделей. На вкладке Обучающийся регрессии (Regression Learner) в разделе Графики (Plots) щелкните Прогнозируемые и фактические (Predicted vs. Actual) и выберите Тестовые данные (Test Data). Можно переключаться между моделями для сравнения их производительности.

    В этом примере обученный Medium Gaussian SVM работает с данными тестового набора лучше, чем две другие модели.

    Test set Predicted vs. Actual plot for the medium Gaussian SVM model

  15. Сравните данные проверки и тестирования RMSE для обученной модели среднего гауссова SVM. На панели Сводка по текущей модели (Current Model Summary) сравните значение RMSE (Проверка) в разделе Результаты обучения (Training Results) со значением RMSE (Test) в разделе Результаты тестирования (Test Results). В этом примере два значения близки, что указывает на то, что проверка RMSE является хорошей оценкой тестового RMSE для этой модели.

Связанные темы