exponenta event banner

Выбор и преобразование функций с помощью приложения для учащихся с регрессией

Исследовать элементы на графике ответа

В модуле Regression Learner используйте график ответа, чтобы попытаться определить предикторы, которые полезны для прогнозирования ответа. Чтобы визуализировать связь между различными предикторами и ответом, под осью X выберите различные переменные в списке X.

Перед тренировкой регрессионной модели на графике ответа отображаются обучающие данные. Если вы обучили регрессионную модель, то график отклика также показывает прогнозы модели.

Обратите внимание, какие переменные наиболее четко связаны с ответом. При построении графика carbig набор данных, предиктор Horsepower показывает явную отрицательную связь с ответом.

Найдите элементы, которые, по-видимому, не связаны с ответом, и используйте команду Выбор элементов , чтобы удалить эти элементы из набора используемых предикторов.

Графики ответов, созданные в приложении, можно экспортировать в фигуры. См. раздел Экспорт графиков в приложении для учащихся с регрессией.

Выбор элементов для включения

В модуле Regression Learner можно указать различные функции (или предикторы) для включения в модель. Узнайте, можно ли улучшить модели, удалив функции с низкой прогнозируемой мощностью. Если сбор данных является дорогостоящим или сложным, вы можете предпочесть модель, которая удовлетворительно работает с меньшим количеством предикторов.

  1. На вкладке Обучающийся регрессии в разделе Элементы щелкните Выбор элемента.

  2. В диалоговом окне Выбор элемента (Feature Selection) снимите флажки для предикторов, которые требуется исключить.

    Совет

    Диалоговое окно «Выбор элемента» можно закрыть или переместить. Варианты, выбранные в диалоговом окне, остаются.

  3. Щелкните Обучить (Train), чтобы обучить новую модель с помощью новых опций предиктора.

  4. Просмотрите новую модель на панели Модели (Models). На панели Сводка текущей модели (Current Model Summary) отображается количество исключенных предикторов.

  5. Проверьте, какие предикторы включены в обученную модель. Щелкните модель на панели Модели (Models) и просмотрите флажки в окне Выбор элемента (Feature Selection).

  6. Попробуйте улучшить модель, включив в нее различные функции.

Пример выбора элементов см. в разделе Дерево регрессии поезда с помощью приложения для обучения регрессии.

Преобразование функций с помощью PCA в модуле регрессии

Используйте анализ главных компонентов (PCA), чтобы уменьшить размерность пространства предиктора. Уменьшение размерности может создать регрессионные модели в модуле Regression Learner, которые помогут предотвратить переоборудование. PCA линейно преобразует предикторы для удаления избыточных измерений и генерирует новый набор переменных, называемых главными компонентами.

  1. На вкладке Обучающийся регрессии в разделе Элементы выберите PCA.

  2. В диалоговом окне Дополнительные параметры PCA установите флажок Включить PCA.

    Можно закрыть диалоговое окно PCA или переместить его. Варианты, выбранные в диалоговом окне, остаются.

  3. Снова нажмите кнопку «Поезд». pca функция преобразует выбранные элементы перед обучением модели.

    По умолчанию PCA сохраняет только компоненты, объясняющие 95% отклонения. В диалоговом окне PCA можно изменить процент отклонения для объяснения, выбрав значение Объяснено отклонение. Более высокое значение может привести к переоборудованию, а более низкое - к удалению полезных измерений.

  4. Вручную ограничьте количество компонентов PCA. В списке Критерий сокращения компонентов выберите Specify number of components. Выберите значение Количество числовых компонентов. Число компонентов не может превышать число числовых предикторов. PCA не применяется к категориальным предикторам.

Опции PCA для обученных моделей можно проверить на панели Сводка текущей модели (Current Model Summary). Например:

PCA is keeping enough components to explain 95% variance. 
After training, 2 components were kept. 
Explained variance per component (in order): 92.5%, 5.3%, 1.7%, 0.5%
Проверьте описанные проценты отклонений, чтобы определить необходимость изменения количества компонентов.

Чтобы узнать больше о том, как модуль Regression Learner применяет PCA к данным, создайте код для обучаемой регрессионной модели. Для получения дополнительной информации о PCA см. pca функция.

Связанные темы