Выбор признаков и преобразование функции Используя приложение Regression Learner

Исследуйте функции в графике отклика

В Regression Learner используйте график отклика, чтобы попытаться идентифицировать предикторы, которые полезны для предсказания ответа. Визуализировать отношение между различными предикторами и ответом, под X-axis, избранными различными переменными в списке X.

Прежде чем вы обучите модель регрессии, график отклика показывает обучающие данные. Если вы обучили модель регрессии, то график отклика также показывает прогнозы модели.

Наблюдайте, какие переменные сопоставлены наиболее ясно с ответом. Когда вы строите carbig набор данных, предиктор Horsepower показывает ясную отрицательную связь с ответом.

Ищите функции, которые, кажется, не имеют связи с ответом и не используют Feature Selection , чтобы удалить те функции из набора используемых предикторов.

Можно экспортировать графики отклика, которые вы создаете в приложении фигурам. См. Графики Экспорта в Приложении Regression Learner.

Выберите Features to Include

В Regression Learner можно задать различные функции (или предикторы), чтобы включать в модель. Смотрите, можно ли улучшить модели путем удаления функций с низкой предсказательной силой. Если сбор данных является дорогим или трудным, вы можете предпочесть модель, которая выполняет удовлетворительно с меньшим количеством предикторов.

На вкладке Regression Learner, в разделе Features, нажимают Feature Selection .
В окне Feature Selection снимите флажки для предикторов, которые вы хотите исключить.
Совет
Можно закрыть окно Feature Selection или переместить его. Выбор, который вы делаете в окне, остается.
Нажмите Train, чтобы обучить новую модель с помощью новых опций предиктора.
Наблюдайте новую модель в Списке предыстории. Окно Current Model отображается, сколько предикторов исключено.
Проверяйте, какие предикторы включены в обученную модель. Кликните по модели в Списке предыстории и посмотрите на флажки в окне Feature Selection.
Попытайтесь улучшить модель включением различных функций.

Для примера с помощью выбора признаков смотрите, Обучают Деревья Регрессии Используя Приложение Regression Learner.

Преобразуйте функции с PCA в Regression Learner

Используйте анализ главных компонентов (PCA), чтобы уменьшать размерность пробела предиктора. Сокращение размерности может создать модели регрессии в Regression Learner, что справка предотвращает сверхподбор кривой. PCA линейно преобразовывает предикторы, чтобы удалить избыточные размерности и генерирует новый набор названных основных компонентов переменных.

На вкладке Regression Learner, в разделе Features, выбирают PCA.
В Усовершенствованном Окне настроек PCA установите флажок Enable PCA.
Можно закрыть окно PCA или переместить его. Выбор, который вы делаете в окне, остается.
Нажмите Train снова. pca функционируйте преобразовывает ваши выбранные функции перед обучением модель.
По умолчанию PCA сохраняет только компоненты, которые объясняют 95% отклонения. В окне PCA можно изменить процент отклонения, чтобы объяснить в поле Explained variance. Более высокое значение рискует сверхсоответствовать, в то время как нижнее значение рискует удалять полезные размерности.
Вручную ограничьте количество компонентов PCA. В списке Component reduction criterion выберите Specify number of components. Отредактируйте номер в поле Number of numeric components. Количество компонентов не может быть больше, чем количество числовых предикторов. PCA не применяется к категориальным предикторам.

Можно проверять Опции PCA на обученные модели в окне Current Model. Например:

PCA is keeping enough components to explain 95% variance. 
After training, 2 components were kept. 
Explained variance per component (in order): 92.5%, 5.3%, 1.7%, 0.5%

Проверяйте объясненные проценты отклонения, чтобы решить, изменить ли количество компонентов.

Чтобы узнать больше, как Regression Learner применяет PCA к вашим данным, сгенерируйте код для своей обученной модели регрессии. Для получения дополнительной информации о PCA смотрите pca функция.

Документация