Сравните обобщенную аддитивную модель (GAM) с линейными терминами к GAM как с линейными терминами, так и с терминами взаимодействия путем исследования полей и ребра обучающей выборки. Основываясь исключительно на этом сравнении, классификатор с самыми высокими полями и ребром является лучшей моделью.
Загрузка данных переписи 1994 года, хранящихся в census1994.mat
. Набор данных состоит из демографических данных Бюро переписи населения США, чтобы предсказать, составляет ли индивидуум более 50 000 долларов в год. Задача классификации состоит в том, чтобы соответствовать модели, которая предсказывает категорию заработной платы людей с учетом их возраста, рабочего класса, уровня образования, семейного положения, расы и так далее.
census1994
содержит обучающий набор обучающих данных adultdata
и набор тестовых данных adulttest
. Чтобы уменьшить время работы для этого примера, выделите 500 обучающих наблюдений из adultdata
при помощи datasample
функция.
Обучите GAM, который содержит как линейные, так и условия взаимодействия для предикторов. Задайте, чтобы включить все доступные условия взаимодействия, значения p которых не более 0,05.
Mdl =
ClassificationGAM
PredictorNames: {1x14 cell}
ResponseName: 'salary'
CategoricalPredictors: [2 4 6 7 8 9 10 14]
ClassNames: [<=50K >50K]
ScoreTransform: 'logit'
Intercept: -32.0842
Interactions: [82x2 double]
NumObservations: 500
Properties, Methods
Mdl
является ClassificationGAM
объект модели. Mdl
включает 82 условия взаимодействия.
Оцените поля и ребро обучающей выборки для Mdl
.
Оцените поля и ребро обучающей выборки для Mdl
без включения условий взаимодействия.
E_nointeractions = 0.9516
Отображение распределений полей с помощью прямоугольных графиков.
Когда вы включаете условия взаимодействия в расчет, все значения запаса для реституции для Mdl
равны 1, и значение ребра восстановления (среднее значение полей) равняется 1. Поля и ребро уменьшаются, когда вы не включаете условия взаимодействия в Mdl
.