Сравните обобщенную аддитивную модель (GAM) с линейными терминами к GAM как с линейными терминами, так и с терминами взаимодействия путем исследования полей и ребра обучающей выборки. Основываясь исключительно на этом сравнении, классификатор с самыми высокими полями и ребром является лучшей моделью.
Загрузка данных переписи 1994 года, хранящихся в census1994.mat. Набор данных состоит из демографических данных Бюро переписи населения США, чтобы предсказать, составляет ли индивидуум более 50 000 долларов в год. Задача классификации состоит в том, чтобы соответствовать модели, которая предсказывает категорию заработной платы людей с учетом их возраста, рабочего класса, уровня образования, семейного положения, расы и так далее.
census1994 содержит обучающий набор обучающих данных adultdata и набор тестовых данных adulttest. Чтобы уменьшить время работы для этого примера, выделите 500 обучающих наблюдений из adultdata при помощи datasample функция.
Обучите GAM, который содержит как линейные, так и условия взаимодействия для предикторов. Задайте, чтобы включить все доступные условия взаимодействия, значения p которых не более 0,05.
Mdl =
ClassificationGAM
PredictorNames: {1x14 cell}
ResponseName: 'salary'
CategoricalPredictors: [2 4 6 7 8 9 10 14]
ClassNames: [<=50K >50K]
ScoreTransform: 'logit'
Intercept: -32.0842
Interactions: [82x2 double]
NumObservations: 500
Properties, Methods
Mdl является ClassificationGAM объект модели. Mdl включает 82 условия взаимодействия.
Оцените поля и ребро обучающей выборки для Mdl.
Оцените поля и ребро обучающей выборки для Mdl без включения условий взаимодействия.
E_nointeractions = 0.9516
Отображение распределений полей с помощью прямоугольных графиков.
Когда вы включаете условия взаимодействия в расчет, все значения запаса для реституции для Mdl равны 1, и значение ребра восстановления (среднее значение полей) равняется 1. Поля и ребро уменьшаются, когда вы не включаете условия взаимодействия в Mdl.