resubEdge

Ребро классификации перезамены

    Описание

    пример

    e = resubEdge(Mdl) возвращает взвешенное Ребро Классификации перезамены (e) для обученной модели Mdl классификации использование данных о предикторе сохранено в Mdl.X, соответствующие истинные метки класса сохранены в Mdl.Y, и веса наблюдения сохранены в Mdl.W.

    пример

    e = resubEdge(Mdl,'IncludeInteractions',includeInteractions) задает, включать ли периоды взаимодействия в расчеты. Этот синтаксис применяется только к обобщенным аддитивным моделям.

    Примеры

    свернуть все

    Загрузите ionosphere набор данных. Этот набор данных имеет 34 предиктора, и 351 бинарный ответ для радара возвращается, любой плохо ('b') или хороший ('g').

    load ionosphere

    Обучите классификатор машины опорных векторов (SVM). Стандартизируйте данные и задайте тот 'g' положительный класс.

    SVMModel = fitcsvm(X,Y,'Standardize',true,'ClassNames',{'b','g'});

    SVMModel обученный ClassificationSVM классификатор.

    Оцените ребро перезамены, которое является средним значением полей обучающей выборки.

    e = resubEdge(SVMModel)
    e = 5.0999
    

    Ребро классификатора измеряет среднее значение полей классификатора. Один способ выполнить выбор признаков состоит в том, чтобы сравнить ребра обучающей выборки от многоуровневых моделей. Базирующийся только на этом критерии, классификатор с самым высоким ребром является лучшим классификатором.

    Загрузите ionosphere набор данных. Удалите первые два предиктора для устойчивости.

    load ionosphere
    X = X(:,3:end);

    Задайте эти два набора данных:

    • fullX содержит все предикторы.

    • partX содержит 10 самых важных предикторов.

    fullX = X;
    idx = fscmrmr(X,Y);
    partX = X(:,idx(1:10));

    Обучите наивный классификатор Байеса каждому набору предиктора.

    FullMdl = fitcnb(fullX,Y);
    PartMdl = fitcnb(partX,Y);

    FullMdl и PartMdl обученный ClassificationNaiveBayes классификаторы.

    Оцените ребро обучающей выборки для каждого классификатора.

    fullEdge = resubEdge(FullMdl)
    fullEdge = 0.6554
    
    partEdge = resubEdge(PartMdl)
    partEdge = 0.7796
    

    Ребро классификатора, обученного на 10 самых важных предикторах, больше. Этот результат предполагает, что классификатор обучил использование, только те предикторы имеют лучшую подгонку в выборке.

    Сравните обобщенную аддитивную модель (GAM) с линейными членами к GAM и с линейными членами и с периоды взаимодействия путем исследования полей обучающей выборки и ребра. Базирующийся только на этом сравнении, классификаторе с самыми высокими полями и ребром лучшая модель.

    Загрузите 1 994 данных о переписи, хранимых в census1994.mat. Набор данных состоит из демографических данных Бюро переписи США, чтобы предсказать, передает ли индивидуум 50 000$ в год. Задача классификации состоит в том, чтобы подобрать модель, которая предсказывает категорию зарплаты людей, учитывая их возраст, рабочий класс, образовательный уровень, семейное положение, гонку, и так далее.

    load census1994

    census1994 содержит обучающий набор данных adultdata и тестовые данные устанавливают adulttest. Уменьшать время выполнения для этого примера, поддемонстрационных 500 учебных наблюдений от adultdata при помощи datasample функция.

    rng('default') % For reproducibility
    NumSamples = 5e2;
    adultdata = datasample(adultdata,NumSamples,'Replace',false);

    Обучите GAM, который содержит и линейные члены и периоды взаимодействия для предикторов. Задайте, чтобы включать все доступные периоды взаимодействия, p-значения которых не больше 0.05.

    Mdl = fitcgam(adultdata,'salary','Interactions','all','MaxPValue',0.05)
    Mdl = 
      ClassificationGAM
               PredictorNames: {1x14 cell}
                 ResponseName: 'salary'
        CategoricalPredictors: [2 4 6 7 8 9 10 14]
                   ClassNames: [<=50K    >50K]
               ScoreTransform: 'logit'
                    Intercept: -32.0842
                 Interactions: [82x2 double]
              NumObservations: 500
    
    
      Properties, Methods
    
    

    Mdl ClassificationGAM объект модели. Mdl включает 82 периода взаимодействия.

    Оцените поля обучающей выборки и ребро для Mdl.

    M = resubMargin(Mdl);
    E = resubEdge(Mdl)
    E = 1.0000
    

    Оцените поля обучающей выборки и ребро для Mdl без включения периодов взаимодействия.

    M_nointeractions = resubMargin(Mdl,'IncludeInteractions',false);
    E_nointeractions = resubEdge(Mdl,'IncludeInteractions',false)
    E_nointeractions = 0.9516
    

    Отобразите распределения полей с помощью диаграмм.

    boxplot([M M_nointeractions],'Labels',{'Linear and Interaction Terms','Linear Terms Only'})
    title('Box Plots of Training Sample Margins')

    Figure contains an axes. The axes with title Box Plots of Training Sample Margins contains 14 objects of type line.

    Когда вы включаете периоды взаимодействия в расчет, все значения поля перезамены для Mdl 1, и значение ребра перезамены (среднее значение полей) равняется 1. Поля и ребро уменьшаются, когда вы не включаете периоды взаимодействия в Mdl.

    Входные параметры

    свернуть все

    Модель машинного обучения классификации в виде полного объекта модели классификации, как дали в следующей таблице поддерживаемых моделей.

    МодельОбъект модели классификации
    Обобщенная аддитивная модельClassificationGAM
    k- соседняя модельClassificationKNN
    Наивная модель BayesClassificationNaiveBayes
    Модель нейронной сетиClassificationNeuralNetwork
    Машина опорных векторов для и бинарной классификации одного классаClassificationSVM

    Отметьте, чтобы включать периоды взаимодействия модели в виде true или false. Этот аргумент допустим только для обобщенной аддитивной модели (GAM). Таким образом, можно задать этот аргумент только когда Mdl ClassificationGAM.

    Значением по умолчанию является true если Mdl содержит периоды взаимодействия. Значением должен быть false если модель не содержит периоды взаимодействия.

    Типы данных: логический

    Больше о

    свернуть все

    Ребро классификации

    classification edge является взвешенным средним полей классификации.

    Один способ выбрать среди нескольких классификаторов, например, выполнить выбор признаков, состоит в том, чтобы выбрать классификатор, который дает к самому большому ребру.

    Поле классификации

    classification margin для бинарной классификации, для каждого наблюдения, различия между классификационной оценкой для истинного класса и классификационной оценкой для ложного класса. classification margin для классификации мультиклассов является различием между классификационной оценкой для истинного класса и максимальной классификационной оценкой для ложных классов.

    Если поля находятся по той же шкале (то есть, значения баллов основаны на том же преобразовании счета), то они служат мерой по доверию классификации. Среди нескольких классификаторов те, которые дают к большим полям, лучше.

    Алгоритмы

    resubEdge вычисляет ребро классификации согласно соответствию edge функция объекта (Mdl). Для описания модели специфичного смотрите edge страницы ссылки на функцию в следующей таблице.

    МодельОбъект модели классификации (Mdl)edge Объектная функция
    Обобщенная аддитивная модельClassificationGAMedge
    k- соседняя модельClassificationKNNedge
    Наивная модель BayesClassificationNaiveBayesedge
    Модель нейронной сетиClassificationNeuralNetworkedge
    Машина опорных векторов для и бинарной классификации одного классаClassificationSVMedge

    Расширенные возможности

    Смотрите также

    | |

    Представленный в R2012a