resubMargin

Поле классификации перезамены

    Описание

    пример

    m = resubMargin(Mdl) возвращает Поле Классификации перезамены (m) для обученной модели Mdl классификации использование данных о предикторе сохранено в Mdl.X и соответствующие истинные метки класса сохранены в Mdl.Y.

    m возвращен как n-by-1 числовой вектор-столбец, где n является количеством наблюдений в данных о предикторе.

    пример

    m = resubMargin(Mdl,'IncludeInteractions',includeInteractions) задает, включать ли периоды взаимодействия в расчеты. Этот синтаксис применяется только к обобщенным аддитивным моделям.

    Примеры

    свернуть все

    Оцените перезамену поля классификации (в выборке) наивного классификатора Байеса. Поле наблюдения является наблюдаемым истинным счетом класса минус максимальный ложный счет класса среди всех баллов в соответствующем классе.

    Загрузите fisheriris набор данных. Создайте X как числовая матрица, которая содержит четыре измерения для 150 ирисовых диафрагм. Создайте Y как массив ячеек из символьных векторов, который содержит соответствующие ирисовые разновидности.

    load fisheriris
    X = meas;
    Y = species;

    Обучите наивный классификатор Байеса с помощью предикторов X и класс маркирует Y. Методические рекомендации должны задать имена классов. fitcnb принимает, что каждый предиктор условно и нормально распределен.

    Mdl = fitcnb(X,Y,'ClassNames',{'setosa','versicolor','virginica'})
    Mdl = 
      ClassificationNaiveBayes
                  ResponseName: 'Y'
         CategoricalPredictors: []
                    ClassNames: {'setosa'  'versicolor'  'virginica'}
                ScoreTransform: 'none'
               NumObservations: 150
             DistributionNames: {'normal'  'normal'  'normal'  'normal'}
        DistributionParameters: {3x4 cell}
    
    
      Properties, Methods
    
    

    Mdl обученный ClassificationNaiveBayes классификатор.

    Оцените поля классификации перезамены.

    m = resubMargin(Mdl);
    median(m)
    ans = 1.0000
    

    Отобразите гистограмму полей классификации в выборке.

    histogram(m,30,'Normalization','probability')
    xlabel('In-Sample Margins')
    ylabel('Probability')
    title('Probability Distribution of the In-Sample Margins')

    Figure contains an axes. The axes with title Probability Distribution of the In-Sample Margins contains an object of type histogram.

    Предпочтены классификаторы, которые дают к относительно большим полям.

    Выполните выбор признаков путем сравнения полей в выборке от многоуровневых моделей. Базирующийся только на этом сравнении, модель с самыми высокими полями является лучшей моделью.

    Загрузите ionosphere набор данных. Задайте два набора данных:

    • fullX содержит все предикторы (кроме удаленного столбца 0s).

    • partX содержит последние 20 предикторов.

    load ionosphere
    fullX = X;
    partX = X(:,end-20:end);

    Обучите классификатор машины опорных векторов (SVM) каждому набору предиктора.

    FullSVMModel = fitcsvm(fullX,Y);
    PartSVMModel = fitcsvm(partX,Y);

    Оцените поля в выборке для каждого классификатора.

    fullMargins = resubMargin(FullSVMModel);
    partMargins = resubMargin(PartSVMModel);
    n = size(X,1);
    p = sum(fullMargins < partMargins)/n
    p = 0.2251
    

    Приблизительно 22% полей из полной модели меньше тех из модели с меньшим количеством предикторов. Этот результат предполагает, что модель, обученная со всеми предикторами, лучше.

    Сравните обобщенную аддитивную модель (GAM) с линейными членами к GAM и с линейными членами и с периоды взаимодействия путем исследования полей обучающей выборки и ребра. Базирующийся только на этом сравнении, классификаторе с самыми высокими полями и ребром лучшая модель.

    Загрузите 1 994 данных о переписи, хранимых в census1994.mat. Набор данных состоит из демографических данных Бюро переписи США, чтобы предсказать, передает ли индивидуум 50 000$ в год. Задача классификации состоит в том, чтобы подобрать модель, которая предсказывает категорию зарплаты людей, учитывая их возраст, рабочий класс, образовательный уровень, семейное положение, гонку, и так далее.

    load census1994

    census1994 содержит обучающий набор данных adultdata и тестовые данные устанавливают adulttest. Уменьшать время выполнения для этого примера, поддемонстрационных 500 учебных наблюдений от adultdata при помощи datasample функция.

    rng('default') % For reproducibility
    NumSamples = 5e2;
    adultdata = datasample(adultdata,NumSamples,'Replace',false);

    Обучите GAM, который содержит и линейные члены и периоды взаимодействия для предикторов. Задайте, чтобы включать все доступные периоды взаимодействия, p-значения которых не больше 0.05.

    Mdl = fitcgam(adultdata,'salary','Interactions','all','MaxPValue',0.05)
    Mdl = 
      ClassificationGAM
               PredictorNames: {1x14 cell}
                 ResponseName: 'salary'
        CategoricalPredictors: [2 4 6 7 8 9 10 14]
                   ClassNames: [<=50K    >50K]
               ScoreTransform: 'logit'
                    Intercept: -32.0842
                 Interactions: [82x2 double]
              NumObservations: 500
    
    
      Properties, Methods
    
    

    Mdl ClassificationGAM объект модели. Mdl включает 82 периода взаимодействия.

    Оцените поля обучающей выборки и ребро для Mdl.

    M = resubMargin(Mdl);
    E = resubEdge(Mdl)
    E = 1.0000
    

    Оцените поля обучающей выборки и ребро для Mdl без включения периодов взаимодействия.

    M_nointeractions = resubMargin(Mdl,'IncludeInteractions',false);
    E_nointeractions = resubEdge(Mdl,'IncludeInteractions',false)
    E_nointeractions = 0.9516
    

    Отобразите распределения полей с помощью диаграмм.

    boxplot([M M_nointeractions],'Labels',{'Linear and Interaction Terms','Linear Terms Only'})
    title('Box Plots of Training Sample Margins')

    Figure contains an axes. The axes with title Box Plots of Training Sample Margins contains 14 objects of type line.

    Когда вы включаете периоды взаимодействия в расчет, все значения поля перезамены для Mdl 1, и значение ребра перезамены (среднее значение полей) равняется 1. Поля и ребро уменьшаются, когда вы не включаете периоды взаимодействия в Mdl.

    Входные параметры

    свернуть все

    Модель машинного обучения классификации в виде полного объекта модели классификации, как дали в следующей таблице поддерживаемых моделей.

    МодельОбъект модели классификации
    Обобщенная аддитивная модельClassificationGAM
    k- соседняя модельClassificationKNN
    Наивная модель BayesClassificationNaiveBayes
    Модель нейронной сетиClassificationNeuralNetwork
    Машина опорных векторов для и бинарной классификации одного классаClassificationSVM

    Отметьте, чтобы включать периоды взаимодействия модели в виде true или false. Этот аргумент допустим только для обобщенной аддитивной модели (GAM). Таким образом, можно задать этот аргумент только когда Mdl ClassificationGAM.

    Значением по умолчанию является true если Mdl содержит периоды взаимодействия. Значением должен быть false если модель не содержит периоды взаимодействия.

    Типы данных: логический

    Больше о

    свернуть все

    Поле классификации

    classification margin для бинарной классификации, для каждого наблюдения, различия между классификационной оценкой для истинного класса и классификационной оценкой для ложного класса. classification margin для классификации мультиклассов является различием между классификационной оценкой для истинного класса и максимальной классификационной оценкой для ложных классов.

    Если поля находятся по той же шкале (то есть, значения баллов основаны на том же преобразовании счета), то они служат мерой по доверию классификации. Среди нескольких классификаторов те, которые дают к большим полям, лучше.

    Алгоритмы

    resubMargin вычисляет поле классификации согласно соответствию margin функция объекта (Mdl). Для описания модели специфичного смотрите margin страницы ссылки на функцию в следующей таблице.

    МодельОбъект модели классификации (Mdl)margin Объектная функция
    Обобщенная аддитивная модельClassificationGAMmargin
    k- соседняя модельClassificationKNNmargin
    Наивная модель BayesClassificationNaiveBayesmargin
    Модель нейронной сетиClassificationNeuralNetworkmargin
    Машина опорных векторов для и бинарной классификации одного классаClassificationSVMmargin

    Расширенные возможности

    Смотрите также

    | |

    Представленный в R2012a
    Для просмотра документации необходимо авторизоваться на сайте