resubMargin

Поле классификации перезамены

Синтаксис

m = resubMargin(Mdl)

m = resubMargin(Mdl,'IncludeInteractions',includeInteractions)

Описание

m = resubMargin(Mdl) возвращает Поле Классификации перезамены (m) для обученной модели Mdl классификации использование данных о предикторе сохранено в Mdl.X и соответствующие истинные метки класса сохранены в Mdl.Y.

m возвращен как n-by-1 числовой вектор-столбец, где n является количеством наблюдений в данных о предикторе.

пример

m = resubMargin(Mdl,'IncludeInteractions',includeInteractions) задает, включать ли периоды взаимодействия в расчеты. Этот синтаксис применяется только к обобщенным аддитивным моделям.

Примеры

свернуть все

Оцените поля классификации перезамены наивного классификатора Байеса

Скрипт Open Live Script

Оцените перезамену поля классификации (в выборке) наивного классификатора Байеса. Поле наблюдения является наблюдаемым истинным счетом класса минус максимальный ложный счет класса среди всех баллов в соответствующем классе.

Загрузите fisheriris набор данных. Создайте X как числовая матрица, которая содержит четыре измерения для 150 ирисовых диафрагм. Создайте Y как массив ячеек из символьных векторов, который содержит соответствующие ирисовые разновидности.

load fisheriris
X = meas;
Y = species;

Обучите наивный классификатор Байеса с помощью предикторов X и класс маркирует Y. Методические рекомендации должны задать имена классов. fitcnb принимает, что каждый предиктор условно и нормально распределен.

Mdl = fitcnb(X,Y,'ClassNames',{'setosa','versicolor','virginica'})

Mdl = 
  ClassificationNaiveBayes
              ResponseName: 'Y'
     CategoricalPredictors: []
                ClassNames: {'setosa'  'versicolor'  'virginica'}
            ScoreTransform: 'none'
           NumObservations: 150
         DistributionNames: {'normal'  'normal'  'normal'  'normal'}
    DistributionParameters: {3x4 cell}


  Properties, Methods

Mdl обученный ClassificationNaiveBayes классификатор.

Оцените поля классификации перезамены.

m = resubMargin(Mdl);
median(m)

ans = 1.0000

Отобразите гистограмму полей классификации в выборке.

histogram(m,30,'Normalization','probability')
xlabel('In-Sample Margins')
ylabel('Probability')
title('Probability Distribution of the In-Sample Margins')

Figure contains an axes. The axes with title Probability Distribution of the In-Sample Margins contains an object of type histogram.

Предпочтены классификаторы, которые дают к относительно большим полям.

Выберите SVM Classifier Features by Examining In-Sample Margins

Скрипт Open Live Script

Выполните выбор признаков путем сравнения полей в выборке от многоуровневых моделей. Базирующийся только на этом сравнении, модель с самыми высокими полями является лучшей моделью.

Загрузите ionosphere набор данных. Задайте два набора данных:

fullX содержит все предикторы (кроме удаленного столбца 0s).
partX содержит последние 20 предикторов.

load ionosphere
fullX = X;
partX = X(:,end-20:end);

Обучите классификатор машины опорных векторов (SVM) каждому набору предиктора.

FullSVMModel = fitcsvm(fullX,Y);
PartSVMModel = fitcsvm(partX,Y);

Оцените поля в выборке для каждого классификатора.

fullMargins = resubMargin(FullSVMModel);
partMargins = resubMargin(PartSVMModel);
n = size(X,1);
p = sum(fullMargins < partMargins)/n

p = 0.2251

Приблизительно 22% полей из полной модели меньше тех из модели с меньшим количеством предикторов. Этот результат предполагает, что модель, обученная со всеми предикторами, лучше.

Сравните НОЖКИ путем исследования полей обучающей выборки и ребра

Скрипт Open Live Script

Сравните обобщенную аддитивную модель (GAM) с линейными членами к GAM и с линейными членами и с периоды взаимодействия путем исследования полей обучающей выборки и ребра. Базирующийся только на этом сравнении, классификаторе с самыми высокими полями и ребром лучшая модель.

Загрузите 1 994 данных о переписи, хранимых в census1994.mat. Набор данных состоит из демографических данных Бюро переписи США, чтобы предсказать, передает ли индивидуум 50 000$ в год. Задача классификации состоит в том, чтобы подобрать модель, которая предсказывает категорию зарплаты людей, учитывая их возраст, рабочий класс, образовательный уровень, семейное положение, гонку, и так далее.

load census1994

census1994 содержит обучающий набор данных adultdata и тестовые данные устанавливают adulttest. Уменьшать время выполнения для этого примера, поддемонстрационных 500 учебных наблюдений от adultdata при помощи datasample функция.

rng('default') % For reproducibility
NumSamples = 5e2;
adultdata = datasample(adultdata,NumSamples,'Replace',false);

Обучите GAM, который содержит и линейные члены и периоды взаимодействия для предикторов. Задайте, чтобы включать все доступные периоды взаимодействия, p-значения которых не больше 0.05.

Mdl = fitcgam(adultdata,'salary','Interactions','all','MaxPValue',0.05)

Mdl = 
  ClassificationGAM
           PredictorNames: {1x14 cell}
             ResponseName: 'salary'
    CategoricalPredictors: [2 4 6 7 8 9 10 14]
               ClassNames: [<=50K    >50K]
           ScoreTransform: 'logit'
                Intercept: -32.0842
             Interactions: [82x2 double]
          NumObservations: 500


  Properties, Methods

Mdl ClassificationGAM объект модели. Mdl включает 82 периода взаимодействия.

Оцените поля обучающей выборки и ребро для Mdl.

M = resubMargin(Mdl);
E = resubEdge(Mdl)

E = 1.0000

Оцените поля обучающей выборки и ребро для Mdl без включения периодов взаимодействия.

M_nointeractions = resubMargin(Mdl,'IncludeInteractions',false);
E_nointeractions = resubEdge(Mdl,'IncludeInteractions',false)

E_nointeractions = 0.9516

Отобразите распределения полей с помощью диаграмм.

boxplot([M M_nointeractions],'Labels',{'Linear and Interaction Terms','Linear Terms Only'})
title('Box Plots of Training Sample Margins')

Figure contains an axes. The axes with title Box Plots of Training Sample Margins contains 14 objects of type line.

Когда вы включаете периоды взаимодействия в расчет, все значения поля перезамены для Mdl 1, и значение ребра перезамены (среднее значение полей) равняется 1. Поля и ребро уменьшаются, когда вы не включаете периоды взаимодействия в Mdl.

Входные параметры

свернуть все

`Mdl` — Модель машинного обучения классификации
полный объект модели классификации

Модель машинного обучения классификации в виде полного объекта модели классификации, как дали в следующей таблице поддерживаемых моделей.

Модель	Объект модели классификации
Обобщенная аддитивная модель	`ClassificationGAM`
k- соседняя модель	`ClassificationKNN`
Наивная модель Bayes	`ClassificationNaiveBayes`
Модель нейронной сети	`ClassificationNeuralNetwork`
Машина опорных векторов для и бинарной классификации одного класса	`ClassificationSVM`

`includeInteractions` — Отметьте, чтобы включать периоды взаимодействия
`true` | `false`

Отметьте, чтобы включать периоды взаимодействия модели в виде true или false. Этот аргумент допустим только для обобщенной аддитивной модели (GAM). Таким образом, можно задать этот аргумент только когда Mdl ClassificationGAM.

Значением по умолчанию является true если Mdl содержит периоды взаимодействия. Значением должен быть false если модель не содержит периоды взаимодействия.

Типы данных: логический

Больше о

свернуть все

Поле классификации

classification margin для бинарной классификации, для каждого наблюдения, различия между классификационной оценкой для истинного класса и классификационной оценкой для ложного класса. classification margin для классификации мультиклассов является различием между классификационной оценкой для истинного класса и максимальной классификационной оценкой для ложных классов.

Если поля находятся по той же шкале (то есть, значения баллов основаны на том же преобразовании счета), то они служат мерой по доверию классификации. Среди нескольких классификаторов те, которые дают к большим полям, лучше.

Алгоритмы

resubMargin вычисляет поле классификации согласно соответствию margin функция объекта (Mdl). Для описания модели специфичного смотрите margin страницы ссылки на функцию в следующей таблице.

Модель	Объект модели классификации (`Mdl`)	`margin` Объектная функция
Обобщенная аддитивная модель	`ClassificationGAM`	`margin`
k- соседняя модель	`ClassificationKNN`	`margin`
Наивная модель Bayes	`ClassificationNaiveBayes`	`margin`
Модель нейронной сети	`ClassificationNeuralNetwork`	`margin`
Машина опорных векторов для и бинарной классификации одного класса	`ClassificationSVM`	`margin`

Расширенные возможности

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Указания и ограничения по применению:

Эта функция поддерживает ClassificationKNN и ClassificationSVM объекты снабжены входными параметрами графического процессора массивов.

Для получения дополнительной информации смотрите функции MATLAB Запуска на графическом процессоре (Parallel Computing Toolbox).

Представленный в R2012a

Документация

resubMargin

Синтаксис

Описание

Примеры

Оцените поля классификации перезамены наивного классификатора Байеса

Выберите SVM Classifier Features by Examining In-Sample Margins

Сравните НОЖКИ путем исследования полей обучающей выборки и ребра

Входные параметры

`Mdl` — Модель машинного обучения классификации
полный объект модели классификации

`includeInteractions` — Отметьте, чтобы включать периоды взаимодействия
`true` | `false`

Больше о

Поле классификации

Алгоритмы

Расширенные возможности

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Смотрите также

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

resubMargin

Синтаксис

Описание

Примеры

Оцените поля классификации перезамены наивного классификатора Байеса

Выберите SVM Classifier Features by Examining In-Sample Margins

Сравните НОЖКИ путем исследования полей обучающей выборки и ребра

Входные параметры

Mdl — Модель машинного обучения классификации полный объект модели классификации

includeInteractions — Отметьте, чтобы включать периоды взаимодействия true | false

Больше о

Поле классификации

Алгоритмы

Расширенные возможности

Массивы графического процессора Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Смотрите также

Документация Statistics and Machine Learning Toolbox

Поддержка

`Mdl` — Модель машинного обучения классификации
полный объект модели классификации

`includeInteractions` — Отметьте, чтобы включать периоды взаимодействия
`true` | `false`

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.