loss

Ошибка классификации

Синтаксис

L = loss(ens,tbl,ResponseVarName) L = loss(ens,tbl,Y) L = loss(ens,X,Y) L = loss(___,Name,Value)

Описание

L = loss(ens,tbl,ResponseVarName) возвращает ошибку классификации для ансамбля ens вычисленная таблица использования предикторов tbl и истинный класс маркирует tbl.ResponseVarName.

L = loss(ens,tbl,Y) возвращает ошибку классификации для ансамбля ens вычисленная таблица использования предикторов tbl и истинный класс маркирует Y.

L = loss(ens,X,Y) возвращает ошибку классификации для ансамбля ens вычисленная матрица использования предикторов X и истинный класс маркирует Y.

L = loss(___,Name,Value) вычисляет ошибку классификации с дополнительными опциями, заданными одним или несколькими Name,Value парные аргументы, с помощью любого из предыдущих синтаксисов.

При вычислении потери, loss нормирует вероятности класса в ResponseVarName или Y к вероятностям класса, используемым для обучения, сохраненного в Prior свойство ens.

Входные параметры

`ens`	Ансамбль классификации, созданный с `fitcensemble`, или компактный ансамбль классификации создается с `compact`.
`tbl`	Выборочные данные в виде таблицы. Каждая строка `tbl` соответствует одному наблюдению, и каждый столбец соответствует одному переменному предиктору. `tbl` должен содержать все предикторы, используемые, чтобы обучить модель. Многостолбцовые переменные и массивы ячеек кроме массивов ячеек из символьных векторов не позволены. Если вы обучили `ens` использование выборочных данных содержится в `table`, затем входные данные для этого метода должны также быть в таблице.
`ResponseVarName`	Имя переменной отклика в виде имени переменной в `tbl`. Необходимо задать `ResponseVarName` как вектор символов или строковый скаляр. Например, если переменная отклика `Y` хранится как `tbl.Y`, затем задайте его как `'Y'`. В противном случае программное обеспечение обрабатывает все столбцы `tbl`, включая `Y`, как предикторы, когда обучение модель.
`X`	Матрица данных, чтобы классифицировать. Каждая строка `X` представляет одно наблюдение, и каждый столбец представляет один предиктор. `X` должен иметь одинаковое число столбцов, когда данные раньше обучали `ensX` должен иметь одинаковое число строк как число элементов в `Y`. Если вы обучили `ens` с помощью выборочных данных, содержавшихся в матрице, затем, входные данные для этого метода должны также быть в матрице.
`Y`	Метки класса наблюдений в `tbl` или `XY` должен иметь тот же тип, как классификация раньше обучала `ens`, и его число элементов должно равняться количеству строк `tbl` или `X`.

Аргументы name-value

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

learners

Индексы слабых учеников в ансамбле в пределах от 1 к ens.NumTrained. loss использование только эти ученики для вычисления потери.

Значение по умолчанию: 1:NumTrained

Lossfun

Функция потерь в виде разделенной запятой пары, состоящей из 'LossFun' и встроенное имя функции потерь или указатель на функцию.

В следующей таблице перечислены доступные функции потерь. Задайте тот с помощью его соответствующего вектора символов или строкового скаляра.

Значение	Описание
`'binodeviance'`	Биномиальное отклонение
`'classiferror'`	Неправильно классифицированный уровень в десятичном числе
`'exponential'`	Экспоненциальная потеря
`'hinge'`	Потеря стержня
`'logit'`	Логистическая потеря
`'mincost'`	Минимальный ожидал стоимость misclassification (для классификационных оценок, которые являются апостериорными вероятностями),
`'quadratic'`	Квадратичная потеря

'mincost' подходит для классификационных оценок, которые являются апостериорными вероятностями.

Сложенный в мешок и ансамбли подпространства возвращают апостериорные вероятности по умолчанию (ens.Method 'Bag' или 'Subspace').
Если методом ансамбля является 'AdaBoostM1', 'AdaBoostM2', GentleBoost, или 'LogitBoost', затем, чтобы использовать апостериорные вероятности в качестве классификационных оценок, необходимо указать, что счет двойного логита преобразовывает путем ввода
```
ens.ScoreTransform = 'doublelogit';
```
Для всех других методов ансамбля программное обеспечение не поддерживает апостериорные вероятности как классификационные оценки.

Задайте свою собственную функцию с помощью обозначения указателя на функцию.
Предположим тот n будьте количеством наблюдений в X и K будьте количеством отличных классов (numel(ens.ClassNames), ens входная модель). Ваша функция должна иметь эту подпись
```
lossvalue = lossfun(C,S,W,Cost)
```
где:
- Выходной аргумент lossvalue скаляр.
- Вы выбираете имя функции (lossfun).
- C n- K логическая матрица со строками, указывающими, которые классифицируют соответствующее наблюдение, принадлежит. Порядок следования столбцов соответствует порядку класса в ens.ClassNames.
  Создайте C установкой C(p,q) = 1 если наблюдение p находится в классе q, для каждой строки. Установите все другие элементы строки p к 0.
- S n- K числовая матрица классификационных оценок. Порядок следования столбцов соответствует порядку класса в ens.ClassNamesS матрица классификационных оценок, похожих на выход predict.
- W n- 1 числовой вектор из весов наблюдения. Если вы передаете W, программное обеспечение нормирует их, чтобы суммировать к 1.
- Cost K-by-K числовая матрица затрат misclassification. Например, Cost = ones(K) - eye(K) задает стоимость 0 для правильной классификации и 1 для misclassification.
Задайте свое использование функции 'LossFun', @lossfun.

Для получения дополнительной информации о функциях потерь смотрите Потерю Классификации.

Значение по умолчанию: 'classiferror'

mode

Значение выхода L:

'ensemble' L скалярное значение, потеря для целого ансамбля.
'individual' L вектор с одним элементом на обученного ученика.
'cumulative' L вектор в который элемент J получен при помощи учеников 1:J из списка входов учеников.

Значение по умолчанию: 'ensemble'

UseObsForLearner

Логическая матрица размера N- T, где:

N количество строк X.
T количество слабых учеников в ens.

Когда UseObsForLearner(i,j) true, ученик j используется в предсказании класса строки i из X.

Значение по умолчанию: true(N,T)

weights

Вектор из весов наблюдения, с неотрицательными записями. Длина weights должен равняться количеству строк в X. Когда вы задаете веса, loss нормирует веса так, чтобы веса наблюдения в каждом классе суммировали к априорной вероятности того класса.

Значение по умолчанию: ones(size(X,1),1)

Выходные аргументы

`L`	Потеря классификации, по умолчанию часть неправильно классифицированных данных. `L` может быть вектор и может означать разные вещи, в зависимости от настроек пары "имя-значение".

Примеры

развернуть все

Оцените ошибку классификации

Скрипт Open Live Script

Загрузите ирисовый набор данных Фишера.

load fisheriris

Обучите ансамбль классификации 100 деревьев решений с помощью AdaBoostM2. Задайте пни как слабых учеников.

t = templateTree('MaxNumSplits',1);
ens = fitcensemble(meas,species,'Method','AdaBoostM2','Learners',t);

Оцените ошибку классификации модели с помощью учебных наблюдений.

L = loss(ens,meas,species)

L = 0.0333

В качестве альтернативы, если ens не компактно, затем можно оценить ошибку классификации обучающих выборок путем передачи ens к resubLoss.

Больше о

развернуть все

Потеря классификации

Функции Classification loss измеряют прогнозирующую погрешность моделей классификации. Когда вы сравниваете тот же тип потери среди многих моделей, более низкая потеря указывает на лучшую прогнозную модель.

Рассмотрите следующий сценарий.

L является средневзвешенной потерей классификации.
n является объемом выборки.
Для бинарной классификации:
- _yj является наблюдаемой меткой класса. Программные коды это как –1 или 1, указывая на отрицательный или положительный класс (или первый или второй класс в ClassNames свойство), соответственно.
- f (_Xj) является классификационной оценкой положительного класса для наблюдения (строка) j данных о предикторе X.
- _mj = _yj f (_Xj) является классификационной оценкой для классификации наблюдения j в класс, соответствующий _yj. Положительные значения _mj указывают на правильную классификацию и не способствуют очень средней потере. Отрицательные величины _mj указывают на неправильную классификацию и значительно способствуют средней потере.
Для алгоритмов, которые поддерживают классификацию мультиклассов (то есть, K ≥ 3):
- _yj^* вектор из K – 1 нуль, с 1 в положении, соответствующем истинному, наблюдаемому классу _yj. Например, если истинный класс второго наблюдения является третьим классом и K = 4, то y ₂^* = [0 0 1 0] ′. Порядок классов соответствует порядку в ClassNames свойство входной модели.
- f (_Xj) является длиной вектор K из музыки класса к наблюдению j данных о предикторе X. Порядок баллов соответствует порядку классов в ClassNames свойство входной модели.
- _mj = _yj^*′f (_Xj). Поэтому _mj является скалярной классификационной оценкой, которую модель предсказывает для истинного, наблюдаемого класса.
Весом для наблюдения j является _wj. Программное обеспечение нормирует веса наблюдения так, чтобы они суммировали к соответствующей предшествующей вероятности класса. Программное обеспечение также нормирует априорные вероятности, таким образом, они суммируют к 1. Поэтому

$\sum_{j = 1}^{n} w_{j} = 1.$

Учитывая этот сценарий, следующая таблица описывает поддерживаемые функции потерь, которые можно задать при помощи 'LossFun' аргумент пары "имя-значение".

Функция потерь	Значение `LossFun`	Уравнение
Биномиальное отклонение	`'binodeviance'`	$L = \sum_{j = 1}^{n} w_{j} \log {1 + \exp [- 2 m_{j}]} .$
Неправильно классифицированный уровень в десятичном числе	`'classiferror'`	$L = \sum_{j = 1}^{n} w_{j} I {{\hat{y}}_{j} \neq y_{j}} .$ ${\hat{y}}_{j}$ метка класса, соответствующая классу с максимальным счетом. I {·} является функцией индикатора.
Потеря перекрестной энтропии	`'crossentropy'`	`'crossentropy'` подходит только для моделей нейронной сети. Взвешенная потеря перекрестной энтропии $L = - \sum_{j = 1}^{n} \frac{{\tilde{w}}_{j} \log (m_{j})}{K n},$ где веса ${\tilde{w}}_{j}$ нормированы, чтобы суммировать к n вместо 1.
Экспоненциальная потеря	`'exponential'`	$L = \sum_{j = 1}^{n} w_{j} \exp (- m_{j}) .$
Потеря стержня	`'hinge'`	$L = \sum_{j = 1}^{n} w_{j} \max {0, 1 - m_{j}} .$
Потеря логита	`'logit'`	$L = \sum_{j = 1}^{n} w_{j} \log (1 + \exp (- m_{j})) .$
Минимальный ожидал стоимость misclassification	`'mincost'`	`'mincost'` является соответствующим, только если классификационные оценки являются апостериорными вероятностями. Программное обеспечение вычисляет взвешенную минимальную ожидаемую стоимость классификации с помощью этой процедуры для наблюдений j = 1..., n. Оцените ожидаемую misclassification стоимость классификации наблюдения _Xj в класс k: $γ_{j k} = {(f {(X_{j})}^{'} C)}_{k} .$ f (_Xj) является вектор-столбцом апостериорных вероятностей класса для двоичного файла и классификации мультиклассов для наблюдения _Xj. C является матрицей стоимости, сохраненной в `Cost` свойство модели. Для наблюдения j предскажите, что метка класса, соответствующая минимальному, ожидала стоимость misclassification: ${\hat{y}}_{j} = \underset{k = 1, ..., K}{argmin} γ_{j k} .$ Используя C, идентифицируйте, что стоимость подверглась (_cj) для того, чтобы сделать предсказание. Взвешенное среднее минимального ожидало, что потеря стоимости misclassification $L = \sum_{j = 1}^{n} w_{j} c_{j} .$ Если вы используете матрицу стоимости по умолчанию (чье значение элемента 0 для правильной классификации и 1 для неправильной классификации), то `'mincost'` потеря эквивалентна `'classiferror'` потеря.
Квадратичная потеря	`'quadratic'`	$L = \sum_{j = 1}^{n} w_{j} {(1 - m_{j})}^{2} .$

Этот рисунок сравнивает функции потерь (кроме 'crossentropy' и 'mincost') по счету m для одного наблюдения. Некоторые функции нормированы, чтобы пройти через точку (0,1).

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Эта функция полностью поддерживает "высокие" массивы. Для получения дополнительной информации см. Раздел "Высокие массивы".

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Указания и ограничения по применению:

loss выполняется на графическом процессоре в этих случаях только:
- Входной параметр X gpuArray.
- Входной параметр tbl содержит gpuArray переменные предикторы.
- Входной параметр mdl было оснащено входными параметрами графического процессора массивов.
Если модель дерева классификации была обучена с суррогатными разделениями, эти ограничения применяются:
- Вы не можете задать входной параметр X как gpuArray.
- Вы не можете задать входной параметр tbl как таблица, содержащая gpuArray элементы.

Для получения дополнительной информации смотрите функции MATLAB Запуска на графическом процессоре (Parallel Computing Toolbox).

Смотрите также

loss | edge | margin | predict

Документация

loss

Синтаксис

Описание

Входные параметры

Аргументы name-value

Выходные аргументы

Примеры

Оцените ошибку классификации

Больше о

Потеря классификации

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Смотрите также

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

loss

Синтаксис

Описание

Входные параметры

Аргументы name-value

Выходные аргументы

Примеры

Оцените ошибку классификации

Больше о

Потеря классификации

Расширенные возможности

"Высокие" массивы Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Массивы графического процессора Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.

Смотрите также

Документация Statistics and Machine Learning Toolbox

Поддержка

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Массивы графического процессора
Ускорьте код путем работы графического процессора (GPU) с помощью Parallel Computing Toolbox™.