exponenta event banner

край

Запас k-ближайшего классификатора соседей

Описание

m = margin(mdl,tbl,ResponseVarName) возвращает значения полей классификации для mdl с данными tbl и классификация tbl.ResponseVarName. Если tbl содержит переменную ответа, используемую для обучения mdl, то указывать не нужно ResponseVarName.

m возвращается в виде числового вектора длины size(tbl,1). Каждая запись в m представляет поле для соответствующей строки tbl и соответствующая метка истинного класса в tbl.ResponseVarName, вычислено с использованием mdl.

m = margin(mdl,tbl,Y) возвращает значения полей классификации для mdl с данными tbl и классификация Y.

пример

m = margin(mdl,X,Y) возвращает значения полей классификации для mdl с данными X и классификация Y. m возвращается в виде числового вектора длины size(X,1).

Примеры

свернуть все

Создайте k-ближайший классификатор соседей для данных радужки Фишера, где k = 5.

Загрузите набор данных радужки Фишера.

load fisheriris

Создайте классификатор для пяти ближайших соседей.

mdl = fitcknn(meas,species,'NumNeighbors',5);

Изучить запас классификатора для среднего наблюдения, классифицированного как 'versicolor'.

X = mean(meas);
Y = {'versicolor'};
m = margin(mdl,X,Y)
m = 1

Все пять ближайших соседей классифицируются как 'versicolor'.

Входные аргументы

свернуть все

k - ближайшая модель классификатора соседей, заданная как ClassificationKNN объект.

Образец данных, используемых для обучения модели, указанный как таблица. Каждая строка tbl соответствует одному наблюдению, и каждый столбец соответствует одной прогнозирующей переменной. Дополнительно, tbl может содержать один дополнительный столбец для переменной ответа. Многозначные переменные и массивы ячеек, отличные от массивов ячеек символьных векторов, не допускаются.

Если tbl содержит переменную ответа, используемую для обучения mdl, то указывать не нужно ResponseVarName или Y.

Если вы тренируетесь mdl с использованием образцов данных, содержащихся в table, затем входные данные для margin также должен находиться в таблице.

Типы данных: table

Имя переменной ответа, указанное как имя переменной в tbl. Если tbl содержит переменную ответа, используемую для обучения mdl, то указывать не нужно ResponseVarName.

Необходимо указать ResponseVarName в виде вектора символов или строкового скаляра. Например, если переменная ответа сохранена как tbl.response, затем укажите его как 'response'. В противном случае программа обрабатывает все столбцы tbl, в том числе tbl.response, как предикторы.

Переменная ответа должна быть категориальным, символьным или строковым массивом, логическим или числовым вектором или массивом ячеек символьных векторов. Если ответная переменная является символьным массивом, то каждый элемент должен соответствовать одной строке массива.

Типы данных: char | string

Данные предиктора, заданные как числовая матрица. Каждая строка X представляет одно наблюдение, и каждый столбец представляет одну переменную.

Типы данных: single | double

Метки класса, указанные как категориальный, символьный или строковый массив, логический или числовой вектор или массив ячеек символьных векторов. Каждая строка Y представляет классификацию соответствующей строки X.

Типы данных: categorical | char | string | logical | single | double | cell

Подробнее

свернуть все

Край

Запас классификации для каждого наблюдения представляет собой разницу между показателем классификации для истинного класса и максимальным показателем классификации для ложных классов.

Счет

Оценка классификации - это задняя вероятность классификации. Апостериорная вероятность - это число соседей с такой классификацией, деленное на число соседей. Более подробное определение, включающее веса и предшествующие вероятности, см. в разделе Апостериорная вероятность.

Расширенные возможности

Представлен в R2012a