exponenta event banner

край

Край k-ближайшего соседнего классификатора

Описание

E = edge(mdl,tbl,ResponseVarName) возвращает границу классификации для mdl с данными tbl и классификация tbl.ResponseVarName. Если tbl содержит переменную ответа, используемую для обучения mdl, то указывать не нужно ResponseVarName.

Край классификации (E) - скалярное значение, представляющее среднее значение полей классификации.

E = edge(mdl,tbl,Y) возвращает границу классификации для mdl с данными tbl и классификация Y.

пример

E = edge(mdl,X,Y) возвращает границу классификации для mdl с данными X и классификация Y.

E = edge(___,'Weights',weights) вычисляет кромку с дополнительными весами наблюдения weights, используя любой из входных аргументов в предыдущих синтаксисах.

Примеры

свернуть все

Создайте k-ближайший классификатор соседей для данных радужки Фишера, где k = 5.

Загрузите набор данных радужки Фишера.

load fisheriris
X = meas;
Y = species;

Создайте классификатор для пяти ближайших соседей.

mdl = fitcknn(X,Y,'NumNeighbors',5);

Проверьте край классификатора на предмет минимальных, средних и максимальных наблюдений, классифицированных как 'setosa', 'versicolor', и 'virginica'соответственно.

NewX = [min(X);mean(X);max(X)];
Y = {'setosa';'versicolor';'virginica'};
E = edge(mdl,NewX,Y)
E = 1

Все пять ближайших соседей каждого NewX точка классифицируется как соответствующая Y вход.

Входные аргументы

свернуть все

k - ближайшая модель классификатора соседей, заданная как ClassificationKNN объект.

Образец данных, используемых для обучения модели, указанный как таблица. Каждая строка tbl соответствует одному наблюдению, и каждый столбец соответствует одной прогнозирующей переменной. Дополнительно, tbl может содержать один дополнительный столбец для переменной ответа. Многозначные переменные и массивы ячеек, отличные от массивов ячеек символьных векторов, не допускаются.

Если tbl содержит переменную ответа, используемую для обучения mdl, то указывать не нужно ResponseVarName или Y.

Если вы тренируетесь mdl с использованием образцов данных, содержащихся в table, затем входные данные для edge также должен находиться в таблице.

Типы данных: table

Имя переменной ответа, указанное как имя переменной в tbl. Если tbl содержит переменную ответа, используемую для обучения mdl, то указывать не нужно ResponseVarName.

Необходимо указать ResponseVarName в виде вектора символов или строкового скаляра. Например, если переменная ответа сохранена как tbl.response, затем укажите его как 'response'. В противном случае программа обрабатывает все столбцы tbl, в том числе tbl.response, как предикторы.

Переменная ответа должна быть категориальным, символьным или строковым массивом, логическим или числовым вектором или массивом ячеек символьных векторов. Если ответная переменная является символьным массивом, то каждый элемент должен соответствовать одной строке массива.

Типы данных: char | string

Данные предиктора, заданные как числовая матрица. Каждая строка X представляет одно наблюдение, и каждый столбец представляет одну переменную.

Типы данных: single | double

Метки класса, указанные как категориальный, символьный или строковый массив, логический или числовой вектор или массив ячеек символьных векторов. Каждая строка Y представляет классификацию соответствующей строки X.

Типы данных: categorical | char | string | logical | single | double | cell

Веса наблюдения, указанные как числовой вектор или имя переменной в tbl.

При указании weights как числовой вектор, то размер weights должно быть равно количеству строк в X или tbl.

При указании weights как имя переменной в tbl, то имя должно быть символьным вектором или строковым скаляром. Например, если веса сохранены как tbl.w, затем укажите weights как 'w'. В противном случае программа обрабатывает все столбцы tbl, в том числе tbl.w, как предикторы.

При указании weights, то edge функция весит наблюдение в каждой строке X или tbl с соответствующим весом в weights.

Пример: 'Weights','w'

Типы данных: single | double | char | string

Подробнее

свернуть все

Край

Запас классификации для каждого наблюдения представляет собой разницу между показателем классификации для истинного класса и максимальным показателем классификации для ложных классов.

Поля классификации образуют вектор столбца с тем же количеством строк, что и X или tbl.

Счет

Оценка классификации - это задняя вероятность классификации. Апостериорная вероятность - это число соседей с такой классификацией, деленное на число соседей. Более подробное определение, включающее веса и предшествующие вероятности, см. в разделе Апостериорная вероятность.

Расширенные возможности

Представлен в R2012a