edge

Ребро k - ближайший соседний классификатор

Описание

E = edge(mdl,tbl,ResponseVarName) возвращает ребро классификации для mdl с данными tbl и классификационные tbl.ResponseVarName. Если tbl содержит переменную отклика, используемую для обучения mdl, тогда вам не нужно указывать ResponseVarName.

Классификационное ребро (E) - скалярное значение, которое представляет среднее значение классификационных полей.

E = edge(mdl,tbl,Y) возвращает ребро классификации для mdl с данными tbl и классификационные Y.

пример

E = edge(mdl,X,Y) возвращает ребро классификации для mdl с данными X и классификационные Y.

E = edge(___,'Weights',weights) вычисляет ребро с дополнительными весами наблюдений weights, с использованием любого из входных параметров в предыдущих синтаксисах.

Примеры

свернуть все

Создайте k-ближайших соседей классификатор для данных радужной оболочки глаза Фишера, где k = 5.

Загрузите набор данных радужной оболочки глаза Фишера.

load fisheriris
X = meas;
Y = species;

Создайте классификатор для пяти ближайших соседей.

mdl = fitcknn(X,Y,'NumNeighbors',5);

Исследуйте ребро классификатора для минимальных, средних и максимальных наблюдений, классифицированных как 'setosa', 'versicolor', и 'virginica', соответственно.

NewX = [min(X);mean(X);max(X)];
Y = {'setosa';'versicolor';'virginica'};
E = edge(mdl,NewX,Y)
E = 1

Все пять ближайших соседей каждого NewX точка классифицируется как соответствующее Y запись.

Входные параметры

свернуть все

k-ближайших соседей классификатор модели, заданный как ClassificationKNN объект.

Выборочные данные, используемых для обучения модели, заданная как таблица. Каждая строка tbl соответствует одному наблюдению, и каждый столбец соответствует одной переменной предиктора. Опционально tbl может содержать один дополнительный столбец для переменной отклика. Многополюсные переменные и массивы ячеек, отличные от массивов ячеек векторов символов, не разрешены.

Если tbl содержит переменную отклика, используемую для обучения mdl, тогда вам не нужно указывать ResponseVarName или Y.

Если вы обучаете mdl использование выборочных данных, содержащихся в table, затем входные данные для edge также должно быть в таблице.

Типы данных: table

Имя переменной отклика, заданное как имя переменной в tbl. Если tbl содержит переменную отклика, используемую для обучения mdl, тогда вам не нужно указывать ResponseVarName.

Вы должны задать ResponseVarName как вектор символов или строковый скаляр. Для примера, если переменная отклика сохранена как tbl.response, затем укажите его следующим 'response'. В противном случае программное обеспечение обрабатывает все столбцы tbl, включая tbl.response, как предикторы.

Переменная отклика должна быть категориальными символьными или строковыми массивами, логическим или числовым вектором или массивом ячеек из векторов символов. Если переменная отклика является символьным массивом, то каждый элемент должен соответствовать одной строке массива.

Типы данных: char | string

Данные предиктора, заданные как числовая матрица. Каждая строка X представляет одно наблюдение, и каждый столбец представляет одну переменную.

Типы данных: single | double

Метки класса, заданные как категориальные символьные или строковые массивы, логический или числовой вектор или массив ячеек из векторов символов. Каждая строка Y представляет классификацию соответствующей строки X.

Типы данных: categorical | char | string | logical | single | double | cell

Веса наблюдений, заданные как числовой вектор или имя переменной в tbl.

Если вы задаете weights в виде числового вектора, затем размера weights должно быть равно количеству строк в X или tbl.

Если вы задаете weights как имя переменной в tbl, тогда имя должно быть вектором символов или строковым скаляром. Для примера, если веса сохранены как tbl.w, затем задайте weights как 'w'. В противном случае программное обеспечение обрабатывает все столбцы tbl, включая tbl.w, как предикторы.

Если вы задаете weights, затем edge функция взвешивает наблюдения в каждой строке X или tbl с соответствующим весом в weights.

Пример: 'Weights','w'

Типы данных: single | double | char | string

Подробнее о

свернуть все

Край

Классификационная margin для каждого наблюдения является различием между классификационной score для истинного класса и максимальной классификационной оценкой для ложных классов.

Поля классификации образуют вектор-столбец с одинаковым числом строк, как X или tbl.

Счет

score классификации является апостериорной вероятностью классификации. Апостериорная вероятность является количеством соседей с этой классификацией, разделенной на количество соседей. Для более подробного определения, которое включает веса и предыдущие вероятности, смотрите Апостериорную Вероятность.

Расширенные возможности

Введенный в R2012a