edge

Ребро классификации для Гауссовой модели классификации ядер

свернуть все на странице

Синтаксис

e = edge(Mdl,X,Y)

e = edge(Mdl,Tbl,ResponseVarName)

e = edge(Mdl,Tbl,Y)

e = edge(___,'Weights',weights)

Описание

пример

e = edge(Mdl,X,Y) возвращает ребро классификации для бинарной Гауссовой модели Mdl классификации ядер использование данных о предикторе в X и соответствующий класс помечает в Y.

e = edge(Mdl,Tbl,ResponseVarName) возвращает ребро классификации для обученного классификатора ядра Mdl использование данных о предикторе в таблице Tbl и класс помечает в Tbl.ResponseVarName.

e = edge(Mdl,Tbl,Y) возвращает ребро классификации для классификатора Mdl использование данных о предикторе в таблице Tbl и класс помечает в векторном Y.

e = edge(___,'Weights',weights) возвращает взвешенное ребро классификации с помощью весов наблюдения, предоставленных в weights. Задайте веса после любой из комбинаций входных аргументов в предыдущих синтаксисах.

Примеры

свернуть все

Оцените ребро набора тестов

Скрипт Open Live Script

Загрузите ionosphere набор данных. Этот набор данных имеет 34 предиктора, и 351 бинарный ответ для радара возвращается, любой плохо ('b') или хороший ('g').

load ionosphere

Разделите набор данных в наборы обучающих данных и наборы тестов. Задайте 15%-ю выборку затяжки для набора тестов.

rng('default') % For reproducibility
Partition = cvpartition(Y,'Holdout',0.15);
trainingInds = training(Partition); % Indices for the training set
testInds = test(Partition); % Indices for the test set

Обучите бинарную модель классификации ядер использование набора обучающих данных.

Mdl = fitckernel(X(trainingInds,:),Y(trainingInds));

Оцените ребро набора обучающих данных и ребро набора тестов.

eTrain = edge(Mdl,X(trainingInds,:),Y(trainingInds))

eTrain = 2.1703

eTest = edge(Mdl,X(testInds,:),Y(testInds))

eTest = 1.5643

Выбор признаков Используя ребра набора тестов

Скрипт Open Live Script

Выполните выбор признаков путем сравнения ребер набора тестов от многоуровневых моделей. Базирующийся только на этом критерии, классификатор с самым высоким ребром является лучшим классификатором.

load ionosphere

rng('default') % For reproducibility
Partition = cvpartition(Y,'Holdout',0.15);
trainingInds = training(Partition); % Indices for the training set
XTrain = X(trainingInds,:);
YTrain = Y(trainingInds);
testInds = test(Partition); % Indices for the test set
XTest = X(testInds,:);
YTest = Y(testInds);

Случайным образом выберите половину переменных предикторов.

p = size(X,2); % Number of predictors
idxPart = randsample(p,ceil(0.5*p));

Обучите две бинарных модели классификации ядер: тот, который использует все предикторы и тот, который использует половину предикторов.

Mdl = fitckernel(XTrain,YTrain);
PMdl = fitckernel(XTrain(:,idxPart),YTrain);

Mdl и PMdl ClassificationKernel модели.

Оцените ребро набора тестов для каждого классификатора.

fullEdge = edge(Mdl,XTest,YTest)

fullEdge = 1.6335

partEdge = edge(PMdl,XTest(:,idxPart),YTest)

partEdge = 2.0205

На основе ребер набора тестов классификатор, который использует половину предикторов, является лучшей моделью.

Входные параметры

свернуть все

`Mdl` — Бинарная модель классификации ядер
`ClassificationKernel` объект модели

Бинарная модель классификации ядер в виде ClassificationKernel объект модели. Можно создать ClassificationKernel использование объекта модели fitckernel.

`X` — Данные о предикторе
n-by-p числовая матрица

Данные о предикторе в виде n-by-p числовая матрица, где n является количеством наблюдений и p, являются количеством предикторов, используемых, чтобы обучить Mdl.

Длина Y и количество наблюдений в X должно быть равным.

Типы данных: single | double

`Y` — Метки класса
категориальный массив | символьный массив | массив строк | логический вектор | числовой вектор | массив ячеек из символьных векторов

Класс помечает в виде категориального, символа или массива строк; логический или числовой вектор; или массив ячеек из символьных векторов.

Тип данных Y должен совпасть с типом данных Mdl.ClassNames. (Программное обеспечение обрабатывает строковые массивы как массивы ячеек из символьных векторов.)
Отличные классы в Y должно быть подмножество Mdl.ClassNames.
Если Y символьный массив, затем каждый элемент должен соответствовать одной строке массива.
Длина Y должно быть равно количеству наблюдений в X или Tbl.

`Tbl` — Выборочные данные
таблица

Выборочные данные раньше обучали модель в виде таблицы. Каждая строка Tbl соответствует одному наблюдению, и каждый столбец соответствует одному переменному предиктору. Опционально, Tbl может содержать дополнительные столбцы для весов наблюдения и переменной отклика. Tbl должен содержать все предикторы, используемые, чтобы обучить Mdl. Многостолбцовые переменные и массивы ячеек кроме массивов ячеек из символьных векторов не позволены.

Если Tbl содержит переменную отклика, используемую, чтобы обучить Mdl, затем вы не должны задавать ResponseVarName или Y.

Если вы обучаете Mdl использование выборочных данных, содержавшихся в таблице, затем входные данные для edge должен также быть в таблице.

`ResponseVarName` — Имя переменной отклика
имя переменной в `Tbl`

Имя переменной отклика в виде имени переменной в Tbl. Если Tbl содержит переменную отклика, используемую, чтобы обучить Mdl, затем вы не должны задавать ResponseVarName.

Если вы задаете ResponseVarName, затем необходимо задать его как вектор символов или строковый скаляр. Например, если переменная отклика хранится как Tbl.Y, затем задайте ResponseVarName как 'Y'. В противном случае программное обеспечение обрабатывает все столбцы Tbl, включая Tbl.Y, как предикторы.

Переменная отклика должна быть категориальным, символом или массивом строк; логический или числовой вектор; или массив ячеек из символьных векторов. Если переменная отклика является символьным массивом, то каждый элемент должен соответствовать одной строке массива.

Типы данных: char | string

`weights` — Веса наблюдения
`ones(size(X,1),1)` (значение по умолчанию) | числовой вектор | имя переменной в `Tbl`

Веса наблюдения в виде числового вектора или имени переменной в Tbl.

Если weights числовой вектор, затем размер weights должно быть равно количеству строк в X или Tbl.
Если weights имя переменной в Tbl, необходимо задать weights как вектор символов или строковый скаляр. Например, если веса хранятся как Tbl.W, затем задайте weights как 'W'. В противном случае программное обеспечение обрабатывает все столбцы Tbl, включая Tbl.W, как предикторы.

Если вы предоставляете веса, edge вычисляет взвешенное ребро классификации. Программное обеспечение взвешивает наблюдения в каждой строке X или Tbl с соответствующими весами в weights.

edge нормирует weights суммировать до значения априорной вероятности в соответствующем классе.

Типы данных: single | double | char | string

Выходные аргументы

свернуть все

`e` — Ребро классификации
числовой скаляр

Ребро классификации, возвращенное в виде числа.

Больше о

свернуть все

Ребро классификации

classification edge является взвешенным средним полей классификации.

Один способ выбрать среди нескольких классификаторов, например, выполнить выбор признаков, состоит в том, чтобы выбрать классификатор, который дает к самому большому ребру.

Поле классификации

classification margin для бинарной классификации, для каждого наблюдения, различия между классификационной оценкой для истинного класса и классификационной оценкой для ложного класса.

Программное обеспечение задает поле классификации для бинарной классификации как

$m = 2 y f (x) .$

x является наблюдением. Если истинная метка x является положительным классом, то y равняется 1, и –1 в противном случае. f (x) является классификационной оценкой положительного класса для наблюдения x. Поле классификации обычно задается как m = y f (x).

Если поля находятся по той же шкале, то они служат мерой по доверию классификации. Среди нескольких классификаторов те, которые дают к большим полям, лучше.

Классификационная оценка

Для моделей классификации ядер, необработанного classification score для классификации наблюдения x, вектор-строка, в положительный класс задан

$f (x) = T (x) β + b .$

$T (\cdot)$ преобразование наблюдения для расширения функции.
β является предполагаемым вектор-столбцом коэффициентов.
b является предполагаемым скалярным смещением.

Необработанная классификационная оценка для классификации x в отрицательный класс является −f (x). Программное обеспечение классифицирует наблюдения в класс, который дает к положительному счету.

Если модель классификации ядер состоит из учеников логистической регрессии, то программное обеспечение применяет 'logit' выиграйте преобразование к необработанным классификационным оценкам (см. ScoreTransform).

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Указания и ограничения по применению:

edge не поддерживает высокий table данные.

Для получения дополнительной информации см. Раздел "Высокие массивы".

Введенный в R2017b

Документация

edge

Синтаксис

Описание

Примеры

Оцените ребро набора тестов

Выбор признаков Используя ребра набора тестов

Входные параметры

`Mdl` — Бинарная модель классификации ядер
`ClassificationKernel` объект модели

`X` — Данные о предикторе
n-by-p числовая матрица

`Y` — Метки класса
категориальный массив | символьный массив | массив строк | логический вектор | числовой вектор | массив ячеек из символьных векторов

`Tbl` — Выборочные данные
таблица

`ResponseVarName` — Имя переменной отклика
имя переменной в `Tbl`

`weights` — Веса наблюдения
`ones(size(X,1),1)` (значение по умолчанию) | числовой вектор | имя переменной в `Tbl`

Выходные аргументы

`e` — Ребро классификации
числовой скаляр

Больше о

Ребро классификации

Поле классификации

Классификационная оценка

Расширенные возможности

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Смотрите также

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

edge

Синтаксис

Описание

Примеры

Оцените ребро набора тестов

Выбор признаков Используя ребра набора тестов

Входные параметры

Mdl — Бинарная модель классификации ядер ClassificationKernel объект модели

X — Данные о предикторе n-by-p числовая матрица

Y — Метки класса категориальный массив | символьный массив | массив строк | логический вектор | числовой вектор | массив ячеек из символьных векторов

Tbl — Выборочные данные таблица

ResponseVarName — Имя переменной отклика имя переменной в Tbl

weights — Веса наблюдения ones(size(X,1),1) (значение по умолчанию) | числовой вектор | имя переменной в Tbl

Выходные аргументы

e — Ребро классификации числовой скаляр

Больше о

Ребро классификации

Поле классификации

Классификационная оценка

Расширенные возможности

"Высокие" массивы Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.

Смотрите также

Документация Statistics and Machine Learning Toolbox

Поддержка

`Mdl` — Бинарная модель классификации ядер
`ClassificationKernel` объект модели

`X` — Данные о предикторе
n-by-p числовая матрица

`Y` — Метки класса
категориальный массив | символьный массив | массив строк | логический вектор | числовой вектор | массив ячеек из символьных векторов

`Tbl` — Выборочные данные
таблица

`ResponseVarName` — Имя переменной отклика
имя переменной в `Tbl`

`weights` — Веса наблюдения
`ones(size(X,1),1)` (значение по умолчанию) | числовой вектор | имя переменной в `Tbl`

`e` — Ребро классификации
числовой скаляр

"Высокие" массивы
Осуществление вычислений с массивами, которые содержат больше строк, чем помещается в памяти.