ClassificationSVM

Машина опорных векторов (SVM) для одноклассовой и двоичной классификации

Описание

ClassificationSVM - классификатор машины опорных векторов (SVM) для одноклассного и двухклассного обучения. Обученные ClassificationSVM классификаторы сохраняют обучающие данные, значения параметров, предыдущие вероятности, векторы поддержки и информацию алгоритмической реализации. Используйте эти классификаторы для выполнения задач, таких как подбор кривой функции счета-к-апостериорно-вероятностному преобразованию ( см.fitPosterior) и прогнозирование меток для новых данных (см. predict).

Создание

Создайте ClassificationSVM объект при помощи fitcsvm.

Свойства

расширить все

Свойства SVM

`Alpha` - Обученные коэффициенты классификатора
числовой вектор

Это свойство доступно только для чтения.

Обученные коэффициенты классификатора, заданные как s-на-1 числовой вектор. s - количество поддержки векторов в обученном классификаторе, sum(Mdl.IsSupportVector).

Alpha содержит обученные классификационные коэффициенты из двойственной задачи, то есть предполагаемые множители Лагранжа. Если вы удаляете дубликаты при помощи RemoveDuplicates Аргумент пары "имя-значение" из fitcsvm, затем для заданного набора повторяющихся наблюдений, которые являются поддерживающими векторами, Alpha содержит один коэффициент, соответствующий всему множеству. То есть MATLAB^® приписывает ненулевый коэффициент одному наблюдению из множества дубликатов и коэффициенту 0 ко всем другим повторяющимся наблюдениям в наборе.

Типы данных: single | double

`Beta` - Линейные коэффициенты предиктора
числовой вектор

Это свойство доступно только для чтения.

Коэффициенты линейного предиктора, заданные как числовой вектор. Длина Beta равен количеству предикторов, используемых для обучения модели.

MATLAB расширяет категориальные переменные в данных предиктора, используя полную фиктивную кодировку. То есть MATLAB создает по одной фиктивной переменной для каждого уровня каждой категориальной переменной. Beta сохраняет одно значение для каждой переменной предиктора, включая фиктивные переменные. Например, если предикторов три, один из которых является категориальной переменной с тремя уровнями, то Beta - числовой вектор, содержащий пять значений.

Если KernelParameters.Function является 'linear', затем классификационная оценка для x наблюдений

$f (x) = (x / s)' β + b .$

Mdl сохраняет β, b и s в свойствах Beta, Bias, и KernelParameters.Scale, соответственно.

Чтобы оценить классификационные оценки вручную, необходимо сначала применить любые преобразования к данным предиктора, которые были применены во время обучения. В частности, если вы задаете 'Standardize',true при использовании fitcsvm, затем необходимо стандартизировать данные предиктора вручную с помощью среднего значения Mdl.Mu и стандартное отклонение Mdl.Sigma, а затем разделите результат на шкалу ядра в Mdl.KernelParameters.Scale.

Все функции SVM, такие как resubPredict и predict, примените любое необходимое преобразование перед оценкой.

Если KernelParameters.Function не 'linear', затем Beta пуст ([]).

Типы данных: single | double

`Bias` - Термин смещения
скаляр

Это свойство доступно только для чтения.

Термин смещения, заданный как скаляр.

Типы данных: single | double

`BoxConstraints` - Прямоугольные ограничения
числовой вектор

Это свойство доступно только для чтения.

Прямоугольные ограничения, заданные как числовой вектор n-на-1 прямоугольные ограничения. n - количество наблюдений в обучающих данных (см. NumObservations свойство).

Если вы удаляете дубликаты при помощи RemoveDuplicates Аргумент пары "имя-значение" из fitcsvmзатем для заданного набора повторяющихся наблюдений MATLAB суммирует прямоугольные ограничения, а затем приписывает сумму одному наблюдению. MATLAB приписывает прямоугольные ограничения 0 ко всем остальным наблюдениям в наборе.

Типы данных: single | double

`CacheInfo` - Информация о кэшировании
массив структур

Это свойство доступно только для чтения.

Информация о кэшировании, заданная как массив структур. Информация о кэшировании содержит поля, описанные в этой таблице.

Область	Описание
Размер	Размер кэша (в МБ), который программное обеспечение резервирует для обучения классификатора SVM. Для получения дополнительной информации смотрите `'CacheSize'`.
Алгоритм	Алгоритм кэширования, который программное обеспечение использует во время оптимизации. В настоящее время единственным доступным алгоритмом кэширования является `Queue`. Вы не можете задать алгоритм кэширования.

Отображение полей CacheInfo при помощи записи через точку. Для примера, Mdl.CacheInfo.Size отображает значение размера кэша.

Типы данных: struct

`IsSupportVector` - Векторный индикатор поддержки
логический вектор

Это свойство доступно только для чтения.

Векторный индикатор поддержки, заданный как логический вектор n -by-1, который помечает, является ли соответствующее наблюдение в матрице данных предиктора вектором поддержки. n - количество наблюдений в обучающих данных (см. NumObservations).

Если вы удаляете дубликаты при помощи RemoveDuplicates Аргумент пары "имя-значение" из fitcsvm, затем для заданного набора повторяющихся наблюдений, которые являются поддерживающими векторами, IsSupportVector помечает только одно наблюдение как вектор- поддержка.

Типы данных: logical

`KernelParameters` - Параметры ядра
массив структур

Это свойство доступно только для чтения.

Параметры ядра, заданные как массив структур. Свойство параметров ядра содержит поля, перечисленные в этой таблице.

Область	Описание
Функция	Функция ядра, используемая для вычисления элементов матрицы Gram. Для получения дополнительной информации смотрите `'KernelFunction'`.
Шкала	Параметр шкалы ядра, используемый для масштабирования всех элементов данных предиктора, на которых обучена модель. Для получения дополнительной информации смотрите `'KernelScale'`.

Отображение значений KernelParameters, используйте запись через точку. Для примера, Mdl.KernelParameters.Scale отображает шкалу значения параметров ядра.

Программное обеспечение принимает KernelParameters как входы и не изменяет их.

Типы данных: struct

`Nu` - Одноклассный параметр обучения
положительная скалярная величина

Это свойство доступно только для чтения.

Одноклассный параметр обучения ν, заданный как положительная скалярная величина.

Типы данных: single | double

`OutlierFraction` - Доля выбросов
числовой скаляр

Это свойство доступно только для чтения.

Доля выбросов в обучающих данных, заданная как числовой скаляр.

Типы данных: double

`Solver` - стандартная программа оптимизации
`'ISDA'` | `'L1QP'` | `'SMO'`

Это свойство доступно только для чтения.

Стандартная программа оптимизации, используемая для обучения классификатора SVM, заданная как 'ISDA', 'L1QP', или 'SMO'. Для получения дополнительной информации смотрите 'Solver'.

`SupportVectorLabels` - Поддержка меток классов векторов
s -by-1 числовой вектор

Это свойство доступно только для чтения.

Поддерживайте метки класса вектора, заданные как числовой вектор s -на 1. s - количество поддержки векторов в обученном классификаторе, sum(Mdl.IsSupportVector).

Значение +1 в SupportVectorLabels указывает, что соответствующий вектор поддержки находится в положительном классе (ClassNames{2}). Значение –1 указывает, что соответствующий вектор поддержки находится в отрицательном классе (ClassNames{1}).

Если вы удаляете дубликаты при помощи RemoveDuplicates Аргумент пары "имя-значение" из fitcsvm, затем для заданного набора повторяющихся наблюдений, которые являются поддерживающими векторами, SupportVectorLabels содержит одну уникальную метку вектора поддержки.

Типы данных: single | double

`SupportVectors` - Поддерживающие векторы
s -by p числовая матрица

Это свойство доступно только для чтения.

Поддерживающие векторы в обученном классификаторе, заданные как s -by p числовая матрица. s - количество поддержки векторов в обученном классификаторе, sum(Mdl.IsSupportVector), и p количество переменных предиктора в данных предиктора.

SupportVectors содержит строки данных предиктора X что MATLAB рассматривает как поддерживающие векторы. Если вы задаете 'Standardize',true при обучении классификатора SVM с помощью fitcsvm, затем SupportVectors содержит стандартизированные строки X.

Если вы удаляете дубликаты при помощи RemoveDuplicates Аргумент пары "имя-значение" из fitcsvm, затем для заданного набора повторяющихся наблюдений, которые являются поддерживающими векторами, SupportVectors содержит один уникальный вектор поддержки.

Типы данных: single | double

Другие классификационные свойства

`CategoricalPredictors` - Категориальные индексы предиктора
вектор положительных целых чисел | `[]`

Это свойство доступно только для чтения.

Категориальные индексы предиктора, заданные как вектор положительных целых чисел. CategoricalPredictors содержит значения индекса, соответствующие столбцам данных предиктора, которые содержат категориальные предикторы. Если ни один из предикторов не является категориальным, то это свойство пустое ([]).

Типы данных: double

`ClassNames` - Уникальные метки классов
категориальный массив | символьный массив | логический вектор | числовой вектор | ячеек из символьных векторов

Это свойство доступно только для чтения.

Уникальные метки классов, используемые в обучении, заданные как категориальный или символьный массив, логический или числовой вектор или массив ячеек векторов символов. ClassNames имеет тот совпадающий тип данных, что и метки классов Y. (Программа обрабатывает массивы строк как массивы ячеек векторов символов.) ClassNames также определяет порядок классов.

`Cost` - Расходы на неправильную классификацию
числовая квадратная матрица

Это свойство доступно только для чтения.

Стоимость неправильной классификации, заданная как числовая квадратная матрица, где Cost(i,j) - стоимость классификации точки в класс j если его класс true i.

Во время обучения программное обеспечение обновляет предыдущие вероятности путем включения штрафов, описанных в матрице затрат.

Для двухклассного обучения, Cost всегда имеет такую форму: Cost(i,j) = 1 если i ~= j, и Cost(i,j) = 0 если i = j. Строки соответствуют истинному классу, а столбцы - предсказанному классу. Порядок строк и столбцов Cost соответствует порядку классов в ClassNames.
Для одноклассного обучения, Cost = 0.

Для получения дополнительной информации см. «Алгоритмы».

Типы данных: double

`ExpandedPredictorNames` - Расширенные имена предикторов
массив ячеек из векторов символов

Это свойство доступно только для чтения.

Расширенные имена предикторов, заданные как массив ячеек из векторов символов.

Если модель использует кодировку фиктивных переменных для категориальных переменных, то ExpandedPredictorNames включает имена, которые описывают расширенные переменные. В противном случае ExpandedPredictorNames то же, что и PredictorNames.

Типы данных: cell

`Gradient` - Значения градиента обучающих данных
числовой вектор

Это свойство доступно только для чтения.

Обучающие данные, заданных как числовой вектор. Длина Gradient равно количеству наблюдений (NumObservations).

Типы данных: single | double

`ModelParameters` - Параметры, используемые для обучения модели
объект

Это свойство доступно только для чтения.

Параметры, используемые для обучения ClassificationSVM модель, заданная как объект. ModelParameters содержит значения параметров, такие как значения аргументов пары "имя-значение", используемые для обучения классификатора SVM. ModelParameters не содержит предполагаемых параметров.

Доступ к свойствам ModelParameters при помощи записи через точку. Для примера получите доступ к начальным значениям для оценки Alpha при помощи Mdl.ModelParameters.Alpha.

`Mu` - Предиктор означает
числовой вектор | `[]`

Это свойство доступно только для чтения.

Предиктор означает, заданный как числовой вектор. Если вы задаете 'Standardize',1 или 'Standardize',true при обучении классификатора SVM с помощью fitcsvm, затем длина Mu равен количеству предикторов.

MATLAB расширяет категориальные переменные в данных предиктора, используя полную фиктивную кодировку. То есть MATLAB создает по одной фиктивной переменной для каждого уровня каждой категориальной переменной. Mu сохраняет одно значение для каждой переменной предиктора, включая фиктивные переменные. Однако MATLAB не стандартизирует столбцы, которые содержат категориальные переменные.

Если вы задаете 'Standardize',false при обучении классификатора SVM с помощью fitcsvm, затем Mu - пустой вектор ([]).

Типы данных: single | double

`NumObservations` - Количество наблюдений
числовой скаляр

Это свойство доступно только для чтения.

Количество наблюдений в обучающих данных, хранимых в X и Y, заданный как числовой скаляр.

Типы данных: double

`PredictorNames` - Имена переменных предиктора
массив ячеек из векторов символов

Это свойство доступно только для чтения.

Имена переменных предиктора, заданные как массив ячеек из векторов символов. Порядок элементов PredictorNames соответствует порядку, в котором имена предикторов появляются в обучающих данных.

Типы данных: cell

`Prior` - Предыдущие вероятности
числовой вектор

Это свойство доступно только для чтения.

Предыдущие вероятности для каждого класса, заданные как числовой вектор. Порядок элементов Prior соответствует элементам Mdl.ClassNames.

Для двухклассного обучения, если вы задаете матрицу затрат, то программное обеспечение обновляет предыдущие вероятности, включив штрафы, описанные в матрице затрат.

Для получения дополнительной информации см. «Алгоритмы».

Типы данных: single | double

`ResponseName` - Имя переменной отклика
вектор символов

Это свойство доступно только для чтения.

Имя переменной отклика, заданное как вектор символов.

Типы данных: char

`RowsUsed` - Строки, используемые в подборе кривой
`[]` | логический вектор

Это свойство доступно только для чтения.

Строки исходных обучающих данных, используемых при подборе кривой ClassificationSVM модель, заданная как логический вектор. Это свойство пустое, если используются все строки.

Типы данных: logical

`ScoreTransform` - Преобразование счета
вектор символов | указатель на функцию

Преобразование счета, заданное как вектор символов или указатель на функцию. ScoreTransform представляет встроенную функцию преобразования или указатель на функцию для преобразования предсказанных классификационных оценок.

Чтобы изменить функцию преобразования счета на functionдля примера используйте запись через точку.

Для встроенной функции введите вектор символов.

Mdl.ScoreTransform = 'function';

В этой таблице описываются доступные встроенные функции.

Значение	Описание
`'doublelogit'`	1/(1 + e^–2x)
`'invlogit'`	журнал (x/( 1 - x))
`'ismax'`	Устанавливает счет для класса с самым большим счетом равным 1 и устанавливает счета для всех других классов равным 0
`'logit'`	1/(1 + e^–x)
`'none'` или `'identity'`	x (без преобразования)
`'sign'`	-1 для x < 0 0 для x = 0 1 для x > 0
`'symmetric'`	2 x – 1
`'symmetricismax'`	Устанавливает счет для класса с самым большим счетом равным 1 и устанавливает счета для всех других классов равной -1
`'symmetriclogit'`	2/(1 + e^–x) – 1

Для функции MATLAB или функции, которую вы задаете, введите указатель на функцию.
```
Mdl.ScoreTransform = @function;
```
function необходимо принять матрицу (исходные счета) и вернуть матрицу того же размера (преобразованные счета).

Типы данных: char | function_handle

`Sigma` - Стандартные отклонения предиктора
`[]` (по умолчанию) | числовой вектор

Это свойство доступно только для чтения.

Стандартные отклонения предиктора, заданные как числовой вектор.

Если вы задаете 'Standardize',true при обучении классификатора SVM с помощью fitcsvm, затем длина Sigma равен количеству переменных.

MATLAB расширяет категориальные переменные в данных предиктора, используя полную фиктивную кодировку. То есть MATLAB создает по одной фиктивной переменной для каждого уровня каждой категориальной переменной. Sigma сохраняет одно значение для каждой переменной предиктора, включая фиктивные переменные. Однако MATLAB не стандартизирует столбцы, которые содержат категориальные переменные.

Если вы задаете 'Standardize',false при обучении классификатора SVM с помощью fitcsvm, затем Sigma - пустой вектор ([]).

Типы данных: single | double

`W` - Веса наблюдений
числовой вектор

Это свойство доступно только для чтения.

Веса наблюдений, используемые для обучения классификатора SVM, заданные как n-на-1 числовой вектор. n - количество наблюдений (см. NumObservations).

fitcsvm нормализует веса наблюдений, указанные в 'Weights' аргумент пары "имя-значение" таким образом, чтобы элементы W в пределах конкретной суммы классов до предшествующей вероятности этого класса.

Типы данных: single | double

`X` - Нестандартные предикторы
числовая матрица | таблица

Это свойство доступно только для чтения.

Нестандартные предикторы, используемые для обучения классификатора SVM, заданные как числовая матрица или таблица.

Каждая строка X соответствует одному наблюдению, и каждый столбец соответствует одной переменной.

MATLAB исключает наблюдения, содержащие по крайней мере одно отсутствующее значение, и удаляет соответствующие элементы из Y.

Типы данных: single | double

`Y` - Метки классов
категориальный массив | символьный массив | логический вектор | числовой вектор | ячеек из символьных векторов

Это свойство доступно только для чтения.

Метки классов, используемые для обучения классификатора SVM, заданные как категориальный или символьный массив, логический или числовой вектор или массив ячеек векторов символов. Y - тот совпадающий тип данных, что и входной параметр Y из fitcsvm. (Программа обрабатывает массивы строк как массивы ячеек векторов символов.)

Каждая строка Y представляет наблюдаемую классификацию соответствующей строки X.

MATLAB исключает элементы, содержащие отсутствующие значения, и удаляет соответствующие наблюдения из X.

Свойства управления сходимостью

`ConvergenceInfo` - Информация о сходимости
массив структур

Это свойство доступно только для чтения.

Информация о сходимости, заданная как массив структур.

Область	Описание
`Converged`	Логический флаг, указывающий, сходился ли алгоритм (`1` указывает на сходимость).
`ReasonForConvergence`	Вектор символов, указывающий критерий, который программное обеспечение использует для обнаружения сходимости.
`Gap`	Скалярная погрешность осуществимости между двойственной и основной целевыми функциями.
`GapTolerance`	Скалярный допуск погрешности осуществимости. Установите этот допуск, например, равным `1e-2`, при помощи аргумента пары "имя-значение" `'GapTolerance',1e-2` из `fitcsvm`.
`DeltaGradient`	Скалярное различие градиентов между верхним и нижним нарушителями
`DeltaGradientTolerance`	Скалярный допуск для различия градиентов между верхним и нижним нарушителями. Установите этот допуск, например, равным `1e-2`, при помощи аргумента пары "имя-значение" `'DeltaGradientTolerance',1e-2` из `fitcsvm`.
`LargestKKTViolation`	Максимальный скаляр нарушения Каруша-Куна-Такера (KKT).
`KKTTolerance`	Скалярный допуск для наибольшего нарушения KKT. Установите этот допуск, например, равным `1e-3`, при помощи аргумента пары "имя-значение" `'KKTTolerance',1e-3` из `fitcsvm`.
`History`	Массив структур, содержащий информацию сходимости при заданных итерациях оптимизации. Поля: `NumIterations`: числовой вектор индексов итерации, для которых программное обеспечение записывает информацию о сходимости `Gap`: числовой вектор `Gap` значения в итерациях `DeltaGradient`: числовой вектор `DeltaGradient` значения в итерациях `LargestKKTViolation`: числовой вектор `LargestKKTViolation` значения в итерациях `NumSupportVectors`: числовой вектор, указывающий количество поддерживающих векторов в итерациях `Objective`: числовой вектор `Objective` значения в итерациях
`Objective`	Скалярное значение двойственной целевой функции.

Типы данных: struct

`NumIterations` - Количество итераций
положительное целое число

Это свойство доступно только для чтения.

Количество итераций, требуемых стандартной программой оптимизации для достижения сходимости, заданное как положительное целое число.

Чтобы установить предел на количество итераций равным 1000, для примера задайте 'IterationLimit',1000 при обучении классификатора SVM с помощью fitcsvm.

Типы данных: double

`ShrinkagePeriod` - Количество итераций между сокращениями активного набора
неотрицательное целое число

Это свойство доступно только для чтения.

Количество итераций между сокращениями активного множества, заданное в виде неотрицательного целого числа.

Чтобы задать период усадки равным 1000, для примера задайте 'ShrinkagePeriod',1000 при обучении классификатора SVM с помощью fitcsvm.

Типы данных: single | double

Свойства оптимизации гипероптимизации параметров управления

`HyperparameterOptimizationResults` - Описание оптимизации гиперпараметров перекрестной валидации
`BayesianOptimization`таблица | объекта

Это свойство доступно только для чтения.

Описание оптимизации гиперпараметров перекрестной валидации, заданное как BayesianOptimization объект или таблица гиперпараметров и связанных значений. Это свойство непусто, когда 'OptimizeHyperparameters' Аргумент пары "имя-значение" из fitcsvm не пуст при создании. Значение HyperparameterOptimizationResults зависит от настройки Optimizer поле в HyperparameterOptimizationOptions структуру fitcsvm при создании, как описано в этой таблице.

Значение `Optimizer` Область	Значение `HyperparameterOptimizationResults`
`'bayesopt'` (по умолчанию)	Объект `BayesianOptimization классов`
`'gridsearch'` или `'randomsearch'`	Таблица используемых гиперпараметров, наблюдаемых значений целевой функции (потери перекрестной валидации) и ранг наблюдений от самого низкого (лучшего) до самого высокого (худшего)

Функции объекта

`compact`	Уменьшите размер модели машинного обучения
`compareHoldout`	Сравните точности двух классификационных моделей с помощью новых данных
`crossval`	Перекрестная валидация модели машинного обучения
`discardSupportVectors`	Сбросьте поддерживающие векторы для классификатора линейной машины опорных векторов (SVM)
`edge`	Найдите ребро классификации для классификатора машины опорных векторов (SVM)
`fitPosterior`	Подгонка апостериорных вероятностей для классификатора машины опорных векторов (SVM)
`incrementalLearner`	Преобразуйте модель машины опорных векторов двоичной классификации (SVM) в инкрементальную обучающуюся
`loss`	Найдите ошибку классификации для классификатора машины опорных векторов (SVM)
`margin`	Найдите классификационные поля для классификатора машины опорных векторов (SVM)
`partialDependence`	Вычисление частичной зависимости
`plotPartialDependence`	Создайте график частичной зависимости (PDP) и отдельные графики условного ожидания (ICE)
`predict`	Классификация наблюдений с помощью машины опорных векторов (SVM) классификатора
`resubEdge`	Ребро классификации реституции
`lime`	Локальные интерпретируемые модели-агностические объяснения (LIME)
`resubLoss`	Потери по классификации реституции
`resubMargin`	Классификационный запас для реституции
`resubPredict`	Классификация обучающих данных с помощью обученного классификатора
`resume`	Возобновите обучение машины опорных векторов (SVM)
`shapley`	Значения Shapley
`testckfold`	Сравните точности двух классификационных моделей путем повторной перекрестной валидации

Примеры

свернуть все

Обучите классификатор SVM

Попробовать в MATLAB

Загрузите набор данных радужки Фишера. Удалите длины и ширины чашелистиков и все наблюдаемые сетозы.

load fisheriris
inds = ~strcmp(species,'setosa');
X = meas(inds,3:4);
y = species(inds);

Обучите классификатор SVM с помощью обработанного набора данных.

SVMModel = fitcsvm(X,y)

SVMModel = 
  ClassificationSVM
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'versicolor'  'virginica'}
           ScoreTransform: 'none'
          NumObservations: 100
                    Alpha: [24x1 double]
                     Bias: -14.4149
         KernelParameters: [1x1 struct]
           BoxConstraints: [100x1 double]
          ConvergenceInfo: [1x1 struct]
          IsSupportVector: [100x1 logical]
                   Solver: 'SMO'


  Properties, Methods

SVMModel является обученным ClassificationSVM классификатор. Отображение свойств SVMModel. Для примера, чтобы определить порядок классов, используйте запись через точку.

classOrder = SVMModel.ClassNames

classOrder = 2x1 cell
    {'versicolor'}
    {'virginica' }

Первый класс ('versicolor') - отрицательный класс, а второй ('virginica') - положительный класс. Вы можете изменить порядок классов во время обучения с помощью 'ClassNames' аргумент пары "имя-значение".

Постройте график рассеяния данных и кружите векторы поддержки.

sv = SVMModel.SupportVectors;
figure
gscatter(X(:,1),X(:,2),y)
hold on
plot(sv(:,1),sv(:,2),'ko','MarkerSize',10)
legend('versicolor','virginica','Support Vector')
hold off

Figure contains an axes. The axes contains 3 objects of type line. These objects represent versicolor, virginica, Support Vector.

Векторы поддержки являются наблюдениями, которые происходят на или за пределами их предполагаемых контуров класса.

Можно настроить контуры (и, следовательно, количество векторов поддержки), установив прямоугольное ограничение во время обучения с помощью 'BoxConstraint' аргумент пары "имя-значение".

Обучение и перекрестная проверка классификатора SVM

Попробовать в MATLAB

Загрузите ionosphere набор данных.

load ionosphere

Обучите и перекрестная проверка классификатора SVM. Стандартизируйте данные предиктора и задайте порядок классов.

rng(1);  % For reproducibility
CVSVMModel = fitcsvm(X,Y,'Standardize',true,...
    'ClassNames',{'b','g'},'CrossVal','on')

CVSVMModel = 
  ClassificationPartitionedModel
    CrossValidatedModel: 'SVM'
         PredictorNames: {1x34 cell}
           ResponseName: 'Y'
        NumObservations: 351
                  KFold: 10
              Partition: [1x1 cvpartition]
             ClassNames: {'b'  'g'}
         ScoreTransform: 'none'


  Properties, Methods

CVSVMModel является ClassificationPartitionedModel перекрестная проверка классификатора SVM. По умолчанию программное обеспечение реализует 10-кратную перекрестную валидацию.

Кроме того, можно провести перекрестную проверку обученного ClassificationSVM классификатор путем передачи его в crossval.

Осмотрите один из обученных складок с помощью записи через точку.

CVSVMModel.Trained{1}

ans = 
  CompactClassificationSVM
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
                    Alpha: [78x1 double]
                     Bias: -0.2209
         KernelParameters: [1x1 struct]
                       Mu: [1x34 double]
                    Sigma: [1x34 double]
           SupportVectors: [78x34 double]
      SupportVectorLabels: [78x1 double]


  Properties, Methods

Каждая складка является CompactClassificationSVM классификатор обучен на 90% данных.

Оцените ошибку обобщения.

genError = kfoldLoss(CVSVMModel)

genError = 0.1168

В среднее значение ошибка обобщения составляет приблизительно 12%.

Подробнее о

расширить все

Прямоугольное ограничение

Прямоугольное ограничение является параметром, который управляет максимальным штрафом, налагаемым на наблюдения, нарушающие маржу, что помогает предотвратить избыточную подгонку (регуляризацию).

Если вы увеличиваете прямоугольное ограничение, классификатор SVM присваивает меньше векторов поддержки. Однако увеличение ограничения коробки может привести к увеличению времени обучения.

Грамм- Матрица

Матрица Грамма множества n векторов {x 1,.., xn; xj ∊ R^p} n n матрицей с элементом (j, k) определен как G (_xj, _xk) = <ϕ _{(<reservedrangesplaceholder3>)}, ϕ (<reservedrangesplaceholder1>)>, скалярное произведение преобразованных предсказателей, использующих ядерную функцию ϕ.

Для нелинейного SVM алгоритм формирует матрицу Gram, используя строки X данных предиктора. Двойственная формализация заменяет скалярное произведение наблюдений в X на соответствующие элементы получившейся матрицы Грамма (называемой «хитростью ядра»). Следовательно, нелинейный SVM действует в преобразованном пространстве предикторов, чтобы найти разделяющую гиперплоскость.

Условия комплементарности Каруша-Куна-Такера

Условия комплементарности KKT являются ограничениями оптимизации, необходимыми для оптимальных нелинейных решений программирования.

В SVM условия комплементарности KKT:

${\begin{cases} α_{j} [y_{j} f (x_{j}) - 1 + ξ_{j}] = 0 \\ ξ_{j} (C - α_{j}) = 0 \end{cases}$

для всех j = 1,..., n, где $f (x_{j}) = ϕ (x_{j})' β + b,$ ϕ является функцией ядра (см. Матрица), а _ξj - переменной slack. Если классы совершенно разделимы, то _ξj = 0 для всех j = 1,..., n.

Одноклассное обучение

Одноклассное обучение, или неконтролируемое SVM, направлено на отделение данных от источника в высокомерном пространстве предикторов (не в исходном пространстве предикторов) и является алгоритмом, используемым для определения выбросов.

Алгоритм напоминает алгоритм SVM для двоичной классификации. Цель состоит в том, чтобы минимизировать двойственное выражение

$0.5 \sum_{j k} α_{j} α_{k} G (x_{j}, x_{k})$

по отношению к $α_{1}, ..., α_{n}$ , при условии

$\sum α_{j} = n ν$

и $0 \leq α_{j} \leq 1$ для всех j = 1,..., n. Значение G ₍xj_, xk) находится в элементе (j, k) матрицы Gram.

Небольшое значение ν приводит к меньшему количеству векторов поддержки и, следовательно, к плавному грубому контуру принятия решений. Большое значение ν приводит к большему количеству поддерживающих векторов и, следовательно, к кривому гибкому контуру принятия решений. Оптимальное значение ν должно быть достаточно большим, чтобы захватить сложность данных и достаточно маленьким, чтобы избежать переобучения. Кроме того, 0 < ν ≤ 1.

Для получения дополнительной информации см. раздел [5].

Вектор поддержки

Векторы поддержки являются наблюдениями, соответствующими строго положительным оценкам α 1,..., αn.

Классификаторы SVM, которые дают меньше векторов поддержки для данного набора обучающих данных, являются предпочтительными.

Машины опорных векторов для двоичной классификации

Алгоритм двоичной классификации SVM ищет оптимальную гиперплоскость, которая разделяет данные на два класса. Для разделяемых классов оптимальная гиперплоскость максимизирует окружающую себя margin (пространство, которое не содержит никаких наблюдений), которая создает контуры для положительных и отрицательных классов. Для неотделимых классов цель та же самая, но алгоритм накладывает штраф на длину поля для каждого наблюдения, которое находится на неправильной стороне его контура класса.

Линейная функция счета SVM

$f (x) = x' β + b,$

где:

x является наблюдением (соответствующим строке X).
Векторная β содержит коэффициенты, которые задают ортогональный вектор для гиперплоскости (соответствующий Mdl.Beta). Для разделяемых данных оптимальная длина запаса $2 / ‖ β ‖ .$
b - термин смещения (соответствующий Mdl.Bias).

Корень f (x) для конкретных коэффициентов задает гиперплоскость. Для конкретной гиперплоскости f (z) является расстоянием от точки z до гиперплоскости.

Алгоритм ищет максимальную длину запаса, сохраняя наблюдения в положительном (y = 1) и отрицательном (y = -1) классах раздельными.

Для разделяемых классов цель состоит в том, чтобы минимизировать $‖ β ‖$ относительно β и b, удовлетворяющих _yj f ₍xj) ≥ 1, для всех j = 1,.., n. Это - primal формализация для разделяемых классов.
Для неотделимых классов алгоритм использует переменные slack (_ξj), чтобы наказать целевую функцию для наблюдений, которые пересекают контур края для их класса. _ξj = 0 для наблюдений, которые не пересекают контур поля для их класса, в противном случае _ξj ≥ 0.
Цель состоит в том, чтобы минимизировать $0.5 {‖ β ‖}^{2} + C \sum ξ_{j}$ в отношении β, b и _ξj при условии $y_{j} f (x_{j}) \geq 1 - ξ_{j}$ и $ξ_{j} \geq 0$ для всех j = 1,.., n и для положительной скалярной величины ограничения C ящика. Это основная формализация для неотделимых классов.

Алгоритм использует метод множителей Лагранжа, чтобы оптимизировать цель, которая вводит коэффициенты n α 1,..., αn (соответствующий Mdl.Alpha). Двойные формализации для линейного SVM следующие:

Для разделяемых классов минимизируйте

$0.5 \sum_{j = 1}^{n} \sum_{k = 1}^{n} α_{j} α_{k} y_{j} y_{k} x_{j}' x_{k} - \sum_{j = 1}^{n} α_{j}$
в отношении α 1,..., αn, при условии $\sum α_{j} y_{j} = 0$ _αj ≥ 0 для всех условий комплементарности j = 1,..., n и Karush-Kuhn-Tucker (KKT).
Для неотделимых классов цель такая же, как и для разделяемых классов, за исключением дополнительного условия $0 \leq α_{j} \leq C$ для всех j = 1,.., n.

Получившийся счет функция является

$\hat{f} (x) = \sum_{j = 1}^{n} {\hat{α}}_{j} y_{j} x' x_{j} + \hat{b} .$

$\hat{b}$ - оценка смещения и ${\hat{α}}_{j}$ - j-я оценка вектора $\hat{α}$ , j = 1..., n. Написанная таким образом, функция счета свободна от оценки β в результате основной формализации.

Алгоритм SVM классифицирует новый z наблюдения, используя $sign (\hat{f} (z)) .$

В некоторых случаях нелинейный контур разделяет классы. Nonlinear SVM работает в преобразованном пространстве предикторов, чтобы найти оптимальную, разделяющую гиперплоскость.

Двойственная формализация для нелинейного SVM

$0.5 \sum_{j = 1}^{n} \sum_{k = 1}^{n} α_{j} α_{k} y_{j} y_{k} G (x_{j}, x_{k}) - \sum_{j = 1}^{n} α_{j}$

в отношении α 1,..., αn, при условии $\sum α_{j} y_{j} = 0$ , $0 \leq α_{j} \leq C$ для всех j = 1,.., n и условий комплементарности KKT. G ₍xk_, xj) являются элементами матрицы Грамма. Получившийся счет функция является

$\hat{f} (x) = \sum_{j = 1}^{n} {\hat{α}}_{j} y_{j} G (x, x_{j}) + \hat{b} .$

Для получения дополнительной информации см. «Общие сведения о машинах опорных векторов», [1] и [3].

Алгоритмы

Для математической формулировки алгоритма двоичной классификации SVM, смотрите Машины опорных векторов для двоичной классификации и Машин опорных векторов понимания.
NaN, <undefined>, пустой символьный вектор (''), пустая строка (""), и <missing> значения указывают на отсутствующие значения. fitcsvm удаляет целые строки данных, соответствующих отсутствующему ответу. При вычислении общих весов (см. следующие пули) fitcsvm игнорирует любой вес, относящийся к наблюдению, по крайней мере, с одним отсутствующим предиктором. Это действие может привести к несбалансированным предшествующим вероятностям в задачах сбалансированного класса. Следовательно, ограничения ящика наблюдений могут не равняться BoxConstraint.
fitcsvm удаляет наблюдения, которые имеют нулевой вес или предшествующую вероятность.
Для двухклассного обучения, если вы задаете матрицу затрат $C$ (см. Cost), затем программное обеспечение обновляет класс априорных вероятностей p (см Prior) для _pc путем включения штрафов, описанных в $C$ .
В частности, fitcsvm завершает следующие шаги:
1. Вычислить $p_{c}^{*} = p' C .$
2. Нормализуйте _pc^* так что обновленные предыдущие вероятности равны 1.
  
  $p_{c} = \frac{1}{\sum_{j = 1}^{K} p_{c, j}^{*}} p_{c}^{*} .$
  K - количество классов.
3. Обнулите матрицу затрат по умолчанию
  
  $C = [\begin{matrix} 0 & 1 \\ 1 & 0 \end{matrix}] .$
4. Удалите наблюдения из обучающих данных, соответствующих классам с нулевой предшествующей вероятностью.
Для двухклассного обучения, fitcsvm нормализует все веса наблюдений (см Weights) в сумме до 1. Затем функция перенормирует нормированные веса, чтобы суммировать до обновленной предыдущей вероятности класса, к которому принадлежит наблюдение. То есть, общий вес для j наблюдений в классе k,

$w_{j}^{*} = \frac{w_{j}}{\sum_{\forall j \in Класс k} w_{j}} p_{c, k} .$
_wj - нормированный вес для j наблюдений; p _ck является обновленной предыдущей вероятностью k класса (см. Предыдущий буллит).
Для двухклассного обучения, fitcsvm присваивает прямоугольное ограничение каждому наблюдению в обучающих данных. Формула для прямоугольного ограничения j наблюдений

$C_{j} = n C_{0} w_{j}^{*} .$
n - размер обучающей выборки, C 0 - начальное прямоугольное ограничение (см. 'BoxConstraint' аргумент пары "имя-значение"), и $w_{j}^{*}$ - общий вес j наблюдения (см. предыдущую пулю).
Если вы задаете 'Standardize',true и 'Cost', 'Prior', или 'Weights' аргумент пары "имя-значение", затем fitcsvm стандартизирует предикторы с помощью их соответствующих взвешенных средств и взвешенных стандартных отклонений. То есть fitcsvm стандартизирует предиктор j (_xj), используя

$x_{j}^{*} = \frac{x_{j} - μ_{j}^{*}}{σ_{j}^{*}} .$
$μ_{j}^{*} = \frac{1}{\sum_{k} w_{k}^{*}} \sum_{k} w_{k}^{*} x_{j k} .$
_xjk - k наблюдения (строка) предиктора j (столбец).
${(σ_{j}^{*})}^{2} = \frac{v_{1}}{v_{1}^{2} - v_{2}} \sum_{k} w_{k}^{*} {(x_{j k} - μ_{j}^{*})}^{2} .$
$v_{1} = \sum_{j} w_{j}^{*} .$
$v_{2} = \sum_{j} {(w_{j}^{*})}^{2} .$
Предположим, что p - это доля выбросов, которые вы ожидаете в обучающих данных и которые вы задаете 'OutlierFraction',p.
- Для одноклассного обучения программное обеспечение обучает термин смещения таким образом, чтобы 100 p% наблюдений в обучающих данных имеют отрицательные счета.
- Программное обеспечение реализует robust learning для двухклассного обучения. Другими словами, программное обеспечение пытается удалить 100 p% наблюдений, когда алгоритм оптимизации сходится. Удаленные наблюдения соответствуют градиентам, которые являются большими по величине.
Если ваши данные предиктора содержат категориальные переменные, то программное обеспечение обычно использует полную фиктивную кодировку для этих переменных. Программа создает по одной фиктивной переменной для каждого уровня каждой категориальной переменной.
- The PredictorNames свойство сохраняет по одному элементу для каждого из исходных имен переменных предиктора. Например, предположим, что существует три предиктора, один из которых является категориальной переменной с тремя уровнями. Затем PredictorNames - массив ячеек 1 на 3 из векторов символов, содержащий исходные имена переменных.
- The ExpandedPredictorNames свойство сохраняет по одному элементу для каждой из переменных предиктора, включая фиктивные переменные. Например, предположим, что существует три предиктора, один из которых является категориальной переменной с тремя уровнями. Затем ExpandedPredictorNames - массив ячеек 1 на 5 из векторов символов, содержащий имена переменных-предикторов и новых фиктивных переменных.
- Точно так же Beta свойство сохраняет один бета-коэффициент для каждого предиктора, включая фиктивные переменные.
- The SupportVectors свойство сохраняет значения предиктора для поддерживающих векторов, включая фиктивные переменные. Например, предположим, что существует m векторов поддержки и три предиктора, один из которых является категориальной переменной с тремя уровнями. Затем SupportVectors является матрицей n -by-5.
- The X свойство сохраняет обучающие данные как исходные входные и не включает фиктивные переменные. Когда вход является таблицей, X содержит только столбцы, используемые в качестве предикторов.
Для предикторов, заданных в таблице, если любая из переменных содержит упорядоченные (порядковые) категории, программа использует порядковую кодировку для этих переменных.
- Для переменной с k упорядоченными уровнями программное обеспечение создает k - 1 фиктивные переменные. Переменная j-го манекена является -1 для уровней до j и + 1 для уровней j + 1 до k.
- Имена фиктивных переменных, хранящихся в ExpandedPredictorNames свойство указывает на первый уровень со значением + 1. Программное обеспечение хранит k - 1 дополнительные имена предикторов для фиктивных переменных, включая имена уровней 2, 3,..., k.
Все решатели реализуют L 1 минимизации мягких полей.
Для одноклассного обучения программное обеспечение оценивает множители Лагранжа, α 1,..., αn, такие, что

$\sum_{j = 1}^{n} α_{j} = n ν .$

Ссылки

[1] Хасти, Т., Р. Тибширани и Дж. Фридман. Элементы статистического обучения, второе издание. Нью-Йорк: Спрингер, 2008.

[2] Scholkopf, B., J. C. Platt, J. C. Shawe-Taylor, A. J. Smola, and R. C. Williamson. Оценка поддержки высокомерного распределения. Нейронный компут., Vol. 13, Number 7, 2001, pp. 1443-1471.

[3] Christianini, N., and J. C. Shawe-Taylor. Введение в машины опорных векторов и других основанных на ядре методов обучения. Кембридж, Великобритания: Cambridge University Press, 2000.

[4] Scholkopf, B., and A. Smola. Обучение с ядерными ядрами: Машины опорных векторов, регуляризация, оптимизация и далее, адаптивные расчеты и машинное обучение. Cambridge, MA: The MIT Press, 2002.

Расширенные возможности

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

Указания и ограничения по применению:

Для получения дополнительной информации смотрите Введение в генерацию кода.

См. также

ClassificationPartitionedModel | CompactClassificationSVM | fitcsvm

Темы

Введенный в R2014a

Statistics and Machine Learning Toolbox документация

Поддержка

Сообщество Экспонента

Документация

ClassificationSVM

Описание

Создание

Свойства

Свойства SVM

Alpha - Обученные коэффициенты классификатора числовой вектор

Beta - Линейные коэффициенты предиктора числовой вектор

Bias - Термин смещения скаляр

BoxConstraints - Прямоугольные ограничения числовой вектор

CacheInfo - Информация о кэшировании массив структур

IsSupportVector - Векторный индикатор поддержки логический вектор

KernelParameters - Параметры ядра массив структур

Nu - Одноклассный параметр обучения положительная скалярная величина

OutlierFraction - Доля выбросов числовой скаляр

Solver - стандартная программа оптимизации 'ISDA' | 'L1QP' | 'SMO'

SupportVectorLabels - Поддержка меток классов векторов s -by-1 числовой вектор

SupportVectors - Поддерживающие векторы s -by p числовая матрица

Другие классификационные свойства

CategoricalPredictors - Категориальные индексы предиктора вектор положительных целых чисел | []

ClassNames - Уникальные метки классов категориальный массив | символьный массив | логический вектор | числовой вектор | ячеек из символьных векторов

Cost - Расходы на неправильную классификацию числовая квадратная матрица

ExpandedPredictorNames - Расширенные имена предикторов массив ячеек из векторов символов

Gradient - Значения градиента обучающих данных числовой вектор

ModelParameters - Параметры, используемые для обучения модели объект

Mu - Предиктор означает числовой вектор | []

NumObservations - Количество наблюдений числовой скаляр

PredictorNames - Имена переменных предиктора массив ячеек из векторов символов

Prior - Предыдущие вероятности числовой вектор

ResponseName - Имя переменной отклика вектор символов

RowsUsed - Строки, используемые в подборе кривой [] | логический вектор

ScoreTransform - Преобразование счета вектор символов | указатель на функцию

Sigma - Стандартные отклонения предиктора [] (по умолчанию) | числовой вектор

W - Веса наблюдений числовой вектор

X - Нестандартные предикторы числовая матрица | таблица

Y - Метки классов категориальный массив | символьный массив | логический вектор | числовой вектор | ячеек из символьных векторов

Свойства управления сходимостью

ConvergenceInfo - Информация о сходимости массив структур

NumIterations - Количество итераций положительное целое число

ShrinkagePeriod - Количество итераций между сокращениями активного набора неотрицательное целое число

Свойства оптимизации гипероптимизации параметров управления

HyperparameterOptimizationResults - Описание оптимизации гиперпараметров перекрестной валидации BayesianOptimizationтаблица | объекта

Функции объекта

Примеры

Обучите классификатор SVM

Обучение и перекрестная проверка классификатора SVM

Подробнее о

Прямоугольное ограничение

Грамм- Матрица

Условия комплементарности Каруша-Куна-Такера

Одноклассное обучение

Вектор поддержки

Машины опорных векторов для двоичной классификации

Алгоритмы

Ссылки

Расширенные возможности

Генерация кода C/C + + Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®

См. также

Темы

Statistics and Machine Learning Toolbox документация

Поддержка

`Alpha` - Обученные коэффициенты классификатора
числовой вектор

`Beta` - Линейные коэффициенты предиктора
числовой вектор

`Bias` - Термин смещения
скаляр

`BoxConstraints` - Прямоугольные ограничения
числовой вектор

`CacheInfo` - Информация о кэшировании
массив структур

`IsSupportVector` - Векторный индикатор поддержки
логический вектор

`KernelParameters` - Параметры ядра
массив структур

`Nu` - Одноклассный параметр обучения
положительная скалярная величина

`OutlierFraction` - Доля выбросов
числовой скаляр

`Solver` - стандартная программа оптимизации
`'ISDA'` | `'L1QP'` | `'SMO'`

`SupportVectorLabels` - Поддержка меток классов векторов
s -by-1 числовой вектор

`SupportVectors` - Поддерживающие векторы
s -by p числовая матрица

`CategoricalPredictors` - Категориальные индексы предиктора
вектор положительных целых чисел | `[]`

`ClassNames` - Уникальные метки классов
категориальный массив | символьный массив | логический вектор | числовой вектор | ячеек из символьных векторов

`Cost` - Расходы на неправильную классификацию
числовая квадратная матрица

`ExpandedPredictorNames` - Расширенные имена предикторов
массив ячеек из векторов символов

`Gradient` - Значения градиента обучающих данных
числовой вектор

`ModelParameters` - Параметры, используемые для обучения модели
объект

`Mu` - Предиктор означает
числовой вектор | `[]`

`NumObservations` - Количество наблюдений
числовой скаляр

`PredictorNames` - Имена переменных предиктора
массив ячеек из векторов символов

`Prior` - Предыдущие вероятности
числовой вектор

`ResponseName` - Имя переменной отклика
вектор символов

`RowsUsed` - Строки, используемые в подборе кривой
`[]` | логический вектор

`ScoreTransform` - Преобразование счета
вектор символов | указатель на функцию

`Sigma` - Стандартные отклонения предиктора
`[]` (по умолчанию) | числовой вектор

`W` - Веса наблюдений
числовой вектор

`X` - Нестандартные предикторы
числовая матрица | таблица

`Y` - Метки классов
категориальный массив | символьный массив | логический вектор | числовой вектор | ячеек из символьных векторов

`ConvergenceInfo` - Информация о сходимости
массив структур

`NumIterations` - Количество итераций
положительное целое число

`ShrinkagePeriod` - Количество итераций между сокращениями активного набора
неотрицательное целое число

`HyperparameterOptimizationResults` - Описание оптимизации гиперпараметров перекрестной валидации
`BayesianOptimization`таблица | объекта

Генерация кода C/C + +
Сгенерируйте код C и C++ с помощью Coder™ MATLAB ®