ClassificationPartitionedKernelECOC

Перекрестная подтвержденная модель выходных кодов с коррекцией ошибок (ECOC) ядра для классификации мультиклассов

Описание

ClassificationPartitionedKernelECOC модель выходных кодов с коррекцией ошибок (ECOC), состоявшая из моделей классификации ядер, обученных на перекрестных подтвержденных сгибах. Оцените качество классификации перекрестной проверкой с помощью одной или нескольких функций “kfold”: kfoldPredict, kfoldLoss, kfoldMargin, и kfoldEdge.

Каждые “kfold” модели использования метода, обученные на учебном сгибе, (окутывают) наблюдения, чтобы предсказать ответ для сгиба валидации наблюдения (из сгиба). Например, предположите, что вы перекрестный подтверждаете использование пяти сгибов. В этом случае программное обеспечение случайным образом присваивает каждое наблюдение в пять групп равного размера (примерно). training fold содержит четыре из групп (то есть, примерно 4/5 данных), и validation fold содержит другую группу (то есть, примерно 1/5 данных). В этом случае перекрестная проверка продолжает можно следующим образом:

  1. Программное обеспечение обучает первую модель (сохраненный в CVMdl.Trained{1}) при помощи наблюдений в последних четырех группах и резервах наблюдения в первой группе для валидации.

  2. Программное обеспечение обучает вторую модель (сохраненный в CVMdl.Trained{2}) использование наблюдений в первой группе и последних трех группах. Программное обеспечение резервирует наблюдения во второй группе для валидации.

  3. Программное обеспечение продолжает подобным способом для третьих, четвертых, и пятых моделей.

Если вы подтверждаете при помощи kfoldPredict, программное обеспечение вычисляет предсказания для наблюдений в группе i при помощи i th модель. Короче говоря, программное обеспечение оценивает ответ для каждого наблюдения при помощи модели, обученной без того наблюдения.

Примечание

ClassificationPartitionedKernelECOC объекты модели не хранят набор данных предиктора.

Создание

Можно создать ClassificationPartitionedKernelECOC модель по образованию использование модели ECOC fitcecoc и определение этих аргументов пары "имя-значение":

  • 'Learners'– Установите значение к 'kernel', объект шаблона, возвращенный templateKernel, или массив ячеек таких объектов шаблона.

  • Один из аргументов 'CrossVal', 'CVPartition', 'Holdout', 'KFold', или 'Leaveout'.

Для получения дополнительной информации смотрите fitcecoc.

Свойства

развернуть все

Свойства перекрестной проверки

Это свойство доступно только для чтения.

Перекрестное подтвержденное имя модели в виде вектора символов.

Например, 'KernelECOC' задает перекрестную подтвержденную модель ECOC ядра.

Типы данных: char

Это свойство доступно только для чтения.

Количество перекрестных подтвержденных сгибов в виде положительного целочисленного скаляра.

Типы данных: double

Это свойство доступно только для чтения.

Значения параметров перекрестной проверки в виде объекта. Значения параметров соответствуют значениям аргумента пары "имя-значение", используемым, чтобы перекрестный подтвердить классификатор ECOC. ModelParameters не содержит оцененные параметры.

Можно получить доступ к свойствам ModelParameters использование записи через точку.

Это свойство доступно только для чтения.

Количество наблюдений в обучающих данных в виде положительного числового скаляра.

Типы данных: double

Это свойство доступно только для чтения.

Раздел данных, указывающий, как программное обеспечение разделяет данные в сгибы перекрестной проверки в виде cvpartition модель.

Это свойство доступно только для чтения.

Компактные классификаторы, обученные на перекрестной проверке, сворачиваются в виде массива ячеек CompactClassificationECOC модели. Trained имеет ячейки k, где k является количеством сгибов.

Типы данных: cell

Это свойство доступно только для чтения.

Веса наблюдения раньше перекрестный подтверждали модель в виде числового вектора. W имеет NumObservations элементы.

Программное обеспечение нормирует веса, используемые для обучения так, чтобы sum(W,'omitnan') 1.

Типы данных: single | double

Это свойство доступно только для чтения.

Наблюдаемые метки класса раньше перекрестный подтверждали модель в виде категориального или символьного массива, логического или числового вектора или массива ячеек из символьных векторов. Y имеет NumObservations элементы и имеют совпадающий тип данных как входной параметр Y то, что вы передаете fitcecoc перекрестный подтверждать модель. (Программное обеспечение обрабатывает строковые массивы как массивы ячеек из символьных векторов.)

Каждая строка Y представляет наблюдаемую классификацию соответствующей строки данных о предикторе.

Типы данных: categorical | char | logical | single | double | cell

Свойства ECOC

Это свойство доступно только для чтения.

Бинарная функция потерь ученика в виде вектора символов, представляющего имя функции потерь.

По умолчанию, если все бинарные ученики являются моделями классификации ядер с помощью SVM, то BinaryLoss 'hinge'. Если все бинарные ученики являются моделями классификации ядер с помощью логистической регрессии, то BinaryLoss 'quadratic'. Чтобы потенциально увеличить точность, задайте бинарную функцию потерь кроме значения по умолчанию во время предсказания или расчета потерь при помощи 'BinaryLoss' аргумент пары "имя-значение" kfoldPredict или kfoldLoss.

Типы данных: char

Это свойство доступно только для чтения.

Бинарный класс ученика помечает в виде числовой матрицы или [].

  • Если матрица кодирования является тем же самым через все сгибы, то BinaryY NumObservations- L матрица, где L является количеством бинарных учеников (size(CodingMatrix,2)).

    Элементы BinaryY –1, 0, или 1, и значения соответствуют дихотомическим присвоениям класса. Эта таблица описывает как ученик j наблюдение присвоений k к дихотомическому классу, соответствующему значению BinaryY(k,j).

    ЗначениеДихотомическое присвоение класса
    –1Ученик j наблюдение присвоений k к отрицательному классу.
    0Перед обучением, ученик j удаляет наблюдение k от набора данных.
    1Ученик j наблюдение присвоений k к положительному классу.

  • Если матрица кодирования варьируется через сгибы, то BinaryY isempty).

Типы данных: double

Это свойство доступно только для чтения.

Коды, задающие присвоения класса для бинарных учеников в виде числовой матрицы или [].

  • Если матрица кодирования является тем же самым через все сгибы, то CodingMatrix K-by-L матрица, где K является количеством классов, и L является количеством бинарных учеников.

    Элементы CodingMatrix –1, 0, или 1, и значения соответствуют дихотомическим присвоениям класса. Эта таблица описывает как ученик j наблюдения присвоений в классе i к дихотомическому классу, соответствующему значению CodingMatrix(i,j).

    ЗначениеДихотомическое присвоение класса
    –1Ученик j наблюдения присвоений в классе i к отрицательному классу.
    0Перед обучением, ученик j удаляет наблюдения в классе i от набора данных.
    1Ученик j наблюдения присвоений в классе i к положительному классу.

  • Если матрица кодирования варьируется через сгибы, то CodingMatrix isempty). Можно получить матрицу кодирования для каждого сгиба при помощи Trained свойство. Например, CVMdl.Trained{1}.CodingMatrix матрица кодирования в первом сгибе перекрестной подтвержденной модели ECOC CVMdl.

Типы данных: double | single | int8 | int16 | int32 | int64

Другие свойства классификации

Это свойство доступно только для чтения.

Категориальные индексы предиктора в виде вектора из положительных целых чисел. CategoricalPredictors содержит значения индекса, указывающие, что соответствующие предикторы являются категориальными. Значения индекса между 1 и p, где p количество предикторов, используемых, чтобы обучить модель. Если ни один из предикторов не является категориальным, то это свойство пусто ([]).

Типы данных: single | double

Это свойство доступно только для чтения.

Уникальные метки класса, используемые в обучении в виде категориального или символьного массива, логического или числового вектора или массива ячеек из символьных векторов. ClassNames имеет совпадающий тип данных, когда наблюдаемый класс помечает свойство Y и определяет порядок класса.

Типы данных: categorical | char | logical | single | double | cell

Это свойство доступно только для чтения.

Misclassification стоит в виде квадратной числовой матрицы. Cost имеет строки и столбцы K, где K является количеством классов.

Cost(i,j) стоимость классификации точки в класс j если его истинным классом является i. Порядок строк и столбцов Cost соответствует порядку классов в ClassNames.

Типы данных: double

Это свойство доступно только для чтения.

Предиктор называет в порядке их внешнего вида в данных о предикторе в виде массива ячеек из символьных векторов. Длина PredictorNames равно количеству столбцов, используемых в качестве переменных предикторов в обучающих данных X или Tbl.

Типы данных: cell

Это свойство доступно только для чтения.

Предшествующие вероятности класса в виде числового вектора. Prior имеет столько же элементов, сколько существуют классы в ClassNames, и порядок элементов соответствует элементам ClassNames.

Типы данных: double

Это свойство доступно только для чтения.

Имя переменной отклика в виде вектора символов.

Типы данных: char

Выиграйте функцию преобразования, чтобы примениться к предсказанным баллам в виде имени функции или указателя на функцию.

Для модели Mdl классификации ядер, и перед преобразованием счета, предсказанной классификационной оценкой для наблюдения x (вектор-строка) f(x)=T(x)β+b.

  • T(·) преобразование наблюдения для расширения функции.

  • β является предполагаемым вектор-столбцом коэффициентов.

  • b является предполагаемым скалярным смещением.

Изменить CVMdl выиграйте функцию преобразования к function, например, используйте запись через точку.

  • Для встроенной функции введите этот код и замените function со значением из таблицы.

    CVMdl.ScoreTransform = 'function';

    ЗначениеОписание
    "doublelogit"1/(1 + e–2x)
    "invlogit"журнал (x / (1 – x))
    "ismax"Устанавливает счет к классу с самым большим счетом к 1 и устанавливает музыку ко всем другим классам к 0
    "logit"1/(1 + ex)
    "none" или "identity"x (никакое преобразование)
    "sign"– 1 для x <0
    0 для x = 0
    1 для x> 0
    "symmetric"2x – 1
    "symmetricismax"Устанавливает счет к классу с самым большим счетом к 1 и устанавливает музыку ко всем другим классам к –1
    "symmetriclogit"2/(1 + ex) – 1

  • Для MATLAB® функционируйте или функция, что вы задаете, вводите ее указатель на функцию.

    CVMdl.ScoreTransform = @function;

    function должен принять матрицу исходной музыки к каждому классу, и затем возвратить матричное представление одного размера преобразованной музыки к каждому классу.

Типы данных: char | function_handle

Функции объекта

kfoldEdgeРебро классификации для перекрестной подтвержденной модели ECOC ядра
kfoldLossПотеря классификации для перекрестной подтвержденной модели ECOC ядра
kfoldMarginПоля классификации для перекрестной подтвержденной модели ECOC ядра
kfoldPredictКлассифицируйте наблюдения на перекрестную подтвержденную модель ECOC ядра

Примеры

свернуть все

Создайте перекрестное подтвержденное, ядро мультикласса модель классификации ECOC использование fitcecoc.

Загрузите ирисовый набор данных Фишера. X содержит цветочные измерения и Y содержит имена цветочных разновидностей.

load fisheriris
X = meas;
Y = species;

Перекрестный подтвердите ядро мультикласса модель классификации ECOC, которая может идентифицировать разновидности цветка на основе измерений цветка.

rng(1); % For reproducibility
CVMdl = fitcecoc(X,Y,'Learners','kernel','CrossVal','on')
CVMdl = 
  ClassificationPartitionedKernelECOC
    CrossValidatedModel: 'KernelECOC'
           ResponseName: 'Y'
        NumObservations: 150
                  KFold: 10
              Partition: [1x1 cvpartition]
             ClassNames: {'setosa'  'versicolor'  'virginica'}
         ScoreTransform: 'none'


  Properties, Methods

CVMdl ClassificationPartitionedKernelECOC перекрестная подтвержденная модель. fitcecoc реализует 10-кратную перекрестную проверку по умолчанию. Поэтому CVMdl.Trained содержит массив ячеек 10 на 1 десяти CompactClassificationECOC модели, один для каждого сгиба. Каждая компактная модель ECOC состоит из бинарных моделей классификации ядер.

Оцените ошибку классификации путем передачи CVMdl к kfoldLoss.

error = kfoldLoss(CVMdl)
error = 0.0333

Предполагаемая ошибка классификации составляет приблизительно 3% неправильно классифицированные наблюдения.

Чтобы изменить опции по умолчанию когда учебные модели ECOC, состоявшие из моделей классификации ядер, создайте шаблон модели классификации ядер с помощью templateKernel, и затем передайте шаблон fitcecoc.

Введенный в R2018b