Документация

label = kfoldPredict(CVMdl) возвращает метки классов, предсказанные перекрестно проверенной моделью ECOC (ClassificationPartitionedECOC) CVMdl. Для каждого раза, kfoldPredict предсказывает метки классов для наблюдений, которые он проводит во время обучения. CVMdl.X содержит оба набора наблюдений.

Программное обеспечение предсказывает классификацию наблюдения, присваивая наблюдение классу, давая наибольшую отрицаемую среднюю двоичную потерю (или, что эквивалентно, наименьшую среднюю двоичную потерю).

label = kfoldPredict(CVMdl,Name,Value) возвращает прогнозируемые метки класса с дополнительными параметрами, заданными одним или несколькими аргументами пары имя-значение. Например, укажите метод оценки апостериорной вероятности, схему декодирования или уровень детализации.

[label,NegLoss,PBScore] = kfoldPredict(___) дополнительно возвращает отрицательные значения средних двоичных потерь на класс (NegLoss) для кратных по валидации наблюдений и положительных оценок класса (PBScore) для кратных по валидации наблюдений, классифицированных каждым двоичным учеником, с использованием любой из комбинаций входных аргументов в предыдущих синтаксисах.

Если матрица кодирования изменяется по складкам (то есть схема кодирования sparserandom или denserandom), то PBScore пуст ([]).

[label,NegLoss,PBScore,Posterior] = kfoldPredict(___) дополнительно возвращает оценки вероятности апостериорного класса для проверочных наблюдений (Posterior).

Для получения вероятности заднего класса необходимо установить 'FitPosterior',1 при обучении перекрестно проверенной модели ECOC с использованием fitcecoc. В противном случае kfoldPredict выдает ошибку.

Примеры

Прогнозирование меток перекрестной проверки k-Fold

Загрузите набор данных радужки Фишера. Укажите данные предиктора X, данные ответа Yи порядок классов в Y.

load fisheriris
X = meas;
Y = categorical(species);
classOrder = unique(Y);
rng(1); % For reproducibility

Подготовка и перекрестная проверка модели ECOC с использованием двоичных классификаторов вспомогательных векторных машин (SVM). Стандартизируйте данные предиктора с помощью шаблона SVM и укажите порядок классов.

t = templateSVM('Standardize',1);
CVMdl = fitcecoc(X,Y,'CrossVal','on','Learners',t,'ClassNames',classOrder);

CVMdl является ClassificationPartitionedECOC модель. По умолчанию программное обеспечение реализует 10-кратную перекрестную проверку. Можно указать другое количество сгибов с помощью 'KFold' аргумент пары имя-значение.

Прогнозирование кратных меток проверки. Печать случайного подмножества истинных и прогнозируемых меток.

labels = kfoldPredict(CVMdl);
idx = randsample(numel(labels),10);
table(Y(idx),labels(idx),...
    'VariableNames',{'TrueLabels','PredictedLabels'})

ans=10×2 table
    TrueLabels    PredictedLabels
    __________    _______________

    setosa          setosa       
    versicolor      versicolor   
    setosa          setosa       
    virginica       virginica    
    versicolor      versicolor   
    setosa          setosa       
    virginica       virginica    
    virginica       virginica    
    setosa          setosa       
    setosa          setosa

CVMdl правильно помечает кратные проверке наблюдения индексами idx.

Прогнозирование меток перекрестной проверки с использованием пользовательской двоичной функции потери

Загрузите набор данных радужки Фишера. Укажите данные предиктора X, данные ответа Yи порядок классов в Y.

load fisheriris
X = meas;
Y = categorical(species);
classOrder = unique(Y); % Class order
K = numel(classOrder);  % Number of classes
rng(1); % For reproducibility

Подготовка и перекрестная проверка модели ECOC с использованием двоичных классификаторов SVM. Стандартизируйте данные предиктора с помощью шаблона SVM и укажите порядок классов.

t = templateSVM('Standardize',1);
CVMdl = fitcecoc(X,Y,'CrossVal','on','Learners',t,'ClassNames',classOrder);

Оценки SVM подписаны расстояниями от наблюдения до границы принятия решения. Поэтому доменом является $(- \infty,\infty$ ). Создайте пользовательскую двоичную функцию потери, которая:

Сопоставляет матрицу дизайна кодирования (M) и оценки классификации положительного класса для каждого учащегося с двоичными потерями для каждого наблюдения
Использует линейные потери
Агрегирует двоичные потери учащихся с помощью медианы

Можно создать отдельную функцию для двоичной функции потери, а затем сохранить ее на пути MATLAB ®. Можно также указать анонимную двоичную функцию потери. В этом случае создайте дескриптор функции (customBL) к анонимной двоичной функции потери.

customBL = @(M,s)nanmedian(1 - bsxfun(@times,M,s),2)/2;

Спрогнозировать метки перекрестной проверки и оценить медианные двоичные потери на класс. Распечатайте средние отрицательные двоичные потери на класс для случайного набора из 10 проверочных наблюдений.

[label,NegLoss] = kfoldPredict(CVMdl,'BinaryLoss',customBL);

idx = randsample(numel(label),10);
classOrder

classOrder = 3x1 categorical
     setosa 
     versicolor 
     virginica

table(Y(idx),label(idx),NegLoss(idx,:),'VariableNames',...
    {'TrueLabel','PredictedLabel','NegLoss'})

ans=10×3 table
    TrueLabel     PredictedLabel                 NegLoss             
    __________    ______________    _________________________________

    setosa          versicolor      0.37148       2.1294      -4.0009
    versicolor      versicolor      -1.2167      0.36689     -0.65018
    setosa          versicolor      0.23923        2.079      -3.8182
    virginica       virginica       -1.9151     -0.19954      0.61467
    versicolor      versicolor      -1.3746      0.45537     -0.58077
    setosa          versicolor      0.20061       2.2774       -3.978
    virginica       versicolor      -1.4921     0.090197    -0.098125
    virginica       virginica       -1.7668     -0.13465      0.40146
    setosa          versicolor      0.20005       1.9113      -3.6113
    setosa          versicolor      0.16105       1.9684      -3.6295

Порядок столбцов соответствует элементам classOrder. Программное обеспечение прогнозирует метку на основе максимальной отрицательной потери. Результаты показывают, что медиана линейных потерь может работать не так хорошо, как другие потери.

Оценить апостериорные вероятности перекрестной проверки

Загрузите набор данных радужки Фишера. Использовать размеры лепестков в качестве данных предиктора X. Укажите данные ответа Y и порядок классов в Y.

load fisheriris
X = meas(:,3:4);
Y = categorical(species);
classOrder = unique(Y);
rng(1); % For reproducibility

Создайте шаблон SVM. Стандартизируйте предикторы и укажите гауссово ядро.

t = templateSVM('Standardize',1,'KernelFunction','gaussian');

t является шаблоном SVM. Большинство его свойств пусты. При обучении классификатору ECOC программное обеспечение устанавливает соответствующие свойства для их значений по умолчанию.

Подготовка и перекрестная проверка классификатора ECOC с использованием шаблона SVM. Преобразовать оценки классификации в апостериорные вероятности класса (возвращаемые kfoldPredict) с использованием 'FitPosterior' аргумент пары имя-значение. Укажите порядок классов.

CVMdl = fitcecoc(X,Y,'Learners',t,'CrossVal','on','FitPosterior',true,...
    'ClassNames',classOrder);

CVMdl является ClassificationPartitionedECOC модель. По умолчанию программа использует десятикратную перекрестную проверку.

Предсказать апостериорные вероятности класса, кратные валидации. Используйте 10 случайных начальных значений для алгоритма Куллбэка-Лейблера.

[label,~,~,Posterior] = kfoldPredict(CVMdl,'NumKLInitializations',10);

Программное обеспечение назначает наблюдение классу, которое дает наименьшие средние двоичные потери. Поскольку все двоичные ученики вычисляют апостериорные вероятности, функция двоичных потерь quadratic.

Отображение случайного набора результатов.

idx = randsample(size(X,1),10);
CVMdl.ClassNames

ans = 3x1 categorical
     setosa 
     versicolor 
     virginica

table(Y(idx),label(idx),Posterior(idx,:),...
    'VariableNames',{'TrueLabel','PredLabel','Posterior'})

ans=10×3 table
    TrueLabel     PredLabel                   Posterior               
    __________    __________    ______________________________________

    versicolor    versicolor       0.00864       0.98243     0.0089298
    versicolor    virginica     2.2197e-14       0.12447       0.87553
    setosa        setosa             0.999    0.00022836    0.00076885
    versicolor    versicolor    2.2194e-14       0.98915      0.010848
    virginica     virginica       0.012318      0.012925       0.97476
    virginica     virginica      0.0015573     0.0015639       0.99688
    virginica     virginica      0.0042896     0.0043557       0.99135
    setosa        setosa             0.999    0.00028329    0.00071382
    virginica     virginica      0.0094654     0.0098159       0.98072
    setosa        setosa             0.999    0.00013559    0.00086195

Столбцы Posterior соответствуют порядку классов CVMdl.ClassNames.

Оценка апостериорных вероятностей перекрестной проверки с использованием параллельных вычислений

В этом примере используются:

Обучите многоклассную модель ECOC и оцените апостериорные вероятности с помощью параллельных вычислений.

Загрузить arrhythmia набор данных. Анализ данных ответа Y.

load arrhythmia
Y = categorical(Y);
tabulate(Y)

  Value    Count   Percent
      1      245     54.20%
      2       44      9.73%
      3       15      3.32%
      4       15      3.32%
      5       13      2.88%
      6       25      5.53%
      7        3      0.66%
      8        2      0.44%
      9        9      1.99%
     10       50     11.06%
     14        4      0.88%
     15        5      1.11%
     16       22      4.87%

n = numel(Y);
K = numel(unique(Y));

Несколько классов не представлены в данных, и многие другие классы имеют низкие относительные частоты.

Укажите шаблон обучения ансамбля, использующий метод GentleBoost и 50 слабых учеников дерева классификации.

t = templateEnsemble('GentleBoost',50,'Tree');

t является объектом шаблона. Большинство вариантов пусты ([]). Программа использует значения по умолчанию для всех пустых параметров во время обучения.

Поскольку переменная ответа содержит много классов, укажите схему разреженного произвольного кодирования.

rng(1); % For reproducibility
Coding = designecoc(K,'sparserandom');

Обучение и перекрестная проверка модели ECOC с использованием параллельных вычислений. Посадка задних вероятностей (возвращается kfoldPredict).

pool = parpool;                      % Invokes workers

Starting parallel pool (parpool) using the 'local' profile ...
connected to 6 workers.

options = statset('UseParallel',1);
CVMdl = fitcecoc(X,Y,'Learner',t,'Options',options,'Coding',Coding,...
    'FitPosterior',1,'CrossVal','on');

Warning: One or more folds do not contain points from all the groups.

Пул вызывает шесть работников, хотя число работников может различаться в разных системах. Поскольку некоторые классы имеют низкую относительную частоту, один или несколько складок, скорее всего, не содержат наблюдений из всех классов.

Оцените апостериорные вероятности и отобразите апостериорную вероятность быть классифицированным как не имеющий аритмии (класс 1), учитывая данные для случайного набора проверочных наблюдений.

[~,~,~,posterior] = kfoldPredict(CVMdl,'Options',options);
idx = randsample(n,10);
table(idx,Y(idx),posterior(idx,1),...
    'VariableNames',{'OOFSampleIndex','TrueLabel','PosteriorNoArrhythmia'})

ans=10×3 table
    OOFSampleIndex    TrueLabel    PosteriorNoArrhythmia
    ______________    _________    _____________________

         171             1                0.33654       
         221             1                0.85135       
          72             16                0.9174       
           3             10              0.025649       
         202             1                 0.8438       
         243             1                 0.9435       
          18             1                0.81198       
          49             6               0.090154       
         234             1                0.61625       
         315             1                0.97187

Входные аргументы

`CVMdl` - Перекрестная проверка модели ECOC
`ClassificationPartitionedECOC` модель

Модель ECOC с перекрестной проверкой, указанная как ClassificationPartitionedECOC модель. Можно создать ClassificationPartitionedECOC модель двумя способами:

Пройти обученную модель ECOC (ClassificationECOCКому crossval.
Обучение модели ECOC с помощью fitcecoc и укажите любой из этих аргументов пары имя-значение перекрестной проверки: 'CrossVal', 'CVPartition', 'Holdout', 'KFold', или 'Leaveout'.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

Пример: kfoldPredict(CVMdl,'PosteriorMethod','qp') определяет оценку мультиклассовых апостериорных вероятностей путем решения задачи наименьших квадратов с помощью квадратичного программирования.

`'BinaryLoss'` - Двоичная функция потери ученика
`'hamming'` | `'linear'` | `'logit'` | `'exponential'` | `'binodeviance'` | `'hinge'` | `'quadratic'` | дескриптор функции

Двоичная функция потери ученика, заданная как разделенная запятыми пара, состоящая из 'BinaryLoss' и встроенное имя или дескриптор функции потери.

В этой таблице описываются встроенные функции, где _yj - метка класса для конкретного двоичного ученика (в наборе {-1,1,0}), _sj - оценка для наблюдения j, а g (_yj, sj) - формула двоичных потерь.

Стоимость	Описание	Домен оценки	g (_yj, sj)
`'binodeviance'`	Биномиальное отклонение	(–∞,∞)	журнал [1 + exp (-_2yjsj) ]/[ 2log (2)]
`'exponential'`	Показательный	(–∞,∞)	exp (-_yjsj )/2
`'hamming'`	Хэмминг	[0,1] или (- ∞,∞)	[1 - знак (_yjsj) ]/2
`'hinge'`	Стержень	(–∞,∞)	max (0,1 - _yjsj )/2
`'linear'`	Линейный	(–∞,∞)	(1 - _yjsj )/2
`'logit'`	Логистический	(–∞,∞)	log [1 + exp (_-_yjsj) ]/[ 2log (2)]
`'quadratic'`	Квадратный	[0,1]	[1-yj (_2sj-1)] 2/2

Программное обеспечение нормализует двоичные потери так, чтобы потери были 0,5, когда _yj = 0. Кроме того, программное обеспечение вычисляет средние двоичные потери для каждого класса.

Например, для пользовательской двоичной функции потери customFunction, укажите его функциональный дескриптор 'BinaryLoss',@customFunction.
customFunction имеет следующую форму:
```
bLoss = customFunction(M,s)
```
где:
- M - матрица кодирования K-by-L, сохраненная в Mdl.CodingMatrix.
- s - вектор 1-by-L строк классификационных баллов.
- bLoss - потеря классификации. Этот скаляр агрегирует двоичные потери для каждого учащегося в конкретном классе. Например, можно использовать среднюю двоичную потерю для суммирования потерь по учащимся для каждого класса.
- K - количество классов.
- L - количество двоичных учеников.
Пример передачи пользовательской двоичной функции потери см. в разделе Прогнозирование меток тестовой выборки модели ECOC с использованием пользовательской двоичной функции потери.

Дефолт BinaryLoss значение зависит от диапазонов баллов, возвращаемых двоичными учениками. В этой таблице описаны некоторые значения по умолчанию BinaryLoss значения, основанные на данных допущениях.

Предположение	Значение по умолчанию
Все двоичные ученики являются SVM или линейными или классификационными моделями SVM.	`'hinge'`
Все бинарные учащиеся являются ансамблями, обученными `AdaboostM1` или `GentleBoost`.	`'exponential'`
Все бинарные учащиеся являются ансамблями, обученными `LogitBoost`.	`'binodeviance'`
Все двоичные ученики являются линейными или классификационными моделями ядра учащихся логистической регрессии. Или вы указываете, чтобы предсказать апостериорные вероятности класса путем установки `'FitPosterior',true` в `fitcecoc`.	`'quadratic'`

Чтобы проверить значение по умолчанию, используйте точечную нотацию для отображения BinaryLoss свойство обучаемой модели в командной строке.

Пример: 'BinaryLoss','binodeviance'

Типы данных: char | string | function_handle

`'Decoding'` - Схема декодирования
`'lossweighted'` (по умолчанию) | `'lossbased'`

Схема декодирования, которая агрегирует двоичные потери, заданная как разделенная запятыми пара, состоящая из 'Decoding' и 'lossweighted' или 'lossbased'. Дополнительные сведения см. в разделе Потери двоичного кода.

Пример: 'Decoding','lossbased'

`'NumKLInitializations'` - Количество случайных начальных значений
`0` (по умолчанию) | неотрицательный целочисленный скаляр

Число случайных начальных значений для аппроксимации задних вероятностей минимизацией расходимости Куллбэка-Лейблера, определяемых как пара, разделенная запятыми, состоящая из 'NumKLInitializations' и неотрицательный целочисленный скаляр.

Если не запросить четвертый выходной аргумент (Posterior) и установить 'PosteriorMethod','kl' (по умолчанию), то программное обеспечение игнорирует значение NumKLInitializations.

Дополнительные сведения см. в разделе Апостериорная оценка с использованием дивергенции Kullback-Leibler.

Пример: 'NumKLInitializations',5

Типы данных: single | double

`'Options'` - Варианты оценки
`[]` (по умолчанию) | массив структуры, возвращенный `statset`

Опции оценки, указанные как пара, разделенная запятыми, состоящая из 'Options' и массив структуры, возвращенный statset.

Для вызова параллельных вычислений:

Вам нужна лицензия Parallel Computing Toolbox™.
Определить 'Options',statset('UseParallel',true).

`'PosteriorMethod'` - Метод оценки апостериорной вероятности
`'kl'` (по умолчанию) | `'qp'`

Метод оценки апостериорной вероятности, определяемый как разделенная запятыми пара, состоящая из 'PosteriorMethod' и 'kl' или 'qp'.

Если PosteriorMethod является 'kl'затем программное обеспечение оценивает мультиклассовые апостериорные вероятности путем минимизации расхождения Куллбэка-Лейблера между предсказанной и ожидаемой апостериорной вероятностями, возвращаемыми двоичными учениками. Дополнительные сведения см. в разделе Задняя оценка с использованием дивергенции Kullback-Leibler.
Если PosteriorMethod является 'qp', то программное обеспечение оценивает мультиклассовые апостериорные вероятности, решая задачу наименьших квадратов с помощью квадратичного программирования. Для использования этого параметра необходима лицензия Optimization Toolbox™. Дополнительные сведения см. в разделе Апостериорная оценка с использованием квадратичного программирования.
Если не запросить четвертый выходной аргумент (Posterior), то программное обеспечение игнорирует значение PosteriorMethod.

Пример: 'PosteriorMethod','qp'

`'Verbose'` - Уровень детализации
`0` (по умолчанию) | `1`

Уровень детализации, указанный как разделенная запятыми пара, состоящая из 'Verbose' и 0 или 1. Verbose управляет количеством диагностических сообщений, отображаемых программой в окне команд.

Если Verbose является 0, то программное обеспечение не отображает диагностические сообщения. В противном случае программа отображает диагностические сообщения.

Пример: 'Verbose',1

Типы данных: single | double

Выходные аргументы

`label` - Прогнозируемые метки классов
категориальный массив | символьный массив | логический вектор | числовой вектор | клеточный массив символьных векторов

Прогнозируемые метки класса, возвращаемые в виде категориального или символьного массива, логического или числового вектора или массива ячеек символьных векторов.

label имеет тот же тип данных и количество строк, что и CVMdl.Y.

`NegLoss` - Сведенные на нет средние двоичные потери
числовая матрица

Сведенные на нет средние двоичные потери, возвращаемые в виде числовой матрицы. NegLoss - матрица n-by-K, где n - число наблюдений (size(CVMdl.X,1)) и K - количество уникальных классов (size(CVMdl.ClassNames,1)).

`PBScore` - Положительные оценки класса
числовая матрица

Положительные оценки для каждого двоичного ученика, возвращаемые в виде числовой матрицы. PBScore - матрица n-by-L, где n - количество наблюдений (size(CVMdl.X,1)) и L - количество двоичных учеников (size(CVMdl.CodingMatrix,2)).

`Posterior` - Вероятности заднего класса
числовая матрица

Апостериорные вероятности классов, возвращаемые в виде числовой матрицы. Posterior - матрица n-by-K, где n - число наблюдений (size(CVMdl.X,1)) и K - количество уникальных классов (size(CVMdl.ClassNames,1)).

Необходимо установить 'FitPosterior',1 при обучении перекрестно проверенной модели ECOC с использованием fitcecoc для запроса Posterior. В противном случае программа выдает ошибку.

Подробнее

Двоичные потери

Двоичная потеря - это функция класса и оценки классификации, которая определяет, насколько хорошо двоичный ученик классифицирует наблюдение в классе.

Предположим, что:

_mkj - элемент (k, j) матрицы M дизайна кодирования (то есть код, соответствующий классу k двоичного учащегося j).
_sj - оценка двоичного ученика j для наблюдения.
g - функция двоичных потерь.
$\overset{}{k}$ ^ - прогнозируемый класс для наблюдения.

При декодировании на основе потерь [Escalera et al.] класс, производящий минимальную сумму двоичных потерь над двоичными учениками, определяет прогнозируемый класс наблюдения, то есть

$\overset{}{} \underset{}{}_{}^{}_{} k^=argmink∑j=1L'mkj'g (_{} mkj,_{} sj$ ).

При декодировании со взвешенными потерями [Escalera et al.] класс, производящий минимальное среднее двоичных потерь по двоичным ученикам, определяет прогнозируемый класс наблюдения, то есть

$\overset{}{} \underset{}{} \frac{_{}^{}_{} k^=argmink∑j=1L'mkj'g (_{} mkj,_{}}{{sj}_{)}^{}_{}}$ ∑j=1L'mkj|.

Allwein et al. предполагают, что взвешенное по потерям декодирование улучшает точность классификации, сохраняя значения потерь для всех классов в одном динамическом диапазоне.

Эта таблица суммирует поддерживаемые функции потерь, где _yj - метка класса для конкретного двоичного ученика (в наборе {-1,1,0}), _sj - оценка для наблюдения j, и g (_yj, sj).

Стоимость	Описание	Домен оценки	g (_yj, sj)
`'binodeviance'`	Биномиальное отклонение	(–∞,∞)	журнал [1 + exp (-_2yjsj) ]/[ 2log (2)]
`'exponential'`	Показательный	(–∞,∞)	exp (-_yjsj )/2
`'hamming'`	Хэмминг	[0,1] или (- ∞,∞)	[1 - знак (_yjsj) ]/2
`'hinge'`	Стержень	(–∞,∞)	max (0,1 - _yjsj )/2
`'linear'`	Линейный	(–∞,∞)	(1 - _yjsj )/2
`'logit'`	Логистический	(–∞,∞)	log [1 + exp (_-_yjsj) ]/[ 2log (2)]
`'quadratic'`	Квадратный	[0,1]	[1-yj (_2sj-1)] 2/2

Программное обеспечение нормализует двоичные потери так, что потери составляют 0,5, когда _yj = 0, и агрегирует, используя среднее значение двоичных учеников [Allwein et al.].

Не путайте бинарную потерю с общей классификационной потерей (указанной 'LossFun' аргумент пары имя-значение loss и predict объектные функции), который измеряет, насколько хорошо классификатор ECOC работает в целом.

Алгоритмы