ClassificationBaggedEnsemble

Пакет: classreg.learning.classif
Суперклассы: ClassificationEnsemble

Классификационный ансамбль, выращенный путем повторной дискретизации

Описание

ClassificationBaggedEnsemble объединяет набор подготовленных моделей слабых учащихся и данных, на которых эти учащиеся были обучены. Он может предсказать ответ ансамбля для новых данных, агрегируя предсказания от своих слабых учащихся.

Конструкция

Создайте упакованный в мешок объект ансамбля классификации с помощью fitcensemble. Установите аргумент пары "имя-значение" 'Method' из fitcensemble на 'Bag' использовать агрегацию bootstrap (пакетирование, например, случайный лес).

Свойства

BinEdges

Границы интервала для числовых предикторов, заданные как массив ячеек из p числовых векторов, где p - количество предикторов. Каждый вектор включает границы интервала для числового предиктора. Элемент в массиве ячеек для категориального предиктора пуст, потому что программное обеспечение не встраивает категориальные предикторы.

Программное обеспечение помещает числовые предикторы только, если вы задаете 'NumBins' аргумент имя-значение как положительный целочисленный скаляр при обучении модели с учениками дерева. The BinEdges свойство пустое, если 'NumBins' значение пустое (по умолчанию).

Можно воспроизвести привязанные данные предиктора Xbinned при помощи BinEdges свойство обученной модели mdl.

X = mdl.X; % Predictor data
Xbinned = zeros(size(X));
edges = mdl.BinEdges;
% Find indices of binned predictors.
idxNumeric = find(~cellfun(@isempty,edges));
if iscolumn(idxNumeric)
    idxNumeric = idxNumeric';
end
for j = idxNumeric 
    x = X(:,j);
    % Convert x to array if x is a table.
    if istable(x) 
        x = table2array(x);
    end
    % Group x into bins by using the discretize function.
    xbinned = discretize(x,[-inf; edges{j}; inf]); 
    Xbinned(:,j) = xbinned;
end
Xbinned содержит индексы интервала в диапазоне от 1 до количества интервалов для числовых предикторов. Xbinned значения 0 для категориальных предикторов. Если X содержит NaNs, затем соответствующее Xbinned значения NaNс.

CategoricalPredictors

Категориальные индексы предиктора, заданные как вектор положительных целых чисел. CategoricalPredictors содержит значения индекса, соответствующие столбцам данных предиктора, которые содержат категориальные предикторы. Если ни один из предикторов не является категориальным, то это свойство пустое ([]).

ClassNames

Список элементов в Y с удаленными дубликатами. ClassNames может быть числовым вектором, категориальным вектором, логическим вектором, символьным массивом или массивом ячеек из векторов символов. ClassNames имеет тот совпадающий тип данных, что и данные в аргументе Y. (Программа обрабатывает массивы строк как массивы ячеек векторов символов.)

CombineWeights

Вектор символов, описывающий как ens сочетает в себе слабые веса учащихся 'WeightedSum' или 'WeightedAverage'.

ExpandedPredictorNames

Расширенные имена предикторов, сохраненные как массив ячеек из векторов символов.

Если модель использует кодировку для категориальных переменных, то ExpandedPredictorNames включает имена, которые описывают расширенные переменные. В противном случае ExpandedPredictorNames то же, что и PredictorNames.

FitInfo

Числовой массив информации о подгонке. The FitInfoDescription свойство описывает содержимое этого массива.

FitInfoDescription

Вектор символов, описывающий смысл FitInfo массив.

FResample

Числовой скаляр между 0 и 1. FResample - доля обучающих данных fitcensemble переизбирается наугад для каждого слабого ученика при построении ансамбля.

HyperparameterOptimizationResults

Описание оптимизации гиперпараметров перекрестной валидации, сохраненное как BayesianOptimization объект или таблица гиперпараметров и связанных значений. Непусто, когда OptimizeHyperparameters Пара "имя-значение" не пуста при создании. Значение зависит от настройки HyperparameterOptimizationOptions Пара "имя-значение" при создании:

  • 'bayesopt' (по умолчанию) - Объект класса BayesianOptimization

  • 'gridsearch' или 'randomsearch' - Таблица используемых гиперпараметров, наблюдаемых значений целевой функции (потери перекрестной валидации) и ранг наблюдений от самого низкого (лучшего) до самого высокого (худшего)

Method

Вектор символов, описывающий метод, который создает ens.

ModelParameters

Параметры, используемые в обучающих ens.

NumTrained

Число подготовленных слабых учащихся в ens, скаляр.

PredictorNames

Массив ячеек из имен для переменных предиктора в том порядке, в котором они появляются X.

ReasonForTermination

Вектор символов, описывающий причину fitcensemble перестал добавлять в ансамбль слабых учеников.

Replace

Логическое значение, указывающее, был ли ансамбль обучен с заменой (true) или без замены (false).

ResponseName

Вектор символов с именем переменной отклика Y.

ScoreTransform

Указатель на функцию для преобразования счетов или вектор символов, представляющий встроенную функцию преобразования. 'none' означает отсутствие преобразования; эквивалентно 'none' означает @(x)x. Список встроенных функций преобразования и синтаксис пользовательских функций преобразования см. в fitctree.

Добавление или изменение ScoreTransform функция, использующая запись через точку:

ens.ScoreTransform = 'function'

или

ens.ScoreTransform = @function

Trained

Обученные учащиеся, массив ячеек из компактных классификационных моделей.

TrainedWeights

Численный вектор обученных весов для слабых учащихся в ens. TrainedWeights имеет T элементы, где T количество слабых учащихся в learners.

UseObsForLearner

Логическая матрица размера N-by- NumTrained, где N количество наблюдений в обучающих данных и NumTrained количество подготовленных слабых учащихся. UseObsForLearner(I,J) является true если наблюдение I использовался для обучения учащихся J, и есть false в противном случае.

W

Масштабированные weights, вектор с длиной n, количество строк в X. Сумма элементов W является 1.

X

Матрица или таблица предикторов значений, которая обучала ансамбль. Каждый столбец X представляет одну переменную, и каждая строка представляет одно наблюдение.

Y

Категориальный массив, массив ячеек из символьных векторов, символьный массив, логический вектор или числовой вектор с одинаковым числом строк как X. Каждая строка Y представляет классификацию соответствующей строки X.

Функции объекта

compactКомпактный классификационный ансамбль
compareHoldoutСравните точности двух классификационных моделей с помощью новых данных
crossvalCross validate ансамбль
edgeКлассификационное ребро
limeЛокальные интерпретируемые модели-агностические объяснения (LIME)
lossОшибка классификации
marginКлассификационные поля
oobEdgeКлассификация вне мешка ребра
oobLossОшибка классификации вне мешка
oobMarginКлассификационные поля вне мешка
oobPermutedPredictorImportanceОценки важности предиктора путем сочетания наблюдений предиктора вне мешка для случайного леса деревьев классификации
oobPredictПредсказание отклика ансамбля вне мешка
partialDependenceВычисление частичной зависимости
plotPartialDependenceСоздайте график частичной зависимости (PDP) и отдельные графики условного ожидания (ICE)
predictКлассифицируйте наблюдения с помощью ансамбля классификационных моделей
predictorImportanceОценки предикторной важности для классификационного ансамбля деревьев решений
removeLearnersУдаление представителей компактного классификационного ансамбля
resubEdgeКлассификационное ребро путем реподституции
resubLossОшибка классификации путем реподституции
resubMarginКлассификационные погрешности путем реподституции
resubPredictКлассификация наблюдений в ансамбле классификационных моделей
resumeВозобновить обучение ансамбля
shapleyЗначения Shapley
testckfoldСравните точности двух классификационных моделей путем повторной перекрестной валидации

Копировать семантику

Значение. Чтобы узнать, как классы значений влияют на операции копирования, см. раздел «Копирование объектов».

Примеры

свернуть все

Загрузите ionosphere набор данных.

load ionosphere

Вы можете обучить упакованный ансамбль из 100 классификационных деревьев с помощью всех измерений.

Mdl = fitcensemble(X,Y,'Method','Bag')

fitcensemble использует древовидный объект шаблона по умолчанию templateTree() как слабый ученик, когда 'Method' является 'Bag'. В этом примере для воспроизводимости задайте 'Reproducible',true когда вы создаете объект шаблона дерева, а затем используете объект как слабого ученика.

rng('default') % For reproducibility
t = templateTree('Reproducible',true); % For reproducibiliy of random predictor selections
Mdl = fitcensemble(X,Y,'Method','Bag','Learners',t)
Mdl = 
  ClassificationBaggedEnsemble
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
          NumObservations: 351
               NumTrained: 100
                   Method: 'Bag'
             LearnerNames: {'Tree'}
     ReasonForTermination: 'Terminated normally after completing the requested number of training cycles.'
                  FitInfo: []
       FitInfoDescription: 'None'
                FResample: 1
                  Replace: 1
         UseObsForLearner: [351x100 logical]


  Properties, Methods

Mdl является ClassificationBaggedEnsemble объект модели.

Mdl.Trained - свойство, которое хранит вектор камеры 100 на 1 обученных деревьев классификации (CompactClassificationTree моделировать объекты), которые составляют ансамбль.

Постройте график первого обученного классификационного дерева.

view(Mdl.Trained{1},'Mode','graph')

Figure Classification tree viewer contains an axes and other objects of type uimenu, uicontrol. The axes contains 60 objects of type line, text.

По умолчанию fitcensemble выращивает глубокие деревья принятия решений для мешанных ансамблей.

Оцените коэффициент неправильной классификации в выборке.

L = resubLoss(Mdl)
L = 0

L равен 0, что указывает на то, что Mdl идеально подходит для классификации обучающих данных.

Совет

Для упакованного ансамбля классификационных деревьев, Trained свойство ens сохраняет вектор камеры ens.NumTrained CompactClassificationTree объекты модели. Для текстового или графического отображения древовидных t в векторе камеры введите

view(ens.Trained{t})

Расширенные возможности

.
Введенный в R2011a