exponenta event banner

ClassificationBaggedEnsemble

Пакет: classreg.learning.classif
Суперклассы: ClassificationEnsemble

Классификационный ансамбль, выращенный методом ресамплинга

Описание

ClassificationBaggedEnsemble объединяет набор обученных моделей слабых учащихся и данных, на которых эти учащиеся были обучены. Он может прогнозировать ансамблевую реакцию для новых данных, агрегируя прогнозы от своих слабых учеников.

Строительство

Создание объекта ансамбля классификации в мешках с помощью fitcensemble. Задать аргумент пары имя-значение 'Method' из fitcensemble кому 'Bag' для использования агрегации загрузочной полосы (пакетирование, например, случайного леса).

Свойства

BinEdges

Ребра ячеек для числовых предикторов, заданные как массив ячеек из p числовых векторов, где p - число предикторов. Каждый вектор включает в себя края ячейки для числового предсказателя. Элемент в массиве ячеек для категориального предиктора пуст, поскольку программное обеспечение не содержит категориальных предикторов.

Программа содержит числовые предикторы только при указании 'NumBins' аргумент «имя-значение» в качестве положительного целого скаляра при обучении модели с учащимися дерева. BinEdges пустое свойство, если 'NumBins' пустое значение (по умолчанию).

Можно воспроизвести привязанные данные предиктора Xbinned с помощью BinEdges свойство обучаемой модели mdl.

X = mdl.X; % Predictor data
Xbinned = zeros(size(X));
edges = mdl.BinEdges;
% Find indices of binned predictors.
idxNumeric = find(~cellfun(@isempty,edges));
if iscolumn(idxNumeric)
    idxNumeric = idxNumeric';
end
for j = idxNumeric 
    x = X(:,j);
    % Convert x to array if x is a table.
    if istable(x) 
        x = table2array(x);
    end
    % Group x into bins by using the discretize function.
    xbinned = discretize(x,[-inf; edges{j}; inf]); 
    Xbinned(:,j) = xbinned;
end
Xbinned содержит индексы ячеек в диапазоне от 1 до числа ячеек для числовых предикторов. Xbinned значения равны 0 для категориальных предикторов. Если X содержит NaNs, затем соответствующее Xbinned значения NaNs.

CategoricalPredictors

Индексы категориального предиктора, указанные как вектор положительных целых чисел. CategoricalPredictors содержит значения индекса, соответствующие столбцам данных предиктора, которые содержат категориальные предикторы. Если ни один из предикторов не категоричен, то это свойство пустое ([]).

ClassNames

Список элементов в Y с удаленными дубликатами. ClassNames может быть числовым вектором, категориальным вектором, логическим вектором, символьным массивом или массивом ячеек символьных векторов. ClassNames имеет тот же тип данных, что и данные в аргументе Y. (Программа рассматривает строковые массивы как массивы ячеек символьных векторов.)

CombineWeights

Символьный вектор, описывающий ens сочетает слабые веса учащихся, либо 'WeightedSum' или 'WeightedAverage'.

ExpandedPredictorNames

Расширенные имена предикторов, хранящиеся в виде клеточного массива символьных векторов.

Если модель использует кодировку для категориальных переменных, то ExpandedPredictorNames содержит имена, описывающие развернутые переменные. В противном случае ExpandedPredictorNames является таким же, как PredictorNames.

FitInfo

Числовой массив информации о соответствии. FitInfoDescription описывает содержимое этого массива.

FitInfoDescription

Вектор символов, описывающий значение FitInfo массив.

FResample

Числовой скаляр между 0 и 1. FResample - доля данных обучения fitcensemble повторная выборка случайным образом для каждого слабого учащегося при построении ансамбля.

HyperparameterOptimizationResults

Описание оптимизации гиперпараметров с перекрестной проверкой, сохраненное как BayesianOptimization объект или таблица гиперпараметров и связанных значений. Непусто, когда OptimizeHyperparameters пара имя-значение не является пустой при создании. Значение зависит от настройки HyperparameterOptimizationOptions пара имя-значение при создании:

  • 'bayesopt' (по умолчанию) - объект класса BayesianOptimization

  • 'gridsearch' или 'randomsearch' - Таблица используемых гиперпараметров, наблюдаемых значений целевой функции (потери перекрестной проверки) и ранга наблюдений от самого низкого (лучший) до самого высокого (худший)

Method

Вектор символов, описывающий создаваемый метод ens.

ModelParameters

Параметры, используемые при обучении ens.

NumTrained

Число обученных слабых учащихся в ens, скаляр.

PredictorNames

Массив ячеек имен для переменных предиктора в порядке их появления в X.

ReasonForTermination

Вектор символов, описывающий причину fitcensemble перестал добавлять в ансамбль слабых учеников.

Replace

Логическое значение, указывающее, прошел ли ансамбль обучение с заменой (true) или без замены (false).

ResponseName

Символьный вектор с именем переменной ответа Y.

ScoreTransform

Дескриптор функции для преобразования баллов или символьного вектора, представляющего встроенную функцию преобразования. 'none' означает отсутствие трансформации; эквивалентно, 'none' средства @(x)x. Список встроенных функций преобразования и синтаксис пользовательских функций преобразования см. в разделе fitctree.

Добавить или изменить ScoreTransform функция, использующая точечную нотацию:

ens.ScoreTransform = 'function'

или

ens.ScoreTransform = @function

Trained

Обученные ученики, клеточный массив компактных моделей классификации.

TrainedWeights

Численный вектор обученных весов для слабых учащихся в ens. TrainedWeights имеет T элементы, где T - число слабых учащихся в learners.

UseObsForLearner

Логическая матрица размера Nоколо-NumTrained, где N - количество наблюдений в данных обучения и NumTrained - число обученных слабых учащихся. UseObsForLearner(I,J) является true если наблюдение I использовался для обучения учащегося J, и является false в противном случае.

W

Чешуйчатый weights, вектор с длиной n, количество строк в X. Сумма элементов W является 1.

X

Матрица или таблица значений предиктора, которые обучали ансамбль. Каждый столбец X представляет одну переменную, а каждая строка представляет одно наблюдение.

Y

Категориальный массив, массив ячеек символьных векторов, символьный массив, логический вектор или числовой вектор с тем же количеством строк, что и X. Каждая строка Y представляет классификацию соответствующей строки X.

Функции объекта

compactКомпактный классификационный ансамбль
compareHoldoutСравнение точности двух классификационных моделей с использованием новых данных
crossvalАнсамбль перекрестной проверки
edgeКрай классификации
limeЛокальные интерпретируемые модели-агностические объяснения (LIME)
lossОшибка классификации
marginПоля классификации
oobEdgeКрай классификации вне мешка
oobLossОшибка классификации вне пакета
oobMarginГраницы классификации вне упаковки
oobPermutedPredictorImportanceОценки важности предиктора путем перестановки наблюдений предиктора вне мешка для случайного леса деревьев классификации
oobPredictПрогнозирование внеплощадочной реакции ансамбля
partialDependenceВычислить частичную зависимость
plotPartialDependenceСоздание графиков частичной зависимости (PDP) и индивидуального условного ожидания (ICE)
predictКлассифицировать наблюдения с использованием совокупности классификационных моделей
predictorImportanceОценки важности предиктора для классификационного ансамбля деревьев решений
removeLearnersУдалить элементы компактного классификационного ансамбля
resubEdgeКрай классификации путем повторной субституции
resubLossОшибка классификации в результате повторного предоставления
resubMarginКлассификационные маржи по возврату
resubPredictКлассифицировать наблюдения в совокупности классификационных моделей
resumeВозобновить учебный ансамбль
shapleyЗначения Шапли
testckfoldСравнение точности двух классификационных моделей с помощью повторной перекрестной проверки

Копирование семантики

Значение. Сведения о том, как классы значений влияют на операции копирования, см. в разделе Копирование объектов.

Примеры

свернуть все

Загрузить ionosphere набор данных.

load ionosphere

С помощью всех измерений можно обучить пакетированный ансамбль из 100 классификационных деревьев.

Mdl = fitcensemble(X,Y,'Method','Bag')

fitcensemble использует объект дерева шаблонов по умолчанию templateTree() как слабый ученик, когда 'Method' является 'Bag'. В этом примере для воспроизводимости укажите 'Reproducible',true при создании объекта шаблона дерева, а затем использовании объекта в качестве слабого ученика.

rng('default') % For reproducibility
t = templateTree('Reproducible',true); % For reproducibiliy of random predictor selections
Mdl = fitcensemble(X,Y,'Method','Bag','Learners',t)
Mdl = 
  ClassificationBaggedEnsemble
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
          NumObservations: 351
               NumTrained: 100
                   Method: 'Bag'
             LearnerNames: {'Tree'}
     ReasonForTermination: 'Terminated normally after completing the requested number of training cycles.'
                  FitInfo: []
       FitInfoDescription: 'None'
                FResample: 1
                  Replace: 1
         UseObsForLearner: [351x100 logical]


  Properties, Methods

Mdl является ClassificationBaggedEnsemble объект модели.

Mdl.Trained является свойством, которое хранит вектор клеток 100 на 1 обученных деревьев классификации (CompactClassificationTree объекты модели), которые составляют ансамбль.

Постройте график первого обученного дерева классификации.

view(Mdl.Trained{1},'Mode','graph')

Figure Classification tree viewer contains an axes and other objects of type uimenu, uicontrol. The axes contains 60 objects of type line, text.

По умолчанию fitcensemble выращивает глубокие деревья принятия решений для фасованных ансамблей.

Оцените коэффициент неправильной классификации в выборке.

L = resubLoss(Mdl)
L = 0

L равно 0, что означает, что Mdl идеально подходит для классификации данных обучения.

Совет

Для фасованного ансамбля классификационных деревьев, Trained имущество ens сохраняет вектор ячейки ens.NumTrained CompactClassificationTree объекты модели. Для текстового или графического отображения дерева t в векторе ячейки введите

view(ens.Trained{t})

Расширенные возможности

.
Представлен в R2011a