RegressionEnsemble

Пакет: classreg.learning.regr
Суперклассы: CompactRegressionEnsemble

Регрессия ансамбля

Описание

RegressionEnsemble комбинирует набор обученных слабых моделей ученика и данных, на которых были обучены эти ученики. Это может предсказать ответ ансамбля для новых данных путем агрегации прогнозов от его слабых учеников.

Конструкция

Создайте объект ансамбля регрессии использование fitrensemble.

Свойства

BinEdges

Ребра интервала для числовых предикторов, заданных как массив ячеек p числовые векторы, где p является количеством предикторов. Каждый вектор включает ребра интервала для числового предиктора. Элемент в массиве ячеек для категориального предиктора пуст, потому что программное обеспечение не делает интервала категориальные предикторы.

Числовые предикторы интервалов программного обеспечения, только если вы задаете аргумент пары "имя-значение" 'NumBins' как положительный целочисленный скаляр когда обучение модель с древовидными учениками. Свойство BinEdges пусто, если значение 'NumBins' пусто (значение по умолчанию).

Можно воспроизвести сгруппированные данные о предикторе Xbinned при помощи свойства BinEdges обученной модели mdl.

X = mdl.X; % Predictor data
Xbinned = zeros(size(X));
edges = mdl.BinEdges;
% Find indices of binned predictors.
idxNumeric = find(~cellfun(@isempty,edges));
if iscolumn(idxNumeric)
    idxNumeric = idxNumeric';
end
for j = idxNumeric 
    x = X(:,j);
    % Convert x to array if x is a table.
    if istable(x) 
        x = table2array(x);
    end
    % Group x into bins by using the discretize function.
    xbinned = discretize(x,[-inf; edges{j}; inf]); 
    Xbinned(:,j) = xbinned;
end
Xbinned содержит индексы интервала, в пределах от 1 к количеству интервалов, для числовых предикторов. значения Xbinned 0 для категориальных предикторов. Если X содержит NaN s, то соответствующими значениями Xbinned является NaN s.

CategoricalPredictors

Категориальные индексы предиктора, заданные как вектор положительных целых чисел. CategoricalPredictors содержит индексные значения, соответствующие столбцам данных о предикторе, которые содержат категориальные предикторы. Если ни один из предикторов не является категориальным, то это свойство пусто ([]).

CombineWeights

Вектор символов, описывающий, как ансамбль комбинирует прогнозы ученика.

ExpandedPredictorNames

Расширенные имена предиктора, сохраненные как массив ячеек из символьных векторов.

Если образцовое кодирование использования для категориальных переменных, то ExpandedPredictorNames включает имена, которые описывают расширенные переменные. В противном случае ExpandedPredictorNames совпадает с PredictorNames.

FitInfo

Числовой массив подходящей информации. Свойство FitInfoDescription описывает содержимое этого массива.

FitInfoDescription

Вектор символов, описывающий значение массива FitInfo.

LearnerNames

Массив ячеек из символьных векторов с именами слабых учеников в ансамбле. Имя каждого ученика появляется только однажды. Например, если у вас есть ансамбль 100 деревьев, LearnerNames является {'Tree'}.

HyperparameterOptimizationResults

Описание оптимизации перекрестной проверки гиперпараметров, сохраненных как объект BayesianOptimization или таблица гиперпараметров и присваиваемых значений. Непустой, когда пара "имя-значение" OptimizeHyperparameters непуста при создании. Значение зависит от установки пары "имя-значение" HyperparameterOptimizationOptions при создании:

  • 'bayesopt' (значение по умолчанию) — Объект класса BayesianOptimization

  • 'gridsearch' или 'randomsearch' — Таблица гиперпараметров используемые, наблюдаемые значения целевой функции (потеря перекрестной проверки), и ранг наблюдений от самого низкого (лучше всего) к (худшему) самому высокому

Method

Вектор символов с именем алгоритма fitrensemble использовал для обучения ансамбль.

ModelParameters

Параметры используются в учебном ens.

NumObservations

Числовой скаляр, содержащий количество наблюдений в данных тренировки.

NumTrained

Количество обученных учеников в ансамбле, положительной скалярной величине.

PredictorNames

Массив ячеек имен для переменных прогноза, в порядке, в котором они появляются в X.

ReasonForTermination

Вектор символов, описывающий причину fitrensemble, прекратил добавлять слабых учеников в ансамбль.

Regularization

Структура, содержащая результат метода regularize. Используйте Regularization с shrink, чтобы понизить ошибку перезамены и уменьшить ансамбль.

ResponseName

Вектор символов с именем переменной отклика Y.

ResponseTransform

Указатель на функцию для преобразования очков или вектора символов, представляющего встроенную функцию преобразования. 'none' не означает преобразования; эквивалентно, 'none' означает @(x)x.

Добавьте или измените функцию ResponseTransform, использующую запись через точку:

ens.ResponseTransform = @function

Trained

Обученные ученики, массив ячеек компактных моделей регрессии.

TrainedWeights

Числовой вектор весов ансамбль присваивает своим ученикам. Ансамбль вычисляет предсказанный ответ путем агрегации взвешенных прогнозов от его учеников.

W

Масштабированный weights, вектор с длиной n, количество строк в X. Суммой элементов W является 1.

X

Матрица или таблица значений предиктора, которые обучили ансамбль. Каждый столбец X представляет одну переменную, и каждая строка представляет одно наблюдение.

Y

Числовой вектор-столбец с одинаковым числом строк как X, который обучил ансамбль. Каждая запись в Y является ответом на данные в соответствующей строке X.

Методы

компактныйСоздайте компактный ансамбль регрессии
crossvalКрест подтверждает ансамбль
cvshrinkКрест подтверждает уменьшение (сокращение) ансамбль
упорядочитьНайдите, что веса минимизируют ошибку перезамены плюс термин штрафа
resubLossОшибка регрессии перезаменой
resubPredictПредскажите ответ ансамбля перезаменой
резюмеВозобновите учебный ансамбль
уменьшениеСократите ансамбль

Унаследованные методы

потеряОшибка регрессии
предсказатьПредскажите ансамбль использования ответов моделей регрессии
predictorImportanceОценки важности предиктора
removeLearnersУдалите членов компактного ансамбля регрессии

Копировать семантику

Значение. Чтобы изучить, как классы значения влияют на операции копии, смотрите Копирование Объектов (MATLAB).

Примеры

свернуть все

Загрузите набор данных carsmall. Рассмотрите модель, которая объясняет экономию топлива автомобиля (MPG) с помощью его веса (Weight) и количество цилиндров (Cylinders).

load carsmall
X = [Weight Cylinders];
Y = MPG;

Обучите повышенный ансамбль 100 деревьев регрессии с помощью метода LSBoost. Укажите, что Cylinders является категориальной переменной.

Mdl = fitrensemble(X,Y,'Method','LSBoost',...
    'PredictorNames',{'W','C'},'CategoricalPredictors',2)
Mdl = 
  classreg.learning.regr.RegressionEnsemble
           PredictorNames: {'W'  'C'}
             ResponseName: 'Y'
    CategoricalPredictors: 2
        ResponseTransform: 'none'
          NumObservations: 94
               NumTrained: 100
                   Method: 'LSBoost'
             LearnerNames: {'Tree'}
     ReasonForTermination: 'Terminated normally after completing the requested number of training cycles.'
                  FitInfo: [100x1 double]
       FitInfoDescription: {2x1 cell}
           Regularization: []


  Properties, Methods

Mdl является объектом модели RegressionEnsemble, который содержит данные тренировки, среди прочего.

Mdl.Trained является свойством, которое хранит 100 1 вектор ячейки обученных деревьев регрессии (объекты модели CompactRegressionTree), которые составляют ансамбль.

Постройте график первого обученного дерева регрессии.

view(Mdl.Trained{1},'Mode','graph')

По умолчанию fitrensemble выращивает мелкие деревья для повышенных ансамблей деревьев.

Предскажите экономию топлива автомобилей за 4 000 фунтов с 4, 6, и 8 цилиндров.

XNew = [4000*ones(3,1) [4; 6; 8]];
mpgNew = predict(Mdl,XNew)
mpgNew = 3×1

   19.5926
   18.6388
   15.4810

Советы

Для ансамбля деревьев регрессии свойство Trained содержит вектор ячейки ens.NumTrained объекты модели CompactRegressionTree. Для текстового или графического дисплея древовидного t в векторе ячейки войти

view(ens.Trained{t})

Расширенные возможности

Введенный в R2011a

Для просмотра документации необходимо авторизоваться на сайте