exponenta event banner

CompactClassificationEnsemble

Пакет: classreg.learning.classif

Класс ансамбля компактной классификации

Описание

Компактный вариант классификационного ансамбля (класса ClassificationEnsemble). Компактная версия не включает данные для обучения классификационного ансамбля. Поэтому нельзя выполнять некоторые задачи с компактным ансамблем классификации, например, перекрестную проверку. Используйте компактный классификационный ансамбль для составления прогнозов (классификаций) новых данных.

Строительство

ens = compact(fullEns) конструирует ансамбль компактного решения из ансамбля полного решения.

Входные аргументы

fullEns

Классификационный ансамбль, созданный fitcensemble.

Свойства

CategoricalPredictors

Индексы категориального предиктора, указанные как вектор положительных целых чисел. CategoricalPredictors содержит значения индекса, соответствующие столбцам данных предиктора, которые содержат категориальные предикторы. Если ни один из предикторов не категоричен, то это свойство пустое ([]).

ClassNames

Список элементов в Y с удаленными дубликатами. ClassNames может быть числовым вектором, вектором категориальных переменных, логическим вектором, символьным массивом или массивом ячеек символьных векторов. ClassNames имеет тот же тип данных, что и данные в аргументе Y. (Программа рассматривает строковые массивы как массивы ячеек символьных векторов.)

CombineWeights

Символьный вектор, описывающий ens сочетает слабые веса учащихся, либо 'WeightedSum' или 'WeightedAverage'.

Cost

Квадратная матрица, где Cost(i,j) - стоимость классификации точки по классу j если его истинный класс i (строки соответствуют истинному классу, а столбцы соответствуют прогнозируемому классу). Порядок строк и столбцов Cost соответствует порядку классов в ClassNames. Количество строк и столбцов в Cost - количество уникальных классов в ответе. Это свойство доступно только для чтения.

ExpandedPredictorNames

Расширенные имена предикторов, хранящиеся в виде клеточного массива символьных векторов.

Если модель использует кодировку для категориальных переменных, то ExpandedPredictorNames содержит имена, описывающие развернутые переменные. В противном случае ExpandedPredictorNames является таким же, как PredictorNames.

NumTrained

Число обученных слабых учащихся в ens, скаляр.

PredictorNames

Массив ячеек имен для переменных предиктора в порядке их появления в X.

Prior

Числовой вектор предшествующих вероятностей для каждого класса. Порядок элементов Prior соответствует порядку классов в ClassNames. Количество элементов Prior - количество уникальных классов в ответе. Это свойство доступно только для чтения.

ResponseName

Символьный вектор с именем переменной ответа Y.

ScoreTransform

Дескриптор функции для преобразования баллов или символьного вектора, представляющего встроенную функцию преобразования. 'none' означает отсутствие трансформации; эквивалентно, 'none' средства @(x)x. Список встроенных функций преобразования и синтаксис пользовательских функций преобразования см. в разделе fitctree.

Добавить или изменить ScoreTransform функция, использующая точечную нотацию:

ens.ScoreTransform = 'function'

или

ens.ScoreTransform = @function

Trained

Клеточный вектор обученных моделей классификации.

  • Если Method является 'LogitBoost' или 'GentleBoost', то CompactClassificationEnsemble магазины обученный ученик j в CompactRegressionLearner свойство объекта, сохраненного в Trained{j}. То есть получить доступ к обучаемому j, использовать ens.Trained{j}.CompactRegressionLearner.

  • В противном случае клетки клеточного вектора содержат соответствующие компактные модели классификации.

TrainedWeights

Численный вектор обученных весов для слабых учащихся в ens. TrainedWeights имеет T элементы, где T - число слабых учащихся в learners.

UsePredForLearner

Логическая матрица размера Pоколо-NumTrained, где P - количество предикторов (столбцов) в данных обучения X. UsePredForLearner(i,j) является true когда ученик j использует предиктор i, и является false в противном случае. Для каждого учащегося предикторы имеют тот же порядок, что и столбцы в данных обучения. X.

Если ансамбль не относится к типу Subspace, все записи в UsePredForLearner являются true.

Функции объекта

compareHoldoutСравнение точности двух классификационных моделей с использованием новых данных
edgeКрай классификации
limeЛокальные интерпретируемые модели-агностические объяснения (LIME)
lossОшибка классификации
marginПоля классификации
partialDependenceВычислить частичную зависимость
plotPartialDependenceСоздание графиков частичной зависимости (PDP) и индивидуального условного ожидания (ICE)
predictКлассифицировать наблюдения с использованием совокупности классификационных моделей
predictorImportanceОценки важности предиктора для классификационного ансамбля деревьев решений
removeLearnersУдалить элементы компактного классификационного ансамбля
shapleyЗначения Шапли

Копирование семантики

Значение. Сведения о том, как классы значений влияют на операции копирования, см. в разделе Копирование объектов.

Примеры

свернуть все

Создание компактного классификационного ансамбля для эффективного прогнозирования новых данных.

Загрузить ionosphere набор данных.

load ionosphere

Обучение усиленного ансамбля из 100 деревьев классификации с использованием всех измерений и AdaBoostM1 способ.

Mdl = fitcensemble(X,Y,'Method','AdaBoostM1')
Mdl = 
  ClassificationEnsemble
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
          NumObservations: 351
               NumTrained: 100
                   Method: 'AdaBoostM1'
             LearnerNames: {'Tree'}
     ReasonForTermination: 'Terminated normally after completing the requested number of training cycles.'
                  FitInfo: [100x1 double]
       FitInfoDescription: {2x1 cell}


  Properties, Methods

Mdl является ClassificationEnsemble объект модели, содержащий, среди прочего, данные обучения.

Создание компактной версии Mdl.

CMdl = compact(Mdl)
CMdl = 
  CompactClassificationEnsemble
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
               NumTrained: 100


  Properties, Methods

CMdl является CompactClassificationEnsemble объект модели. CMdl почти то же, что и Mdl. Одно исключение состоит в том, что CMdl не сохраняет данные обучения.

Сравнение объемов занимаемого пространства Mdl и CMdl.

mdlInfo = whos('Mdl');
cMdlInfo = whos('CMdl');
[mdlInfo.bytes cMdlInfo.bytes]
ans = 1×2

      878146      631686

Mdl занимает больше места, чем CMdl.

CMdl.Trained хранит обученные деревья классификации (CompactClassificationTree объекты модели), которые составляют Mdl.

Отображение графика первого дерева в компактном ансамбле.

view(CMdl.Trained{1},'Mode','graph');

Figure Classification tree viewer contains an axes and other objects of type uimenu, uicontrol. The axes contains 36 objects of type line, text.

По умолчанию fitcensemble выращивает мелководные деревья для поднятых ансамблей деревьев.

Спрогнозировать метку среднего значения X с использованием компактного ансамбля.

predMeanX = predict(CMdl,mean(X))
predMeanX = 1x1 cell array
    {'g'}

Совет

Для ансамбля классификационных деревьев Trained имущество ens хранит ens.NumTrained-по-1 клеточный вектор компактных классификационных моделей. Для текстового или графического отображения дерева t в векторе ячейки введите:

  • view(ens.Trained{t}.CompactRegressionLearner) для ансамблей, объединенных с помощью LogitBoost или GentleBoost.

  • view(ens.Trained{t}) для всех других методов агрегации.

Расширенные возможности

.
Представлен в R2011a