exponenta event banner

predictorImportance

Оценки важности предиктора для классификационного ансамбля деревьев решений

Синтаксис

imp = predictorImportance(ens)
[imp,ma] = predictorImportance(ens)

Описание

imp = predictorImportance(ens) вычисляет оценки важности предиктора для ens суммируя эти оценки по всем слабым ученикам в ансамбле. imp имеет один элемент для каждого входного предиктора в данных, используемых для обучения этого ансамбля. Высокое значение указывает, что этот предиктор важен для ens.

[imp,ma] = predictorImportance(ens) возвращает Pоколо-P матрица с прогностическими показателями ассоциации для P предикторы, когда учащиеся в ens содержат суррогатные разделения. Дополнительные сведения см. в разделе.

Входные аргументы

ens

Классификационный ансамбль деревьев решений, созданный fitcensemble, или compact способ.

Выходные аргументы

imp

Вектор строки с тем же количеством элементов, что и число предикторов (столбцов) в ens.X. Записи являются оценками важности предиктора, с 0 представляет наименьшую возможную важность.

ma

A Pоколо-P матрица прогностических показателей ассоциации для P предикторы. Элемент ma(I,J) является прогностической мерой ассоциации, усредненной по суррогатным разделениям на предикторе J для какого предиктора I является оптимальным расщепленным предиктором. predictorImportance усредняет эту прогностическую меру ассоциации по всем деревьям в ансамбле.

Примеры

развернуть все

Оцените важность предиктора для всех переменных в данных радужки Фишера.

Загрузите набор данных радужки Фишера.

load fisheriris

Обучение классификационного ансамбля с помощью AdaBoostM2. Укажите пни дерева в качестве слабых учеников.

t = templateTree('MaxNumSplits',1);
ens = fitcensemble(meas,species,'Method','AdaBoostM2','Learners',t);

Оцените важность предиктора для всех переменных предиктора.

imp = predictorImportance(ens)
imp = 1×4

    0.0004    0.0016    0.1266    0.0324

Первые два предиктора не очень важны в ансамбле.

Оцените важность предиктора для всех переменных в данных радужки Фишера для ансамбля, где деревья содержат суррогатные расщепления.

Загрузите набор данных радужки Фишера.

load fisheriris

Выращивать ансамбль из 100 классификационных деревьев с помощью AdaBoostM2. Укажите пни дерева в качестве слабых учеников, а также определите суррогатные разделения.

t = templateTree('MaxNumSplits',1,'Surrogate','on');
ens = fitcensemble(meas,species,'Method','AdaBoostM2','Learners',t);

Оцените важность предиктора и прогностические показатели ассоциации для всех переменных предиктора.

[imp,ma] = predictorImportance(ens)
imp = 1×4

    0.0674    0.0417    0.1582    0.1537

ma = 4×4

    1.0000         0         0         0
    0.0115    1.0000    0.0022    0.0054
    0.3186    0.2137    1.0000    0.6391
    0.0392    0.0073    0.1137    1.0000

Первые два предиктора показывают гораздо большую важность, чем анализ в оценке важности предиктора.

Подробнее

развернуть все

Алгоритмы

Элемент ma(i,j) является прогностической мерой ассоциации, усредненной по суррогатным разделениям на предикторе j для какого предиктора i является оптимальным расщепленным предиктором. Это среднее вычисляется путем суммирования положительных значений прогностической меры ассоциации по оптимальным разделениям на предикторе. i и суррогатные расщепления на предикторе j и деление на общее количество оптимальных расщеплений на предикторе i, включая разделения, для которых прогностическая мера связи между предикторами i и j отрицательный.