Важность предиктора оценивает сочетанием наблюдений предиктора из сумки для случайного леса деревьев регрессии
возвращает вектор из из сумки, оценок важности предиктора сочетания с помощью случайного леса деревьев регрессии Imp
= oobPermutedPredictorImportance(Mdl
)Mdl
. Mdl
должен быть RegressionBaggedEnsemble
объект модели.
дополнительные опции использования заданы одним или несколькими Imp
= oobPermutedPredictorImportance(Mdl
,Name,Value
)Name,Value
парные аргументы. Например, можно ускорить расчет с помощью параллельных вычислений или указать который деревья использовать по оценке важности предиктора.
При росте случайного лесного использования fitrensemble
:
Стандартный CART имеет тенденцию выбирать предикторы разделения, содержащие много отличных значений, e.g., непрерывные переменные, по тем, которые содержат немного отличных значений, e.g., категориальные переменные [3]. Если набор данных предиктора неоднороден, или если существуют предикторы, которые имеют относительно меньше отличных значений, чем другие переменные, то рассматривают определение тест взаимодействия или искривление.
Деревья, выращенные с помощью стандартного CART, не чувствительны к взаимодействиям переменного предиктора. Кроме того, такие деревья, менее вероятно, идентифицируют важные переменные в присутствии многих несоответствующих предикторов, чем приложение теста взаимодействия. Поэтому с учетом взаимодействий предиктора и идентифицируют переменные важности в присутствии многих несоответствующих переменных, задают тест взаимодействия [2].
Если обучающие данные включают много предикторов, и вы хотите анализировать важность предиктора, затем задать 'NumVariablesToSample'
из templateTree
функционируйте как 'all'
для древовидных учеников ансамбля. В противном случае программное обеспечение не может выбрать некоторые предикторы, недооценив их важность.
Для получения дополнительной информации смотрите templateTree
и выберите метод выбора предиктора разделения.
[1] Бреимен, L., Дж. Фридман, Р. Олшен и К. Стоун. Классификация и деревья регрессии. Бока-Ратон, FL: нажатие CRC, 1984.
[2] Loh, W.Y. “Деревья регрессии с Несмещенным Обнаружением Выбора переменной и Взаимодействия”. Statistica Sinica, Издание 12, 2002, стр 361–386.
[3] Loh, В.И. и И.С. Ши. “Разделите Методы выбора для Деревьев Классификации”. Statistica Sinica, Издание 7, 1997, стр 815–840.
predictorImportance
| RegressionBaggedEnsemble
| fitrensemble
| plotPartialDependence