Важность предиктора оценивает перестановкой наблюдений предиктора из сумки для случайного леса деревьев регрессии
Imp = oobPermutedPredictorImportance(Mdl)
Imp = oobPermutedPredictorImportance(Mdl,Name,Value)
возвращает вектор из сумки, оценок важности предиктора перестановки с помощью случайного леса деревьев регрессии Imp
= oobPermutedPredictorImportance(Mdl
)Mdl
. Mdl
должен быть объектом модели RegressionBaggedEnsemble
.
дополнительные опции использования заданы одним или несколькими аргументами пары Imp
= oobPermutedPredictorImportance(Mdl
,Name,Value
)Name,Value
. Например, можно ускорить вычисление с помощью параллельных вычислений или указать который деревья использовать по оценке важности предиктора.
При росте случайного леса с помощью fitrensemble
:
Стандартный CART имеет тенденцию выбирать предикторы разделения, содержащие много отличных значений, например, непрерывные переменные, по тем, которые содержат немного отличных значений, например, категориальные переменные [3]. Если набор данных предиктора неоднороден, или если существуют предикторы, которые имеют относительно меньше отличных значений, чем другие переменные, то рассматривают определение тест взаимодействия или искривление.
Деревья, выращенные с помощью стандартного CART, не чувствительны к взаимодействиям переменной прогноза. Кроме того, такие деревья, менее вероятно, идентифицируют важные переменные в присутствии многих несоответствующих предикторов, чем приложение теста взаимодействия. Поэтому, чтобы составлять взаимодействия предиктора и идентифицировать переменные важности в присутствии многих несоответствующих переменных, задайте тест взаимодействия [2].
Если данные тренировки включают много предикторов, и вы хотите анализировать важность предиктора, затем задать 'NumVariablesToSample'
функции templateTree
как 'all'
для древовидных учеников ансамбля. В противном случае программное обеспечение не может выбрать некоторые предикторы, недооценив их важность.
Для получения дополнительной информации смотрите templateTree
и Выберите Split Predictor Selection Technique.
[1] Бреимен, L., Дж. Фридман, Р. Олшен и К. Стоун. Классификация и деревья регрессии. Бока-Ратон, FL: нажатие CRC, 1984.
[2] Loh, W.Y. “Деревья регрессии с Несмещенным Обнаружением Выбора переменной и Взаимодействия”. Statistica Sinica, Издание 12, 2002, стр 361–386.
[3] Loh, В.И. и И.С. Ши. “Разделите Методы выбора для Деревьев Классификации”. Statistica Sinica, Издание 7, 1997, стр 815–840.
RegressionBaggedEnsemble
| fitrensemble
| plotPartialDependence
| predictorImportance