Оценки важности предиктора путем перестановки наблюдений предиктора вне мешка для случайного леса деревьев регрессии
возвращает вектор оценок важности предиктора вне пакета путем перестановки с использованием случайного леса деревьев регрессии Imp = oobPermutedPredictorImportance(Mdl)Mdl. Mdl должно быть RegressionBaggedEnsemble объект модели.
использует дополнительные параметры, указанные одним или несколькими Imp = oobPermutedPredictorImportance(Mdl,Name,Value)Name,Value аргументы пары. Например, можно ускорить вычисления с помощью параллельных вычислений или указать, какие деревья использовать в оценке важности предиктора.
При выращивании случайного леса с использованием fitrensemble:
Стандартная CART имеет тенденцию выбирать разделенные предикторы, содержащие много различных значений, например непрерывных переменных, по сравнению с теми, которые содержат несколько различных значений, например категориальных переменных [3]. Если набор данных предиктора неоднороден, или если есть предикторы, которые имеют относительно меньше отличных значений, чем другие переменные, то рассмотрите возможность указания теста кривизны или взаимодействия.
Деревья, выращенные с использованием стандартной CART, не чувствительны к переменным взаимодействиям предиктора. Кроме того, такие деревья с меньшей вероятностью идентифицируют важные переменные в присутствии многих неактуальных предикторов, чем применение теста взаимодействия. Поэтому для учета предикторных взаимодействий и определения переменных важности при наличии множества неактуальных переменных укажите тест взаимодействия [2].
Если обучающие данные включают много предикторов и требуется проанализировать важность предиктора, укажите 'NumVariablesToSample' из templateTree функция как 'all' для обучающихся на деревьях ансамбля. В противном случае программное обеспечение может не выбирать некоторые предикторы, недооценивая их важность.
Дополнительные сведения см. в разделе templateTree и выберите «Метод выбора разделенного предиктора».
[1] Брейман, Л., Дж. Фридман, Р. Ольшен и К. Стоун. Деревья классификации и регрессии. Бока Ратон, FL: CRC Press, 1984.
[2] О, W.Y. «Регрессионные деревья с несмещенным выбором переменных и обнаружением взаимодействия». Statistica Sinica, Vol. 12, 2002, pp. 361-386.
[3] Ло, У.Я. и Ю.С. Ших. «Разбить методы выбора для деревьев классификации». Statistica Sinica, том 7, 1997, стр. 815-840.