predictorImportance
вычисляет оценки важности предиктора для tree
путем подведения итогов изменений в среднеквадратической ошибке (MSE) из-за разделений на каждом предикторе и деления суммы на количество узлов ответвления. Если дерево выращено без суррогатных разделений, эта сумма взята по лучшим разделениям, найденным в каждом узле ответвления. Если дерево выращено с суррогатными разделениями, эта сумма взята по всем разделениям в каждом узле ответвления включая суррогатные разделения. imp
имеет один элемент для каждого входного предиктора в данных, используемых, чтобы обучить это дерево. В каждом узле MSE оценивается как ошибка узла, взвешенная вероятностью узла. Переменная важность, сопоставленная с этим разделением, вычисляется как различие между MSE для родительского узла и общим MSE для двух дочерних элементов.
Оценки важности предиктора не зависят от порядка предикторов, если вы используете суррогатные разделения, но действительно зависите от порядка, если вы не используете суррогатные разделения.
Если вы используете суррогатные разделения, predictorImportance
вычисляет оценки, прежде чем дерево будет уменьшаться путем сокращения или слияния листов. Если вы не используете суррогатные разделения, predictorImportance
вычисляет оценки после того, как дерево уменьшается путем сокращения или слияния листов. Поэтому сокращение дерева сокращением влияет на важность предиктора для дерева, выращенного без суррогатных разделений, и не влияет на важность предиктора для дерева, выращенного с суррогатными разделениями.