Деревья решений, или деревья классификации и деревья регрессии, предсказывают ответы на данные. Чтобы предсказать ответ, следуйте за решениями в дереве от корня (начало) узел вниз к вершине. Вершина содержит ответ. Деревья классификации дают ответы, которые номинальны, таковы как 'true'
или 'false'
. Деревья регрессии дают числовые ответы.
Деревья Statistics and Machine Learning Toolbox™ являются двоичным файлом. Каждый шаг в прогнозе включает проверку значения одного предиктора (переменная). Например, вот простое дерево классификации:
Это дерево предсказывает классификации на основе двух предикторов, x1
и x2
. Чтобы предсказать, запустите в главном узле, представленном треугольником (Δ). Первое решение состоит в том, меньше ли x1
, чем 0.5
. Если так, следуйте за левым ответвлением и смотрите, что дерево классифицирует данные как тип 0
.
Если, однако, x1
превышает 0.5
, то следуйте за правильным ответвлением к нижнему правому треугольному узлу. Здесь дерево спрашивает, меньше ли x2
, чем 0.5
. Если так, затем следуйте за левым ответвлением, чтобы видеть, что дерево классифицирует данные как тип 0
. В противном случае затем следуйте за правильным ответвлением, чтобы видеть, что дерево классифицирует данные как тип 1
.
Чтобы изучить, как подготовить ваши данные к классификации или регрессии с помощью деревьев решений, смотрите Шаги в Контролируемом Изучении.
Этот пример показывает, как обучить дерево классификации.
Создайте дерево классификации использование целого набора данных ionosphere
.
load ionosphere % Contains X and Y variables Mdl = fitctree(X,Y)
Mdl = ClassificationTree ResponseName: 'Y' CategoricalPredictors: [] ClassNames: {'b' 'g'} ScoreTransform: 'none' NumObservations: 351 Properties, Methods
Этот пример показывает, как обучить дерево регрессии.
Создайте дерево регрессии, использующее все наблюдение в наборе данных carsmall
. Рассмотрите Horsepower
и векторы Weight
как переменные прогноза и вектор MPG
как ответ.
load carsmall % Contains Horsepower, Weight, MPG X = [Horsepower Weight]; Mdl = fitrtree(X,MPG)
Mdl = RegressionTree ResponseName: 'Y' CategoricalPredictors: [] ResponseTransform: 'none' NumObservations: 94 Properties, Methods
[1] Бреимен, L., Дж. Х. Фридман, Р. А. Олшен и К. Дж. Стоун. Классификация и деревья регрессии. Бока-Ратон, FL: Chapman & Hall, 1984.
ClassificationTree
| RegressionTree
| fitctree
| fitrtree