Деревья решений

Деревья решений или деревья классификации и регрессии предсказывают ответы на данные. Чтобы предсказать ответ, следуйте решениям в дереве от корневого (начального) узла до узла листа. Узел листа содержит ответ. Деревья классификации дают номинальные отклики, такие как 'true' или 'false'. Деревья регрессии дают числовые отклики.

Statistics and Machine Learning Toolbox™ деревьев являются двоичными. Каждый шаг в предсказании включает проверку значения одного предиктора (переменной). Например, вот простое дерево классификации:

Это дерево предсказывает классификации на основе двух предикторов, x1 и x2. Чтобы предсказать, начните с верхнего узла, представленного треугольником (И). Первое решение заключается в том, x1 ли меньше 0.5. Если это так, следуйте левой ветви и увидите, что дерево классифицирует данные как тип 0.

Если, однако x1 превышает 0.5, затем следуйте правой ветви к нижнему прямоугольному узлу треугольника. Здесь дерево спрашивает, x2 меньше 0.5. Если это так, следуйте левой ветви, чтобы увидеть, что дерево классифицирует данные как тип 0. Если нет, следуйте правой ветви, чтобы увидеть, что дерево классифицирует данные как тип 1.

Чтобы узнать, как подготовить ваши данные к классификации или регрессии с помощью деревьев решений, смотрите Шаги в Надзорном Обучении.

Обучите дерево классификации

В этом примере показано, как обучить дерево классификации.

Создайте дерево классификации, используя весь ionosphere набор данных.

load ionosphere % Contains X and Y variables
Mdl = fitctree(X,Y)
Mdl = 
  ClassificationTree
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
          NumObservations: 351


  Properties, Methods

Обучите дерево регрессии

В этом примере показано, как обучить дерево регрессии.

Создайте регрессионное дерево, используя все наблюдения в carsmall набор данных. Рассмотрим Horsepower и Weight векторы в качестве переменных предиктора и MPG вектор как ответ.

load carsmall % Contains Horsepower, Weight, MPG
X = [Horsepower Weight];

Mdl = fitrtree(X,MPG)
Mdl = 
  RegressionTree
             ResponseName: 'Y'
    CategoricalPredictors: []
        ResponseTransform: 'none'
          NumObservations: 94


  Properties, Methods

Ссылки

[1] Breiman, L., J. H. Friedman, R. A. Olshen, and C. J. Stone. Деревья классификации и регрессии. Бока Ратон, FL: Chapman & Hall, 1984.

См. также

| | |

Похожие темы