Деревья решений

Деревья решений, или деревья классификации и деревья регрессии, предсказывают ответы на данные. Чтобы предсказать ответ, следуйте за решениями в дереве от корня (начало) узел вниз к вершине. Вершина содержит ответ. Деревья классификации дают ответы, которые номинальны, таковы как 'true' или 'false'. Деревья регрессии дают числовые ответы.

Деревья Statistics and Machine Learning Toolbox™ являются двоичным файлом. Каждый шаг в прогнозе включает проверку значения одного предиктора (переменная). Например, вот простое дерево классификации:

Это дерево предсказывает классификации на основе двух предикторов, x1 и x2. Чтобы предсказать, запустите в главном узле, представленном треугольником (Δ). Первое решение состоит в том ли x1 меньше, чем 0.5. Если так, следуйте за левой ветвью и смотрите, что дерево классифицирует данные как тип 0.

Если, однако, x1 превышает 0.5, затем следуйте за правильной ветвью к нижнему правому треугольному узлу. Здесь дерево спрашивает если x2 меньше, чем 0.5. Если так, затем следуйте за левой ветвью, чтобы видеть, что дерево классифицирует данные как тип 0. В противном случае затем следуйте за правильной ветвью, чтобы видеть, что дерево классифицирует данные как тип 1.

Чтобы изучить, как подготовить ваши данные к классификации или регрессии с помощью деревьев решений, смотрите Шаги в Контролируемом Изучении.

Обучите дерево классификации

В этом примере показано, как обучить дерево классификации.

Создайте дерево классификации использование целого ionosphere набор данных.

load ionosphere % Contains X and Y variables
Mdl = fitctree(X,Y)
Mdl = 
  ClassificationTree
             ResponseName: 'Y'
    CategoricalPredictors: []
               ClassNames: {'b'  'g'}
           ScoreTransform: 'none'
          NumObservations: 351


  Properties, Methods

Обучите дерево регрессии

В этом примере показано, как обучить дерево регрессии.

Создайте дерево регрессии, использующее все наблюдение в carsmall набор данных. Рассмотрите Horsepower и Weight векторы как переменные предикторы и MPG вектор как ответ.

load carsmall % Contains Horsepower, Weight, MPG
X = [Horsepower Weight];

Mdl = fitrtree(X,MPG)
Mdl = 
  RegressionTree
             ResponseName: 'Y'
    CategoricalPredictors: []
        ResponseTransform: 'none'
          NumObservations: 94


  Properties, Methods

Ссылки

[1] Бреимен, L., Дж. Х. Фридман, Р. А. Олшен и К. Дж. Стоун. Классификация и деревья регрессии. Бока-Ратон, FL: Chapman & Hall, 1984.

Смотрите также

| | |

Похожие темы