Мешок деревьев принятия решений
TreeBagger представляет собой совокупность деревьев решений для классификации или регрессии. Фасовка в мешки означает агрегацию начальной загрузки. Каждое дерево в ансамбле выращивается на независимо нарисованной загрузочной реплике входных данных. Наблюдения, не включенные в эту реплику, находятся «вне пакета» для этого дерева.
TreeBagger полагается на ClassificationTree и RegressionTree функциональные возможности для выращивания отдельных деревьев. В частности, ClassificationTree и RegressionTree принимает количество элементов, выбранных случайным образом для каждого разделения решения, в качестве необязательного входного аргумента. То есть TreeBagger реализует алгоритм случайного леса [1].
Для регрессионных проблем: TreeBagger поддерживает среднюю и квантильную регрессию (то есть квантильный регрессионный лес [2]).
Чтобы предсказать средние ответы или оценить среднеквадратичную ошибку данных, передайте TreeBagger модель и данные для predict или errorсоответственно. Для выполнения аналогичных операций при наблюдениях вне мешка используйте oobPredict или oobError.
Для оценки квантилей распределения ответа или ошибки квантиля данных передайте TreeBagger модель и данные для quantilePredict или quantileErrorсоответственно. Для выполнения аналогичных операций при наблюдениях вне мешка используйте oobQuantilePredict или oobQuantileError.
| TreeBagger | Создание пакета деревьев решений |
append | Добавить новые деревья в ансамбль |
compact | Компактный ансамбль деревьев принятия решений |
error | Ошибка (вероятность неправильной классификации или MSE) |
fillprox | Матрица близости для данных обучения |
growTrees | Обучение дополнительных деревьев и добавление в ансамбль |
margin | Маржа классификации |
mdsprox | Многомерное масштабирование матрицы близости |
meanMargin | Средняя классификационная маржа |
oobError | Ошибка вне пакета |
oobMargin | Границы вне упаковки |
oobMeanMargin | Средние маржи вне упаковки |
oobPredict | Ансамблевые прогнозы для наблюдений вне мешка |
oobQuantileError | Вне пакета квантовая потеря пакета деревьев регрессии |
oobQuantilePredict | Квантильные прогнозы для наблюдений вне пакета из пакета деревьев регрессии |
partialDependence | Вычислить частичную зависимость |
plotPartialDependence | Создание графиков частичной зависимости (PDP) и индивидуального условного ожидания (ICE) |
predict | Прогнозирование ответов с использованием совокупности упакованных в мешки деревьев принятия решений |
quantileError | Потери квантилей с использованием пакета деревьев регрессии |
quantilePredict | Предсказать квантиль ответа с использованием пакета деревьев регрессии |
|
Массив ячеек, содержащий имена классов для переменной ответа |
|
Логический флаг, определяющий необходимость вычисления внеплановых прогнозов для учебных наблюдений. Значение по умолчанию: Если этот флаг
Если этот флаг
|
|
Логический флаг, указывающий, следует ли вычислять оценки переменной важности вне пакета. Значение по умолчанию: Если этот флаг
|
|
Квадратная матрица, где Это свойство:
|
|
Значение по умолчанию, возвращенное
|
|
Числовой массив 1-by-Nvars размеров изменений критерия разделения, суммированных по разделениям по каждой переменной, усредненных по всему ансамблю выращенных деревьев. |
|
Часть наблюдений, которые выбираются случайным образом с заменой для каждой реплики начальной загрузки. Размер каждой реплики - Nobs × |
|
Логический флаг, указывающий, должны ли уходы дерева принятия решений с одним и тем же родителем объединяться для разбиений, которые не уменьшают общий риск. Значение по умолчанию: |
|
Метод, используемый деревьями. Возможные значения: |
|
Минимальное количество наблюдений на лист дерева. По умолчанию |
|
Скалярное значение, равное числу деревьев решений в ансамбле. |
|
Числовой массив размера 1-by-Nvars, где каждый элемент даёт количество расщеплений на этом предикторе, суммированных по всем деревьям. |
|
Количество прогнозирующих или характерных переменных, выбираемых случайным образом для каждого разделения решения. По умолчанию |
|
Логический массив размером Nobs-by-NumTrees, где Nobs - количество наблюдений в обучающих данных, а NumTrees - количество деревьев в ансамбле. A |
|
Числовой массив Nobs-by-1 размера, содержащий число деревьев, используемых для вычисления отклика вне пакета для каждого наблюдения. Нобс - количество наблюдений в данных обучения, использованных для создания ансамбля. |
|
Числовой массив размера 1-by-Nvars содержащий меру важности переменной для каждой переменной предиктора (характеристики). Для любой переменной мера представляет собой разницу между числом повышенных полей и числом пониженных полей, если значения этой переменной переставлены в наблюдениях вне пакета. Эта мера вычисляется для каждого дерева, затем усредняется по всему ансамблю и делится на стандартное отклонение по всему ансамблю. Это свойство пусто для деревьев регрессии. |
|
Числовой массив размера 1-by-Nvars содержащий меру важности для каждой прогнозирующей переменной (признака). Для любой переменной мерой является увеличение ошибки предсказания, если значения этой переменной переставлены в наблюдениях вне пакета. Эта мера вычисляется для каждого дерева, затем усредняется по всему ансамблю и делится на стандартное отклонение по всему ансамблю. |
|
Числовой массив размера 1-by-Nvars содержащий меру важности для каждой прогнозирующей переменной (признака). Для любой переменной измерением является уменьшение классификационного запаса, если значения этой переменной переставлены в наблюдениях вне пакета. Эта мера вычисляется для каждого дерева, затем усредняется по всему ансамблю и делится на стандартное отклонение по всему ансамблю. Это свойство пусто для деревьев регрессии. |
|
Числовой массив размера Nobs-by-1, где Нобс - количество наблюдений в обучающих данных, содержащих более высокие показатели для каждого наблюдения. |
|
Числовой вектор предшествующих вероятностей для каждого класса. Порядок элементов Это свойство:
|
|
Числовая матрица размера Nobs-by-Nobs, где Nobs - количество наблюдений в обучающих данных, содержащих показатели близости между наблюдениями. Для любых двух наблюдений их близость определяется как доля деревьев, для которых эти наблюдения высаживаются на один и тот же лист. Это симметричная матрица с 1s на диагональных и внедиагональных элементах в диапазоне от 0 до 1. |
|
|
|
Логический флаг, определяющий выборку данных для каждого дерева принятия решений с заменой. Это свойство имеет значение |
|
Массив ячеек аргументов для |
|
Массив ячеек размером NumTrees-by-1 содержащий деревья в ансамбле. |
|
Матрица размера Nvars-by-Nvars с прогностическими показателями переменной ассоциации, усредненная по всему ансамблю выращенных деревьев. Если вы выросли ансамбль настройки |
|
Массив ячеек, содержащий имена переменных предиктора (признаков). |
|
Числовой вектор весов длины Нобса, где Нобс - количество наблюдений (строк) в обучающих данных. |
|
Таблица или числовая матрица размера Nobs-by-Nvars, где Nobs - количество наблюдений (строк), а Nvars - количество переменных (столбцов) в обучающих данных. Если тренировать ансамбль с помощью таблицы предикторных значений, то |
|
Массив откликов Nobs размера. Элементы |
Значение. Сведения о том, как это влияет на использование класса, см. в разделе Сравнение классов дескрипторов и значений в документации по объектно-ориентированному программированию MATLAB ®.
Для TreeBagger объект модели B, Trees свойство хранит вектор ячейки B.NumTrees
CompactClassificationTree или CompactRegressionTree объекты модели. Для текстового или графического отображения дерева t в векторе ячейки введите
view(B.Trees{t})Toolbox™ статистики и машинного обучения предлагает три объекта для фасовки в мешки и случайного леса:
ClassificationBaggedEnsemble создано fitcensemble для классификации
RegressionBaggedEnsemble создано fitrensemble для регрессии
TreeBagger создано TreeBagger для классификации и регрессии
Для получения подробной информации о различиях между TreeBagger и фасованные ансамбли (ClassificationBaggedEnsemble и RegressionBaggedEnsemble), см. Сравнение ансамблей TreeBagger и Bagged.
[1] Брейман, Л. «Случайные леса». Машинное обучение 45, стр. 5-32, 2001.
[2] Мейнсхаузен, Н. «Квантильные регрессионные леса». Журнал исследований машинного обучения, том 7, 2006, стр. 983-999.
compact | CompactTreeBagger | error | oobError | oobPredict | predict | TreeBagger | view | view