Класс: TreeBagger
Ошибка (вероятность неправильной классификации или MSE)
err = error(B,TBLnew,Ynew)
err = error(B,Xnew,Ynew)
err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)
err
= error(B,Xnew,Ynew,'param1',val1,'param2',val2,...)
err = error(B,TBLnew,Ynew)
вычисляет вероятность неправильной классификации для деревьев классификации или средней квадратичной невязки (MSE) для деревьев регрессии для каждого дерева, для предикторов, содержащихся в таблице TBLnew
заданный истинный ответ Ynew
. Можно опускать Ynew
если TBLnew
содержит переменную отклика. Если вы тренировались B
используя выборочные данные, содержащуюся в таблице, тогда входные данные для этого метода должны также быть в таблице.
err = error(B,Xnew,Ynew)
вычисляет вероятность неправильной классификации для деревьев классификации или средней квадратичной невязки (MSE) для деревьев регрессии для каждого дерева, для предикторов, содержащихся в матрице Xnew
заданный истинный ответ Ynew
. Если вы тренировались B
используя выборочные данные, содержащуюся в матрице, тогда входные данные для этого метода должны также быть в матрице.
Для классификации, Ynew
может быть числовым вектором, матрицей символа, строковыми массивами, массивом ячеек векторов символов, категориальным вектором или логическим вектором. Для регрессии, Y
должен быть числовым вектором. err
является вектором с одной мерой ошибки для каждого из NTrees
деревья в ансамбле B
.
err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)
или err
= error(B,Xnew,Ynew,'param1',val1,'param2',val2,...)
задает необязательные пары "имя-значение" параметра:
'Mode' | Вектор символов или строковый скаляр, указывающий, как метод вычисляет ошибки. Если установлено значение 'cumulative' (по умолчанию), error вычисляет совокупные ошибки и err является вектором длины NTrees , где первый элемент выдает ошибку от trees(1) , второй элемент дает ошибку от trees(1:2) и т.д., до trees(1:NTrees) . Если установлено значение 'individual' , err является вектором длины NTrees , где каждый элемент является ошибкой от каждого дерева в ансамбле. Если установлено значение 'ensemble' , err является скаляром, показывающим совокупную ошибку для всего ансамбля. |
'Weights' | Вектор весов наблюдений для усреднения ошибок. По умолчанию вес каждого наблюдения равен 1. Длина этого вектора должна быть равна количеству строк в X . |
'Trees' | Вектор индексов, указывающих, какие деревья включать в этот расчет. По умолчанию для этого аргумента задано значение 'all' и метод использует все деревья. Если 'Trees' является числовым вектором, метод возвращает вектор длины NTrees для 'cumulative' и 'individual' режимы, где NTrees - количество элементов в векторе вход и скаляр для 'ensemble' режим. Для примера, в 'cumulative' mode, первый элемент выдает ошибку от trees(1) , второй элемент дает ошибку от trees(1:2) и т.д. |
'TreeWeights' | Вектор весов дерева. Этот вектор должен иметь ту же длину, что и 'Trees' вектор. Метод использует эти веса, чтобы объединить выход из заданных деревьев, взяв взвешенное среднее значение вместо простого невзвешенного большинства голосов. Вы не можете использовать этот аргумент в 'individual' режим. |
'UseInstanceForTree' | Логическая матрица размера Nobs -by- NTrees указание на то, какие деревья следует использовать для внесения предсказаний в каждое наблюдение. По умолчанию метод использует все деревья для всех наблюдений. |
При оценке ошибки ансамбля:
Использование 'Mode'
аргумент пары "имя-значение", можно задать, чтобы вернуть ошибку любым из следующих трех способов:
Ошибка для отдельных деревьев в ансамбле
Совокупная ошибка по всем деревьям
Ошибка для всего ансамбля
Использование 'Trees'
аргумент пары "имя-значение" можно задать, какие деревья использовать в вычислениях ошибок ансамбля.
Использование 'UseInstanceForTree'
Аргумент пары "имя-значение" можно задать какие наблюдения в входных данных (X
и Y
) для использования в вычислении ошибки ансамбля для каждого выбранного дерева.
Использование 'Weights'
Аргумент пары "имя-значение" можно атрибутировать каждое наблюдение весом. Для следующих формул wj является весом j наблюдений.
Использование 'TreeWeights'
Аргумент пары "имя-значение" можно атрибутировать каждое дерево весом.
Для задач регрессии, error
оценивает взвешенное MSE ансамбля мешанных регрессионых деревьев для предсказания Y
заданные X
использование выбранных деревьев и наблюдений.
error
предсказывает ответы для выбранных наблюдений в X
использование выбранных деревьев регрессии в ансамбле.
Оценка MSE зависит от значения 'Mode'
.
Если вы задаете 'Mode','Individual'
, тогда взвешенный MSE для древовидных t
- предсказанная реакция j наблюдений из выбранных t регрессионного дерева. error
устанавливает любые невыбранные наблюдения в выбранном дереве в средневзвешенное среднее значение выборки наблюдаемых откликов обучающих данных.
Если вы задаете 'Mode','Cumulative'
, тогда взвешенный MSE является вектором размера T* содержит совокупные взвешенные MSE по T* ≤ T выбранные деревья. error
выполните эти шаги, чтобы оценить MSE t*, совокупный взвешенный MSE с использованием первого t выбранных деревьев.
Для выбранных j наблюдения j = 1,..., n, error
оценки , взвешенное среднее значение предсказаний среди первых t выбранных деревьев (для получения дополнительной информации см. predict
). Для этого расчета, error
использует веса дерева.
error
оценивает совокупный взвешенный MSE через древовидные t.
error
устанавливает наблюдения, которые не выбраны для всех выбранных деревьев, в средневзвешенное среднее значение выборки наблюдаемых откликов обучающих данных.
Если вы задаете 'Mode','Ensemble'
, тогда взвешенный MSE является последним элементом совокупного взвешенного вектора MSE.
Для задач классификации, error
оценивает взвешенную скорость неправильной классификации ансамбля упакованных классификационных деревьев для предсказания Y
заданные X
использование выбранных деревьев и наблюдений.
Если вы задаете 'Mode','Individual'
, тогда взвешенный коэффициент неправильной классификации для древовидных t
- предсказанный класс для выбранных j наблюдения, использующих из выбранных древовидных t классификации. error
устанавливает любые невыбранные наблюдения в выбранном дереве на предсказанный, взвешенный, самый популярный класс по всем откликам обучения. Если существует несколько наиболее популярных классов, error
рассматривает тот, который указан первым в ClassNames
свойство TreeBagger
модель самая популярная.
Если вы задаете 'Mode','Cumulative'
тогда взвешенная скорость неправильной классификации является вектором размера T* содержащие совокупные взвешенные показатели ошибочной классификации по T* ≤ T выбранные деревья. error
следуйте этим шагам, чтобы оценить et*, совокупный, взвешенный коэффициент неправильной классификации с использованием первого t выбранных деревьев.
Для выбранных j наблюдения j = 1,..., n, error
оценки , взвешенный, самый популярный класс среди первых t выбранных деревьев (для получения дополнительной информации см. predict
). Для этого расчета, error
использует веса дерева.
error
оценивает совокупный, взвешенный уровень неправильной классификации через древовидные t.
error
устанавливает любые наблюдения, которые не выбраны для всех выбранных деревьев, в предсказанный, взвешенный, самый популярный класс по всем откликам обучения. Если существует несколько наиболее популярных классов, error
рассматривает тот, который указан первым в ClassNames
свойство TreeBagger
модель самая популярная.
Если вы задаете 'Mode','Ensemble'
, тогда взвешенная скорость неправильной классификации является последним элементом совокупного, взвешенного вектора скорости неправильной классификации.