error

Класс: TreeBagger

Ошибка (misclassification вероятность или MSE)

Синтаксис

err = error(B,TBLnew,Ynew)
err = error(B,Xnew,Ynew)
err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)
err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...)

Описание

err = error(B,TBLnew,Ynew) вычисляет misclassification вероятность для деревьев классификации или среднеквадратическую ошибку (MSE) для деревьев регрессии для каждого дерева, для предикторов, содержавшихся в таблице TBLnew учитывая истинный ответ Ynew. Можно не использовать Ynew если TBLnew содержит переменную отклика. Если вы обучили B с помощью выборочных данных, содержавшихся в таблице, затем, входные данные для этого метода должны также быть в таблице.

err = error(B,Xnew,Ynew) вычисляет misclassification вероятность для деревьев классификации или среднеквадратическую ошибку (MSE) для деревьев регрессии для каждого дерева, для предикторов, содержавшихся в матричном Xnew учитывая истинный ответ Ynew. Если вы обучили B с помощью выборочных данных, содержавшихся в матрице, затем, входные данные для этого метода должны также быть в матрице.

Для классификации, Ynew может быть числовой вектор, символьная матрица, массив строк, массив ячеек из символьных векторов, категориальный векторный или логический вектор. Для регрессии, Y должен быть числовой вектор. err вектор с одной ошибочной мерой для каждого NTrees деревья в ансамбле B.

err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...) или err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...) задает дополнительные пары "имя-значение" параметра:

'Mode'Вектор символов или строковый скаляр, указывающий, как метод вычисляет ошибки. Если установлено в 'cumulative' (значение по умолчанию), error вычисляет совокупные ошибки и err вектор из длины NTrees, где первый элемент дает ошибку от trees(1), второй элемент дает ошибку fromtrees(1:2) и т.д., до trees(1:NTrees). Если установлено в 'individual', err вектор из длины NTrees, где каждым элементом является ошибка от каждого дерева в ансамбле. Если установлено в 'ensemble', err скаляр, показывающий совокупную ошибку для целого ансамбля.
'Weights'Вектор из весов наблюдения, чтобы использовать для ошибочного усреднения. По умолчанию вес каждого наблюдения равняется 1. Длина этого вектора должна быть равна количеству строк в X.
'Trees'Вектор из индексов, указывающих, что деревья включать в это вычисление. По умолчанию этот аргумент установлен в 'all' и метод использует все деревья. Если 'Trees' числовой вектор, метод возвращает вектор из длины NTrees для 'cumulative' и 'individual' режимы, где NTrees число элементов во входном векторе и скаляр для 'ensemble' режим. Например, в 'cumulative' режим, первый элемент дает ошибку от trees(1), второй элемент дает ошибку от trees(1:2) и т.д.
'TreeWeights'Вектор из древовидных весов. Этот вектор должен иметь ту же длину как 'Trees' вектор. Метод использует эти веса, чтобы объединить выход от заданных деревьев путем взятия взвешенного среднего вместо простого невзвешенного решения большинством голосов. Вы не можете использовать этот аргумент в 'individual' режим.
'UseInstanceForTree'Логическая матрица размера Nobs- NTrees указание, которое деревья должны использоваться, чтобы сделать предсказаниями для каждого наблюдения. По умолчанию метод использует все деревья для всех наблюдений.

Алгоритмы

При оценке ошибки ансамбля:

  • Используя 'Mode' аргумент пары "имя-значение", можно задать, чтобы возвратить ошибку любой из этих трех путей:

    • Ошибка для отдельных деревьев в ансамбле

    • Совокупная ошибка по всем деревьям

    • Ошибка для целого ансамбля

  • Используя 'Trees' аргумент пары "имя-значение", можно задать который деревья использовать в ошибочных вычислениях ансамбля.

  • Используя 'UseInstanceForTree' аргумент пары "имя-значение", можно задать который наблюдения во входных данных (X и Y) использовать в ошибочном вычислении ансамбля для каждого выбранного дерева.

  • Используя 'Weights' аргумент пары "имя-значение", можно приписать каждое наблюдение с весом. Для формул, которые следуют, wj является весом наблюдения j.

  • Используя 'TreeWeights' аргумент пары "имя-значение", можно приписать каждое дерево с весом.

Для проблем регрессии, error оценивает взвешенный MSE ансамбля сложенных в мешок деревьев регрессии для предсказания Y учитывая X использование выбранных деревьев и наблюдений.

  1. error предсказывает ответы для выбранных наблюдений в X использование выбранных деревьев регрессии в ансамбле.

  2. Оценка MSE зависит от значения 'Mode'.

    • Если вы задаете 'Mode','Individual', затем взвешенный MSE для древовидного t

      MSEt=1j=1nwjj=1nwj(yjy^tj)2.

      y^tj предсказанный ответ наблюдения j от выбранного дерева регрессии t. error наборы любые отменявшие наблюдения в выбранном дереве к взвешенному демонстрационному среднему значению наблюдаемых ответов обучающих данных.

    • Если вы задаете 'Mode','Cumulative', затем взвешенный MSE является вектором из размера T* содержа совокупный, взвешенный MSEs по T*T выбрал деревья. error выполняет эти шаги, чтобы оценить MSEt*, совокупный, взвешенный MSE использование первого t выбрал деревья.

      1. Для выбранного наблюдения j, j = 1..., n, error оценки y^bag,tj, взвешенное среднее предсказаний среди первого t выбрало деревья (для получения дополнительной информации смотрите predict). Для этого расчета, error использует древовидные веса.

      2. error оценивает совокупный, взвешенный MSE через древовидный t.

        MSEt=1j=1nwjj=1nwj(yjy^bag,tj)2.

      error наблюдения наборов, которые отменяются для всех выбранных деревьев к взвешенному демонстрационному среднему значению наблюдаемых ответов обучающих данных.

    • Если вы задаете 'Mode','Ensemble', затем взвешенный MSE является последним элементом совокупного, взвешенного вектора MSE.

Для проблем классификации, error оценивает взвешенный misclassification уровень ансамбля сложенных в мешок деревьев классификации для предсказания Y учитывая X использование выбранных деревьев и наблюдений.

  • Если вы задаете 'Mode','Individual', затем взвешенный misclassification уровень для древовидного t

    et=1j=1nwjj=1nwjI(yjy^tj).

    y^tj предсказанный класс для выбранного наблюдения использование j от выбранного дерева классификации t. error наборы любые отменявшие наблюдения в выбранном дереве к предсказанному, взвешенному, самому популярному классу по всем учебным ответам. Если существует несколько самых популярных классов, error считает тот перечисленным сначала в ClassNames свойство TreeBagger смоделируйте самое популярное.

  • Если вы задаете 'Mode','Cumulative' затем взвешенный misclassification уровень является вектором из размера T* содержа совокупные, взвешенные misclassification уровни по T*T выбрал деревья. error выполняет эти шаги, чтобы оценить et*, совокупный, взвешенный misclassification уровень с помощью первого t выбрал деревья.

    1. Для выбранного наблюдения j, j = 1..., n, error оценки y^bag,tj, взвешенный, самый популярный класс среди первого t выбрал деревья (для получения дополнительной информации смотрите predict). Для этого расчета, error использует древовидные веса.

    2. error оценивает совокупный, взвешенный misclassification уровень через древовидный t.

      et=1j=1nwjj=1nwjI(yjy^bag,tj).

      error наборы любые наблюдения, которые отменяются для всех выбранных деревьев к предсказанному, взвешенному, самому популярному классу по всем учебным ответам. Если существует несколько самых популярных классов, error считает тот перечисленным сначала в ClassNames свойство TreeBagger смоделируйте самое популярное.

  • Если вы задаете 'Mode','Ensemble', затем взвешенный misclassification уровень является последним элементом совокупного, взвешенного misclassification вектора уровня.