ошибка

Класс: TreeBagger

Ошибка (misclassification вероятность или MSE)

Синтаксис

err = error(B,TBLnew,Ynew)
err = error(B,Xnew,Ynew)
err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)
err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...)

Описание

err = error(B,TBLnew,Ynew) вычисляет misclassification вероятность для деревьев классификации или среднеквадратическую ошибку (MSE) для деревьев регрессии для каждого дерева, для предикторов, содержавшихся в таблице TBLnew, данной истинный ответ Ynew. Можно не использовать Ynew, если TBLnew содержит переменную отклика. Если бы вы обучили B с помощью выборочных данных, содержавшихся в таблице, то входные данные для этого метода должны также быть в таблице.

err = error(B,Xnew,Ynew) вычисляет misclassification вероятность для деревьев классификации или среднеквадратическую ошибку (MSE) для деревьев регрессии для каждого дерева, для предикторов, содержавшихся в матричном Xnew, данном истинный ответ Ynew. Если бы вы обучили B с помощью выборочных данных, содержавшихся в матрице, то входные данные для этого метода должны также быть в матрице.

Для классификации Ynew может быть числовым вектором, символьной матрицей, массивом строк, массивом ячеек из символьных векторов, категориальным векторным или логическим вектором. Для регрессии Y должен быть числовым вектором. err является вектором с одной ошибочной мерой для каждого из деревьев NTrees в ансамбле B.

err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...) или err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...) задает дополнительные пары "имя-значение" параметра:

'Mode'Вектор символов или скаляр строки указание, как метод вычисляет ошибки. Если установлено в 'cumulative' (значение по умолчанию), error вычисляет совокупные ошибки, и err является вектором длины NTrees, откуда первый элемент дает ошибку trees(1), второй элемент дает ошибку fromtrees(1:2) и т.д. до trees(1:NTrees). Если установлено в 'individual', err является вектором длины NTrees, где каждый элемент является ошибкой от каждого дерева в ансамбле. Если установлено в 'ensemble', err является скаляром, показывающим совокупную ошибку для целого ансамбля.
'Weights'Вектор весов наблюдения, чтобы использовать для ошибочного усреднения. По умолчанию вес каждого наблюдения равняется 1. Длина этого вектора должна быть равна количеству строк в X.
'Trees'Вектор индексов, указывающих, что деревья включать в это вычисление. По умолчанию этот аргумент установлен в 'all', и метод использует все деревья. Если 'Trees' является числовым вектором, метод возвращает вектор длины NTrees для режимов 'cumulative' и 'individual', где NTrees является числом элементов во входном векторе и скаляром для режима 'ensemble'. Например, в режиме 'cumulative', первый элемент дает ошибку от trees(1), второй элемент дает ошибку от trees(1:2) и т.д.
'TreeWeights'Вектор древовидных весов. Этот вектор должен иметь ту же длину как вектор 'Trees'. Метод использует эти веса, чтобы объединить вывод от заданных деревьев путем взятия взвешенного среднего вместо простого невзвешенного решения большинством голосов. Вы не можете использовать этот аргумент в режиме 'individual'.
'UseInstanceForTree'Логическая матрица размера Nobs-by-NTrees указание, которое деревья должны использоваться, чтобы сделать прогнозами для каждого наблюдения. По умолчанию метод использует все деревья для всех наблюдений.

Алгоритмы

При оценке ошибки ансамбля:

  • Используя аргумент пары "имя-значение" 'Mode', можно задать, чтобы возвратить ошибку любой из этих трех путей:

    • Ошибка для отдельных деревьев в ансамбле

    • Совокупная ошибка по всем деревьям

    • Ошибка для целого ансамбля

  • Используя аргумент пары "имя-значение" 'Trees', можно задать который деревья использовать в ошибочных вычислениях ансамбля.

  • Используя аргумент пары "имя-значение" 'UseInstanceForTree', можно задать который наблюдения во входных данных (X и Y), чтобы использовать в ошибочном вычислении ансамбля для каждого выбранного дерева.

  • Используя аргумент пары "имя-значение" 'Weights', можно приписать каждое наблюдение с весом. Для формул, которые следуют, wj является весом наблюдения j.

  • Используя аргумент пары "имя-значение" 'TreeWeights', можно приписать каждое дерево с весом.

Для проблем регрессии error оценивает взвешенный MSE ансамбля сложенных в мешок деревьев регрессии для предсказания Y, данного X с помощью выбранных деревьев и наблюдений.

  1. error предсказывает ответы для выбранных наблюдений в X с помощью выбранных деревьев регрессии в ансамбле.

  2. Оценка MSE зависит от значения 'Mode'.

    • Если вы задаете 'Mode','Individual', то взвешенный MSE для древовидного t

      MSEt=1j=1nwjj=1nwj(yjy^tj)2.

      y^tj предсказанный ответ наблюдения j от выбранного дерева регрессии t. error устанавливает любые отменявшие наблюдения в выбранном дереве к взвешенному демонстрационному среднему значению наблюдаемых ответов данных тренировки.

    • Если вы задаете 'Mode','Cumulative', то взвешенный MSE является вектором размера, T* содержащий совокупный, взвешенный MSEs по T*T выбрал деревья. error выполняет эти шаги, чтобы оценить, что MSEt*, совокупное, взвесил MSE, использование первого t выбрало деревья.

      1. Для выбранного наблюдения j, j = 1..., n, оценки error y^сумка,tj, взвешенное среднее прогнозов среди первого t выбрало деревья (для получения дополнительной информации смотрите predict). Для этого вычисления error использует древовидные веса.

      2. error оценивает совокупный, взвешенный MSE через древовидный t.

        MSEt=1j=1nwjj=1nwj(yjy^сумка,tj)2.

      error устанавливает наблюдения, которые отменяются для всех выбранных деревьев к взвешенному демонстрационному среднему значению наблюдаемых ответов данных тренировки.

    • Если вы задаете 'Mode','Ensemble', то взвешенный MSE является последним элементом совокупного, взвешенного вектора MSE.

Для проблем классификации error оценивает взвешенный misclassification уровень ансамбля сложенных в мешок деревьев классификации для предсказания Y, данного X с помощью выбранных деревьев и наблюдений.

  • Если вы задаете 'Mode','Individual', то взвешенный misclassification уровень для древовидного t

    et=1j=1nwjj=1nwjI(yjy^tj).

    y^tj предсказанный класс для выбранного наблюдения использование j от выбранного дерева классификации t. error устанавливает любые отменявшие наблюдения в выбранном дереве к предсказанному, взвешенному, самому популярному классу по всем учебным ответам. Если существует несколько самых популярных классов, error считает тот перечисленным сначала в свойстве ClassNames модели TreeBagger самое популярное.

  • Если вы задаете 'Mode','Cumulative' затем, взвешенный misclassification уровень является вектором размера, T* содержащий совокупные, взвешенные misclassification уровни по T*T выбрал деревья. error выполняет эти шаги, чтобы оценить, что et*, совокупное, взвесил misclassification уровень с помощью выбранных деревьев первого t.

    1. Для выбранного наблюдения j, j = 1..., n, оценки error y^сумка,tj, взвешенный, самый популярный класс среди первого t выбрал деревья (для получения дополнительной информации смотрите predict). Для этого вычисления error использует древовидные веса.

    2. error оценивает совокупный, взвешенный misclassification уровень через древовидный t.

      et=1j=1nwjj=1nwjI(yjy^сумка,tj).

      error устанавливает любые наблюдения, которые отменяются для всех выбранных деревьев к предсказанному, взвешенному, самому популярному классу по всем учебным ответам. Если существует несколько самых популярных классов, error считает тот перечисленным сначала в свойстве ClassNames модели TreeBagger самое популярное.

  • Если вы задаете 'Mode','Ensemble', то взвешенный misclassification уровень является последним элементом совокупного, взвешенного misclassification вектора уровня.