exponenta event banner

oobError

Класс: TreeBagger

Ошибка вне пакета

Синтаксис

err = oobError(B)
err = oobError(B,'param1',val1,'param2',val2,...)

Описание

err = oobError(B) вычисляет вероятность неправильной классификации (для деревьев классификации) или среднюю квадратичную ошибку (для деревьев регрессии) для наблюдений вне пакета в учебных данных, используя обученный баггер B. err - вектор длины NTrees, где NTrees - количество деревьев в ансамбле.

err = oobError(B,'param1',val1,'param2',val2,...) указывает дополнительные пары имя/значение параметра:

'Mode'Вектор символов или строковый скаляр, указывающий способ oobError вычисляет ошибки. Если установлено значение 'cumulative' (по умолчанию), метод вычисляет кумулятивные ошибки и err - вектор длины NTrees, где первый элемент дает ошибку из trees(1), второй элемент дает ошибку из trees(1:2) и т.д., до trees(1:NTrees). Если установлено значение 'individual', err - вектор длины NTrees, где каждый элемент является ошибкой из каждого дерева в ансамбле. Если установлено значение 'ensemble', err скаляр, показывающий совокупную ошибку для всего ансамбля.
'Trees'Вектор индексов, указывающих, какие деревья следует включить в этот расчет. По умолчанию этот аргумент имеет значение 'all' и метод использует все деревья. Если 'Trees' является числовым вектором, метод возвращает вектор длины NTrees для 'cumulative' и 'individual' режимы, где NTrees - количество элементов во входном векторе и скаляр для 'ensemble' режим. Например, в 'cumulative' режим, первый элемент дает ошибку из trees(1), второй элемент дает ошибку от trees(1:2) и т.д.
'TreeWeights'Вектор весов деревьев. Этот вектор должен иметь ту же длину, что и 'Trees' вектор. oobError использует эти веса, чтобы объединить выходные данные указанных деревьев, взяв средневзвешенное вместо простого невзвешенного большинства голосов. Этот аргумент нельзя использовать в 'individual' режим.

Алгоритмы

oobError оценивает взвешенную ошибку ансамбля для наблюдений вне пакета. То есть oobError применяется error к учебным данным, хранящимся во входных данных TreeBagger модель Bи выбирает наблюдения вне пакета для каждого дерева, чтобы составить ошибку ансамбля.

  • B.X и B.Y являются предикторами обучающих данных и ответами соответственно.

  • B.OOBIndices указывает, какие наблюдения находятся вне пакета для каждого дерева в ансамбле.

  • B.W определяет веса наблюдения.

  • Дополнительно:

    • Использование 'Mode' аргумент пары имя-значение, можно указать для возврата отдельной взвешенной ошибки ансамбля для каждого дерева или всей взвешенной ошибки ансамбля. По умолчанию oobError возвращает кумулятивную взвешенную ошибку ансамбля.

    • Использование 'Trees' аргумент пары имя-значение, можно выбрать, какие деревья использовать в вычислениях ошибок ансамбля.

    • Использование 'TreeWeights' аргумент пары имя-значение, можно присвоить каждому дереву вес.

oobError применяет алгоритмы, описанные ниже. Дополнительные сведения см. в разделе error и predict.

Для регрессионных проблем: oobError возвращает взвешенный MSE.

  1. oobError предсказывает ответы для всех наблюдений вне пакета.

  2. Оценка MSE зависит от значения 'Mode'.

    • При указании 'Mode','Individual', то oobError устанавливает любое из наблюдений мешков в пределах выбранного дерева в средневзвешенное значение выборки наблюдаемых обучающих данных. Затем, oobError вычисляет взвешенный MSE для каждого выбранного дерева.

    • При указании 'Mode','Cumulative', то ooError возвращает вектор кумулятивных взвешенных MSE, где MSEt - кумулятивный взвешенный MSE для выбранного дерева t. Для вычисления MSEt для каждого наблюдения, которое находится вне пакета по крайней мере для одного дерева через дерево t, oobError вычисляет накопленное взвешенное среднее прогнозируемых ответов через дерево t. oobError устанавливает наблюдения, которые находятся в пакете для всех выбранных деревьев через дерево t, в средневзвешенное значение выборки наблюдаемых обучающих данных. Затем, oobError вычисляет MSEt.

    • При указании 'Mode','Ensemble', то для каждого наблюдения, которое находится вне пакета по меньшей мере для одного дерева, oobError вычисляет средневзвешенное значение по всем выбранным деревьям. oobError устанавливает наблюдения, которые находятся в пакете для всех выбранных деревьев, в средневзвешенное значение выборки наблюдаемых обучающих данных. Затем, oobError вычисляет взвешенный MSE, который совпадает с окончательным, кумулятивным, взвешенным MSE.

В проблемах классификации, oobError возвращает взвешенный коэффициент неправильной классификации.

  1. oobError предсказывает классы для всех наблюдений вне пакета.

  2. Взвешенная оценка коэффициента неправильной классификации зависит от значения 'Mode'.

    • При указании 'Mode','Individual', то oobError устанавливает любые наблюдения мешков в выбранном дереве в прогнозируемый, взвешенный, наиболее популярный класс по всем ответам обучения. Если существует несколько наиболее популярных классов, error рассматривает тот, который указан первым в ClassNames имущества TreeBagger модель самая популярная. Затем, oobError вычисляет взвешенную частоту неправильной классификации для каждого выбранного дерева.

    • При указании 'Mode','Cumulative', то ooError возвращает вектор кумулятивных, взвешенных коэффициентов неправильной классификации, где et * - кумулятивный, взвешенный коэффициент неправильной классификации для выбранного дерева t. Вычислить et * для каждого наблюдения, которое находится вне пакета по крайней мере для одного дерева через дерево t,oobError находит прогнозируемый, совокупный, взвешенный наиболее популярный класс через дерево t. oobError устанавливает наблюдения, которые находятся в мешке для всех выбранных деревьев через дерево t, в взвешенный, наиболее популярный класс по всем обучающим ответам. Если существует несколько наиболее популярных классов, error рассматривает тот, который указан первым в ClassNames имущества TreeBagger модель самая популярная. Затем, oobError вычисляет et *.

    • При указании 'Mode','Ensemble', то для каждого наблюдения, которое находится вне пакета по меньшей мере для одного дерева, oobError вычисляет взвешенный, наиболее популярный класс по всем выбранным деревьям. oobError устанавливает наблюдения, которые находятся в мешке для всех выбранных деревьев через дерево t, в прогнозируемый, взвешенный, наиболее популярный класс по всем обучающим ответам. Если существует несколько наиболее популярных классов, error рассматривает тот, который указан первым в ClassNames имущества TreeBagger модель самая популярная. Затем, oobError вычисляет взвешенный коэффициент неправильной классификации, который совпадает с окончательным, кумулятивным, взвешенным коэффициентом неправильной классификации.