oobError

Класс: TreeBagger

Ошибка вне сумки

Синтаксис

err = oobError(B)
err = oobError(B,'param1',val1,'param2',val2,...)

Описание

err = oobError(B) вычисляет вероятность неправильной классификации (для деревьев классификации) или среднюю квадратичную невязку (для деревьев регрессии) для наблюдений вне сумки в обучающих данных, используя обученный баггер B. err является вектором длины NTrees, где NTrees - количество деревьев в ансамбле.

err = oobError(B,'param1',val1,'param2',val2,...) задает необязательные пары имя/значение параметра:

'Mode'Вектор символов или строковый скаляр, указывающий как oobError вычисляет ошибки. Если установлено значение 'cumulative' (по умолчанию), метод вычисляет совокупные ошибки и err является вектором длины NTrees, где первый элемент выдает ошибку от trees(1), второй элемент дает ошибку от trees(1:2) и т.д., до trees(1:NTrees). Если установлено значение 'individual', err является вектором длины NTrees, где каждый элемент является ошибкой от каждого дерева в ансамбле. Если установлено значение 'ensemble', err является скаляром, показывающим совокупную ошибку для всего ансамбля.
'Trees'Вектор индексов, указывающих, какие деревья включать в этот расчет. По умолчанию для этого аргумента задано значение 'all' и метод использует все деревья. Если 'Trees' является числовым вектором, метод возвращает вектор длины NTrees для 'cumulative' и 'individual' режимы, где NTrees - количество элементов в векторе вход и скаляр для 'ensemble' режим. Для примера, в 'cumulative' mode, первый элемент выдает ошибку от trees(1), второй элемент дает ошибку от trees(1:2) и т.д.
'TreeWeights'Вектор весов дерева. Этот вектор должен иметь ту же длину, что и 'Trees' вектор. oobError использует эти веса для объединения выхода из заданных деревьев путем взятия взвешенного среднего значения вместо простого невзвешенного большинства голосов. Вы не можете использовать этот аргумент в 'individual' режим.

Алгоритмы

oobError оценивает взвешенную ошибку ансамбля для наблюдений вне мешка. То есть oobError применяется error к обучающим данным, хранящимся в входе TreeBagger модели B, и выбирает наблюдения вне мешка для каждого дерева, чтобы составить ошибку ансамбля.

  • B.X и B.Y являются предикторами обучающих данных и ответами, соответственно.

  • B.OOBIndices определяет, какие наблюдения находятся вне мешка для каждого дерева ансамбля.

  • B.W задает веса наблюдений.

  • Опционально:

    • Использование 'Mode' Аргумент пары "имя-значение" можно задать, чтобы вернуть индивидуальную взвешенную ошибку ансамбля для каждого дерева или всю взвешенную ошибку ансамбля. По умолчанию oobError возвращает совокупную взвешенную ошибку ансамбля.

    • Использование 'Trees' аргумент пары "имя-значение" можно выбрать, какие деревья использовать в вычислениях ошибок ансамбля.

    • Использование 'TreeWeights' Аргумент пары "имя-значение" можно атрибутировать каждое дерево весом.

oobError применяет алгоритмы, описанные ниже. Для получения дополнительной информации смотрите error и predict.

Для задач регрессии, oobError возвращает взвешенный MSE.

  1. oobError предсказывает ответы для всех наблюдений вне мешка.

  2. Оценка MSE зависит от значения 'Mode'.

    • Если вы задаете 'Mode','Individual', затем oobError устанавливает любые наблюдения в мешке в выбранном дереве в средневзвешенное среднее значение выборки наблюдаемых, обучающих, откликов данных. Затем, oobError вычисляет взвешенное MSE для каждого выбранного дерева.

    • Если вы задаете 'Mode','Cumulative', затем ooError возвращает вектор совокупных взвешенных MSE, где t MSE является совокупным взвешенным MSE для выбранных древовидных t. Чтобы вычислить t MSE, для каждого наблюдения, которое находится вне мешка по крайней мере для одного дерева через t дерева, oobError вычисляет совокупное, взвешенное среднее предсказанных откликов через древовидные t. oobError устанавливает наблюдения, которые находятся в мешке для всех выбранных деревьев через древовидное t к взвешенному выборочному среднему значению наблюдаемых откликов обучающих данных. Затем, oobError вычисляет t MSE.

    • Если вы задаете 'Mode','Ensemble'затем для каждого наблюдения, которое выходит из мешка по крайней мере для одного дерева, oobError вычисляет средневзвешенное значение по всем выбранным деревьям. oobError устанавливает наблюдения, которые находятся в мешке для всех выбранных деревьев, в средневзвешенное среднее значение выборки наблюдаемых откликов обучающих данных. Затем, oobError вычисляет взвешенный MSE, который совпадает с конечным, совокупным, взвешенным MSE.

В задачах классификации oobError возвращает взвешенный коэффициент неправильной классификации.

  1. oobError предсказывает классы для всех наблюдений вне мешка.

  2. Взвешенная оценка скорости неправильной классификации зависит от значения 'Mode'.

    • Если вы задаете 'Mode','Individual', затем oobError устанавливает любые наблюдения в мешке в выбранном дереве на предсказанный, взвешенный, самый популярный класс по всем откликам обучения. Если существует несколько наиболее популярных классов, error рассматривает тот, который указан первым в ClassNames свойство TreeBagger модель самая популярная. Затем, oobError вычисляет взвешенную скорость неправильной классификации для каждого выбранного дерева.

    • Если вы задаете 'Mode','Cumulative', затем ooError возвращает вектор совокупных взвешенных частот неправильной классификации, где et* - совокупный, взвешенный коэффициент ошибочной классификации для выбранных древовидных t. Для вычисления et*, для каждого наблюдения, которое выходит из мешка по крайней мере для одного дерева через t дерева, oobError находит предсказанный, совокупный, взвешенный самый популярный класс через древовидные t. oobError устанавливает наблюдения, которые находятся в мешке для всех выбранных деревьев через дерево t к взвешенному, наиболее популярному классу по всем откликам обучения. Если существует несколько наиболее популярных классов, error рассматривает тот, который указан первым в ClassNames свойство TreeBagger модель самая популярная. Затем, oobError вычисляет et*.

    • Если вы задаете 'Mode','Ensemble'затем для каждого наблюдения, которое выходит из мешка по крайней мере для одного дерева, oobError вычисляет взвешенный, самый популярный класс по всем выбранным деревьям. oobError устанавливает наблюдения, которые находятся в мешке для всех выбранных деревьев через дерево t к предсказанному, взвешенному, наиболее популярному классу по всем откликам обучения. Если существует несколько наиболее популярных классов, error рассматривает тот, который указан первым в ClassNames свойство TreeBagger модель самая популярная. Затем, oobError вычисляет взвешенный коэффициент неправильной классификации, который аналогичен конечному, совокупному, взвешенному коэффициенту неправильной классификации.