error

Класс: TreeBagger

Ошибка (вероятность неправильной классификации или MSE)

Синтаксис

err = error(B,TBLnew,Ynew)
err = error(B,Xnew,Ynew)
err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)
err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...)

Описание

err = error(B,TBLnew,Ynew) вычисляет вероятность неправильной классификации для деревьев классификации или средней квадратичной невязки (MSE) для деревьев регрессии для каждого дерева, для предикторов, содержащихся в таблице TBLnew заданный истинный ответ Ynew. Можно опускать Ynew если TBLnew содержит переменную отклика. Если вы тренировались B используя выборочные данные, содержащуюся в таблице, тогда входные данные для этого метода должны также быть в таблице.

err = error(B,Xnew,Ynew) вычисляет вероятность неправильной классификации для деревьев классификации или средней квадратичной невязки (MSE) для деревьев регрессии для каждого дерева, для предикторов, содержащихся в матрице Xnew заданный истинный ответ Ynew. Если вы тренировались B используя выборочные данные, содержащуюся в матрице, тогда входные данные для этого метода должны также быть в матрице.

Для классификации, Ynew может быть числовым вектором, матрицей символа, строковыми массивами, массивом ячеек векторов символов, категориальным вектором или логическим вектором. Для регрессии, Y должен быть числовым вектором. err является вектором с одной мерой ошибки для каждого из NTrees деревья в ансамбле B.

err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...) или err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...) задает необязательные пары "имя-значение" параметра:

'Mode'Вектор символов или строковый скаляр, указывающий, как метод вычисляет ошибки. Если установлено значение 'cumulative' (по умолчанию), error вычисляет совокупные ошибки и err является вектором длины NTrees, где первый элемент выдает ошибку от trees(1), второй элемент дает ошибку от trees(1:2) и т.д., до trees(1:NTrees). Если установлено значение 'individual', err является вектором длины NTrees, где каждый элемент является ошибкой от каждого дерева в ансамбле. Если установлено значение 'ensemble', err является скаляром, показывающим совокупную ошибку для всего ансамбля.
'Weights'Вектор весов наблюдений для усреднения ошибок. По умолчанию вес каждого наблюдения равен 1. Длина этого вектора должна быть равна количеству строк в X.
'Trees'Вектор индексов, указывающих, какие деревья включать в этот расчет. По умолчанию для этого аргумента задано значение 'all' и метод использует все деревья. Если 'Trees' является числовым вектором, метод возвращает вектор длины NTrees для 'cumulative' и 'individual' режимы, где NTrees - количество элементов в векторе вход и скаляр для 'ensemble' режим. Для примера, в 'cumulative' mode, первый элемент выдает ошибку от trees(1), второй элемент дает ошибку от trees(1:2) и т.д.
'TreeWeights'Вектор весов дерева. Этот вектор должен иметь ту же длину, что и 'Trees' вектор. Метод использует эти веса, чтобы объединить выход из заданных деревьев, взяв взвешенное среднее значение вместо простого невзвешенного большинства голосов. Вы не можете использовать этот аргумент в 'individual' режим.
'UseInstanceForTree'Логическая матрица размера Nobs-by- NTrees указание на то, какие деревья следует использовать для внесения предсказаний в каждое наблюдение. По умолчанию метод использует все деревья для всех наблюдений.

Алгоритмы

При оценке ошибки ансамбля:

  • Использование 'Mode' аргумент пары "имя-значение", можно задать, чтобы вернуть ошибку любым из следующих трех способов:

    • Ошибка для отдельных деревьев в ансамбле

    • Совокупная ошибка по всем деревьям

    • Ошибка для всего ансамбля

  • Использование 'Trees' аргумент пары "имя-значение" можно задать, какие деревья использовать в вычислениях ошибок ансамбля.

  • Использование 'UseInstanceForTree' Аргумент пары "имя-значение" можно задать какие наблюдения в входных данных (X и Y) для использования в вычислении ошибки ансамбля для каждого выбранного дерева.

  • Использование 'Weights' Аргумент пары "имя-значение" можно атрибутировать каждое наблюдение весом. Для следующих формул wj является весом j наблюдений.

  • Использование 'TreeWeights' Аргумент пары "имя-значение" можно атрибутировать каждое дерево весом.

Для задач регрессии, error оценивает взвешенное MSE ансамбля мешанных регрессионых деревьев для предсказания Y заданные X использование выбранных деревьев и наблюдений.

  1. error предсказывает ответы для выбранных наблюдений в X использование выбранных деревьев регрессии в ансамбле.

  2. Оценка MSE зависит от значения 'Mode'.

    • Если вы задаете 'Mode','Individual', тогда взвешенный MSE для древовидных t

      MSEt=1j=1nwjj=1nwj(yjy^tj)2.

      y^tj - предсказанная реакция j наблюдений из выбранных t регрессионного дерева. error устанавливает любые невыбранные наблюдения в выбранном дереве в средневзвешенное среднее значение выборки наблюдаемых откликов обучающих данных.

    • Если вы задаете 'Mode','Cumulative', тогда взвешенный MSE является вектором размера T* содержит совокупные взвешенные MSE по T*T выбранные деревья. error выполните эти шаги, чтобы оценить MSE t*, совокупный взвешенный MSE с использованием первого t выбранных деревьев.

      1. Для выбранных j наблюдения j = 1,..., n, error оценки y^bag,tj, взвешенное среднее значение предсказаний среди первых t выбранных деревьев (для получения дополнительной информации см. predict). Для этого расчета, error использует веса дерева.

      2. error оценивает совокупный взвешенный MSE через древовидные t.

        MSEt=1j=1nwjj=1nwj(yjy^bag,tj)2.

      error устанавливает наблюдения, которые не выбраны для всех выбранных деревьев, в средневзвешенное среднее значение выборки наблюдаемых откликов обучающих данных.

    • Если вы задаете 'Mode','Ensemble', тогда взвешенный MSE является последним элементом совокупного взвешенного вектора MSE.

Для задач классификации, error оценивает взвешенную скорость неправильной классификации ансамбля упакованных классификационных деревьев для предсказания Y заданные X использование выбранных деревьев и наблюдений.

  • Если вы задаете 'Mode','Individual', тогда взвешенный коэффициент неправильной классификации для древовидных t

    et=1j=1nwjj=1nwjI(yjy^tj).

    y^tj - предсказанный класс для выбранных j наблюдения, использующих из выбранных древовидных t классификации. error устанавливает любые невыбранные наблюдения в выбранном дереве на предсказанный, взвешенный, самый популярный класс по всем откликам обучения. Если существует несколько наиболее популярных классов, error рассматривает тот, который указан первым в ClassNames свойство TreeBagger модель самая популярная.

  • Если вы задаете 'Mode','Cumulative' тогда взвешенная скорость неправильной классификации является вектором размера T* содержащие совокупные взвешенные показатели ошибочной классификации по T*T выбранные деревья. error следуйте этим шагам, чтобы оценить et*, совокупный, взвешенный коэффициент неправильной классификации с использованием первого t выбранных деревьев.

    1. Для выбранных j наблюдения j = 1,..., n, error оценки y^bag,tj, взвешенный, самый популярный класс среди первых t выбранных деревьев (для получения дополнительной информации см. predict). Для этого расчета, error использует веса дерева.

    2. error оценивает совокупный, взвешенный уровень неправильной классификации через древовидные t.

      et=1j=1nwjj=1nwjI(yjy^bag,tj).

      error устанавливает любые наблюдения, которые не выбраны для всех выбранных деревьев, в предсказанный, взвешенный, самый популярный класс по всем откликам обучения. Если существует несколько наиболее популярных классов, error рассматривает тот, который указан первым в ClassNames свойство TreeBagger модель самая популярная.

  • Если вы задаете 'Mode','Ensemble', тогда взвешенная скорость неправильной классификации является последним элементом совокупного, взвешенного вектора скорости неправильной классификации.