Класс: CompactTreeBagger
Ошибка (вероятность неправильной классификации или MSE)
err = error(B,TBLnew,Ynew)
err = error(B,Xnew,Ynew)
err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...)
err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...)
err = error(B,TBLnew,Ynew) вычисляет вероятность неправильной классификации для деревьев классификации или среднеквадратичную ошибку (MSE) для деревьев регрессии для каждого дерева, для предикторов, содержащихся в таблице TBLnew данный истинный ответ Ynew. Вы можете опустить Ynew если TBLnew содержит переменную ответа. Если вы тренировались B используя образцы данных, содержащиеся в таблице, входные данные для этого метода также должны быть в таблице.
err = error(B,Xnew,Ynew) вычисляет вероятность неправильной классификации для деревьев классификации или среднеквадратичную ошибку (MSE) для деревьев регрессии для каждого дерева, для предикторов, содержащихся в матрице Xnew данный истинный ответ Ynew. Если вы тренировались B используя данные выборки, содержащиеся в матрице, входные данные для этого метода также должны быть в матрице.
Для классификации, Ynew может быть числовым вектором, символьной матрицей, строковым массивом, массивом ячеек символьных векторов, категориальным вектором или логическим вектором. Для регрессии Y должен быть числовым вектором. err является вектором с одной мерой ошибки для каждого из NTrees деревья в ансамбле B.
err = error(B,TBLnew,Ynew,'param1',val1,'param2',val2,...) или err = error(B,Xnew,Ynew,'param1',val1,'param2',val2,...) указывает дополнительные пары имя-значение параметра:
'Mode' | Вектор символов или строковый скаляр, указывающий, как метод вычисляет ошибки. Если установлено значение 'cumulative' (по умолчанию), error вычисляет совокупные ошибки и err - вектор длины NTrees, где первый элемент дает ошибку из trees(1), второй элемент дает ошибку изtrees(1:2) и т.д., до trees(1:NTrees). Если установлено значение 'individual', err - вектор длины NTrees, где каждый элемент является ошибкой из каждого дерева в ансамбле. Если установлено значение 'ensemble', err скаляр, показывающий совокупную ошибку для всего ансамбля. |
'Weights' | Вектор весов наблюдения для усреднения ошибок. По умолчанию вес каждого наблюдения равен 1. Длина этого вектора должна быть равна количеству строк в X. |
'Trees' | Вектор индексов, указывающих, какие деревья следует включить в этот расчет. По умолчанию этот аргумент имеет значение 'all' и метод использует все деревья. Если 'Trees' является числовым вектором, метод возвращает вектор длины NTrees для 'cumulative' и 'individual' режимы, где NTrees - количество элементов во входном векторе и скаляр для 'ensemble' режим. Например, в 'cumulative' режим, первый элемент дает ошибку из trees(1), второй элемент дает ошибку от trees(1:2) и т.д. |
'TreeWeights' | Вектор весов деревьев. Этот вектор должен иметь ту же длину, что и 'Trees' вектор. Метод использует эти веса, чтобы объединить выходные данные из указанных деревьев, взяв средневзвешенное вместо простого невзвешенного большинства голосов. Этот аргумент нельзя использовать в 'individual' режим. |
'UseInstanceForTree' | Логическая матрица размера Nobsоколо-NTrees указание деревьев, которые должны использоваться для прогнозирования каждого наблюдения. По умолчанию метод использует все деревья для всех наблюдений. |
При оценке ошибки ансамбля:
Использование 'Mode' аргумент пары «имя-значение» можно указать для возврата ошибки любым из следующих трех способов:
Ошибка для отдельных деревьев в ансамбле
Совокупная ошибка по всем деревьям
Ошибка для всего ансамбля
Использование 'Trees' аргумент пары имя-значение, можно указать, какие деревья использовать в вычислениях ошибок ансамбля.
Использование 'UseInstanceForTree' аргумент пары имя-значение, можно указать, какие наблюдения во входных данных (X и Y) для использования в вычислении ошибок ансамбля для каждого выбранного дерева.
Использование 'Weights' аргумент пары имя-значение, можно приписать каждое наблюдение с помощью веса. Для следующих формул wj - вес наблюдения j.
Использование 'TreeWeights' аргумент пары имя-значение, можно присвоить каждому дереву вес.
Для регрессионных проблем: error оценивает взвешенную MSE ансамбля пакетных регрессионных деревьев для прогнозирования Y данный X с использованием выбранных деревьев и наблюдений.
error предсказывает ответы для выбранных наблюдений в X использование выбранных деревьев регрессии в ансамбле.
Оценка MSE зависит от значения 'Mode'.
При указании 'Mode','Individual', то взвешенный MSE для дерева t равен
tj) 2.
tj - прогнозируемый отклик наблюдения j из выбранного регрессионного дерева t.error устанавливает для всех невыбранных наблюдений в пределах выбранного дерева средневзвешенное значение выборки наблюдаемых обучающих данных.
При указании 'Mode','Cumulative'затем взвешенный MSE представляет собой вектор размера T *, содержащий накопленные взвешенные MSE по выбранным деревьям T * ≤ T.error выполните следующие действия для оценки MSEt *, кумулятивного взвешенного MSE с использованием первых t выбранных деревьев.
Для выбранного наблюдения j, j = 1,..., n ,error оценивает tj, средневзвешенное предсказание среди первых t выбранных деревьев (подробнее см.predict). Для этого расчета, error использует веса дерева.
error оценивает кумулятивный взвешенный MSE через дерево t.
tj) 2.
error устанавливает невыбранные для всех выбранных деревьев наблюдения в средневзвешенное значение выборки наблюдаемых обучающих данных.
При указании 'Mode','Ensemble'затем взвешенный MSE является последним элементом кумулятивного взвешенного вектора MSE.
Для проблем классификации, error оценивает взвешенный коэффициент неправильной классификации ансамбля фасованных деревьев классификации для прогнозирования Y данный X с использованием выбранных деревьев и наблюдений.
При указании 'Mode','Individual', то взвешенная частота неправильной классификации для дерева t равна
).
tj - прогнозируемый класс для выбранного наблюдения j с использованием из выбранного дерева классификации t.error устанавливает все невыбранные наблюдения в пределах выбранного дерева для прогнозируемого, взвешенного, наиболее популярного класса по всем ответам на обучение. Если существует несколько наиболее популярных классов, error рассматривает тот, который указан первым в ClassNames имущества TreeBagger модель самая популярная.
При указании 'Mode','Cumulative' затем взвешенная скорость неправильной классификации представляет собой вектор размера T *, содержащий кумулятивные взвешенные скорости неправильной классификации по выбранным деревьям T * ≤ T.error следует этим шагам, чтобы оценить et *, кумулятивный, взвешенный коэффициент неправильной классификации с использованием первых t выбранных деревьев.
Для выбранного наблюдения j, j = 1,..., n ,error оценивает tj, взвешенный, наиболее популярный класс среди первых выбранных деревьев (подробнее см.predict). Для этого расчета, error использует веса дерева.
error оценивает кумулятивную, взвешенную скорость неправильной классификации через дерево t.
).
error устанавливает любые наблюдения, которые не выбраны для всех выбранных деревьев, в прогнозируемый, взвешенный, наиболее популярный класс по всем ответам обучения. Если существует несколько наиболее популярных классов, error рассматривает тот, который указан первым в ClassNames имущества TreeBagger модель самая популярная.
При указании 'Mode','Ensemble', то взвешенный коэффициент неправильной классификации является последним элементом кумулятивного, взвешенного вектора коэффициента неправильной классификации.