exponenta event banner

cvshrink

Ансамбль усадки (отсечения) перекрестной проверки

Синтаксис

vals = cvshrink(ens)
[vals,nlearn] = cvshrink(ens)
[vals,nlearn] = cvshrink(ens,Name,Value)

Описание

vals = cvshrink(ens) возвращает Lоколо-T матрица с перекрестно подтвержденными значениями среднеквадратической ошибки. L - количество lambda значения в ens.Regularization структура. T - количество threshold значения на слабых весах учащихся. Если ens не имеет Regularization свойство, заполненное regularize метод, пройти lambda пара имя-значение.

[vals,nlearn] = cvshrink(ens) возвращает Lоколо-T матрица среднего числа учащихся в перекрестно проверенном ансамбле.

[vals,nlearn] = cvshrink(ens,Name,Value) cross проверяет с дополнительными опциями, указанными одним или несколькими Name,Value аргументы пары. Можно указать несколько аргументов пары имя-значение в любом порядке как Name1,Value1,…,NameN,ValueN.

Входные аргументы

ens

Регрессионный ансамбль, созданный с помощью fitrensemble.

Аргументы пары «имя-значение»

Укажите дополнительные пары, разделенные запятыми Name,Value аргументы. Name является именем аргумента и Value - соответствующее значение. Name должен отображаться внутри кавычек. Можно указать несколько аргументов пары имен и значений в любом порядке как Name1,Value1,...,NameN,ValueN.

'cvpartition'

Раздел, созданный с помощью cvpartition для использования в дереве с перекрестной проверкой. Одновременно можно использовать только одну из следующих четырех опций: 'kfold', 'holdout', 'leaveout', или 'cvpartition'.

'holdout'

Проверка отсутствия проверяет указанную часть данных и использует остальные данные для обучения. Укажите числовой скаляр из 0 кому 1. Для создания дерева с перекрестной проверкой можно одновременно использовать только одну из следующих четырех опций: 'kfold', 'holdout', 'leaveout', или 'cvpartition'.

'kfold'

Количество складок для использования в перекрестно проверенном дереве, положительное целое число. Если метод перекрестной проверки не задан, cvshrink использует 10-кратную перекрестную проверку. Одновременно можно использовать только одну из следующих четырех опций: 'kfold', 'holdout', 'leaveout', или 'cvpartition'.

По умолчанию: 10

'lambda'

Вектор неотрицательных значений параметров регуляризации для лассо. Если пустое, cvshrink не выполняет перекрестную проверку.

По умолчанию: []

'leaveout'

Используйте перекрестную проверку «оставить один», установив значение 'on'. Одновременно можно использовать только одну из следующих четырех опций: 'kfold', 'holdout', 'leaveout', или 'cvpartition'.

'threshold'

Числовой вектор с более низкими отсечениями весов для слабых учеников. cvshrink отбрасывает учеников с весами ниже threshold в его вычислении перекрестной проверки.

По умолчанию: 0

Выходные аргументы

vals

Lоколо-T матрица с перекрестно подтвержденными значениями среднеквадратической ошибки. L - количество значений параметра регуляризации 'lambda', и T - количество 'threshold' значения на слабых весах учащихся.

nlearn

Lоколо-T матрица с перекрестно проверенными значениями среднего числа учащихся в коллективе перекрестно проверенных.L - количество значений параметра регуляризации 'lambda', и T - количество 'threshold' значения на слабых весах учащихся.

Примеры

развернуть все

Создание регрессионного ансамбля для прогнозирования пробега из carsmall данные. Перекрестная проверка ансамбля.

Загрузить carsmall набор данных и выбор перемещения, лошадиных сил и веса транспортного средства в качестве предикторов.

load carsmall
X = [Displacement Horsepower Weight];

Вы можете обучить ансамбль пакетированных регрессионных деревьев.

ens = fitrensemble(X,Y,'Method','Bag')

fircensemble использует объект дерева шаблонов по умолчанию templateTree() как слабый ученик, когда 'Method' является 'Bag'. В этом примере для воспроизводимости укажите 'Reproducible',true при создании объекта шаблона дерева, а затем использовании объекта в качестве слабого ученика.

rng('default') % For reproducibility
t = templateTree('Reproducible',true); % For reproducibiliy of random predictor selections
ens = fitrensemble(X,MPG,'Method','Bag','Learners',t);

Укажите значения для lambda и threshold. Эти значения используются для перекрестной проверки ансамбля.

[vals,nlearn] = cvshrink(ens,'lambda',[.01 .1 1],'threshold',[0 .01 .1])
vals = 3×3

   18.9150   19.0092  128.5935
   18.9099   18.9504  128.8449
   19.0328   18.9636  116.8500

nlearn = 3×3

   13.7000   11.6000    4.1000
   13.7000   11.7000    4.1000
   13.9000   11.6000    4.1000

Ясно, что установка порога 0.1 приводит к недопустимым ошибкам, в то время как порог 0.01 дает аналогичные ошибки пороговому значению 0. Среднее число учащихся с пороговым значением 0.01 является около 11.4, в то время как среднее число составляет около 13.8 когда пороговое значение 0.

См. также

|