cvloss

Ошибка классификации перекрестной проверкой

Синтаксис

E = cvloss(tree)

[E,SE] =
cvloss(tree)

[E,SE,Nleaf]
= cvloss(tree)

[E,SE,Nleaf,BestLevel]
= cvloss(tree)

[___] = cvloss(tree,Name,Value)

Описание

E = cvloss(tree) возвращает перекрестную подтвержденную ошибку классификации (потеря) для tree, дерево классификации. cvloss использование метода расслоило разделение, чтобы создать перекрестные подтвержденные наборы. Таким образом, для каждого сгиба каждый раздел данных имеет примерно те же пропорции класса, как в данных раньше обучал tree.

[E,SE] = cvloss(tree) возвращает стандартную погрешность E.

[E,SE,Nleaf] = cvloss(tree) возвращает количество листов tree.

[E,SE,Nleaf,BestLevel] = cvloss(tree) возвращает оптимальный уровень сокращения для tree.

[___] = cvloss(tree,Name,Value) крест подтверждает с дополнительными опциями, заданными одним или несколькими Name,Value парные аргументы, с помощью любого из предыдущих синтаксисов. Можно задать несколько аргументов пары "имя-значение" в любом порядке как Name1,Value1,…,NameN,ValueN.

Входные параметры

развернуть все

`tree` — Обученное дерево классификации
`ClassificationTree` объект модели

Обученное дерево классификации в виде ClassificationTree объект модели, произведенный fitctree.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

`'Subtrees'` — Сокращение уровня
0 (значений по умолчанию) | вектор из неотрицательных целых чисел | `'all'`

Сокращение уровня в виде разделенной запятой пары, состоящей из 'Subtrees' и вектор из неотрицательных целых чисел в порядке возрастания или 'all'.

Если вы задаете вектор, то всеми элементами должен быть, по крайней мере, 0 и в большей части max(tree.PruneList). 0 указывает на полное, несокращенное дерево и max(tree.PruneList) указывает на полностью сокращенное дерево (i.e., только корневой узел).

Если вы задаете 'all'то cvloss работает со всеми поддеревьями (т.е. целая последовательность сокращения). Эта спецификация эквивалентна использованию 0:max(tree.PruneList).

cvloss чернослив tree к каждому уровню, обозначенному в Subtrees, и затем оценивает соответствующие выходные аргументы. Размер Subtrees определяет размер некоторых выходных аргументов.

Вызвать Subtrees, свойства PruneList и PruneAlpha из tree mustBeNonempty. Другими словами, вырастите tree установкой 'Prune','on', или путем сокращения tree использование prune.

Пример: 'Subtrees','all'

Типы данных: single | double | char | string

`'TreeSize'` — Древовидный размер
`'se'` (значение по умолчанию) | `'min'`

Древовидный размер в виде разделенной запятой пары, состоящей из 'TreeSize' и одно из следующих значений:

'se' — cvloss использует самое маленькое дерево, стоимость которого в одной стандартной погрешности минимальной стоимости.
'min' — cvloss использует минимальное дерево стоимости.

Пример: 'TreeSize','min'

`'KFold'` — Количество выборок перекрестной проверки
10 (значений по умолчанию) | положительное целочисленное значение, больше, чем 1

Количество выборок перекрестной проверки в виде разделенной запятой пары, состоящей из KFold и положительного целочисленного значения, больше, чем 1.

Пример: 'KFold',8

Выходные аргументы

развернуть все

`E` — Ошибка классификации перекрестных проверок
числовой вектор | скалярное значение

Ошибка классификации перекрестных проверок (потеря), возвращенная как вектор или скаляр в зависимости от установки Subtrees пара "имя-значение".

`SE` — Стандартная погрешность
числовой вектор | скалярное значение

Стандартная погрешность E, возвращенный как вектор или скаляр в зависимости от установки Subtrees пара "имя-значение".

`Nleaf` — Количество вершин
числовой вектор | скалярное значение

Количество вершин в tree, возвращенный как вектор или скаляр в зависимости от установки Subtrees пара "имя-значение". Вершины являются терминальными узлами, которые дают классификации, не разделения.

`BestLevel` — Лучше всего сокращение уровня
скалярное значение

Лучше всего сокращая уровень, возвращенный как скалярное значение. По умолчанию, скаляр, представляющий самый большой уровень сокращения, который достигает значения E в SE из минимальной ошибки. Если вы устанавливаете TreeSize к 'min', BestLevel наименьшее значение в Subtrees.

Примеры

развернуть все

Вычислите ошибку перекрестной проверки

Скрипт Open Live Script

Вычислите ошибку перекрестной проверки для дерева классификации по умолчанию.

Загрузите ionosphere набор данных.

load ionosphere

Вырастите дерево классификации использование целого набора данных.

Mdl = fitctree(X,Y);

Вычислите ошибку перекрестной проверки.

rng(1); % For reproducibility
E = cvloss(Mdl)

E = 0.1168

E 10-кратная misclassification ошибка.

Найдите лучший уровень сокращения Используя перекрестную проверку

Скрипт Open Live Script

Примените перекрестную проверку k-сгиба, чтобы найти, что лучший уровень сокращает дерево классификации для всех его поддеревьев.

Загрузите ionosphere набор данных.

load ionosphere

Вырастите дерево классификации использование целого набора данных. Просмотрите получившееся дерево.

Mdl = fitctree(X,Y);
view(Mdl,'Mode','graph')

Вычислите 5-кратную ошибку перекрестной проверки для каждого поддерева за исключением самого высокого уровня сокращения. Задайте, чтобы возвратить лучший уровень сокращения по всем поддеревьям.

rng(1); % For reproducibility
m = max(Mdl.PruneList) - 1

m = 7

[E,~,~,bestLevel] = cvloss(Mdl,'SubTrees',0:m,'KFold',5)

bestLevel = 6

Из 7 сокращая уровни, лучшим уровнем сокращения является 6.

Сократите дерево к лучшему уровню. Просмотрите получившееся дерево.

MdlPrune = prune(Mdl,'Level',bestLevel);
view(MdlPrune,'Mode','graph')

Альтернативы

Можно создать перекрестную подтвержденную древовидную модель с crossval, и вызовите kfoldLoss вместо cvloss. Если вы собираетесь исследовать перекрестное подтвержденное дерево несколько раз, то альтернатива может сэкономить время.

Однако различающийся cvloss, kfoldLoss не возвращает SE, Nleaf, или BestLevel. kfoldLoss также не позволяет вам исследовать любую ошибку кроме ошибки классификации.

Документация

cvloss

Синтаксис

Описание

Входные параметры

`tree` — Обученное дерево классификации
`ClassificationTree` объект модели

Аргументы в виде пар имя-значение

`'Subtrees'` — Сокращение уровня
0 (значений по умолчанию) | вектор из неотрицательных целых чисел | `'all'`

`'TreeSize'` — Древовидный размер
`'se'` (значение по умолчанию) | `'min'`

`'KFold'` — Количество выборок перекрестной проверки
10 (значений по умолчанию) | положительное целочисленное значение, больше, чем 1

Выходные аргументы

`E` — Ошибка классификации перекрестных проверок
числовой вектор | скалярное значение

`SE` — Стандартная погрешность
числовой вектор | скалярное значение

`Nleaf` — Количество вершин
числовой вектор | скалярное значение

`BestLevel` — Лучше всего сокращение уровня
скалярное значение

Примеры

Вычислите ошибку перекрестной проверки

Найдите лучший уровень сокращения Используя перекрестную проверку

Альтернативы

Смотрите также

Документация Statistics and Machine Learning Toolbox

Поддержка

Документация

cvloss

Синтаксис

Описание

Входные параметры

tree — Обученное дерево классификации ClassificationTree объект модели

Аргументы в виде пар имя-значение

'Subtrees' — Сокращение уровня 0 (значений по умолчанию) | вектор из неотрицательных целых чисел | 'all'

'TreeSize' — Древовидный размер 'se' (значение по умолчанию) | 'min'

'KFold' — Количество выборок перекрестной проверки 10 (значений по умолчанию) | положительное целочисленное значение, больше, чем 1

Выходные аргументы

E — Ошибка классификации перекрестных проверок числовой вектор | скалярное значение

SE — Стандартная погрешность числовой вектор | скалярное значение

Nleaf — Количество вершин числовой вектор | скалярное значение

BestLevel — Лучше всего сокращение уровня скалярное значение

Примеры

Вычислите ошибку перекрестной проверки

Найдите лучший уровень сокращения Используя перекрестную проверку

Альтернативы

Смотрите также

Документация Statistics and Machine Learning Toolbox

Поддержка

`tree` — Обученное дерево классификации
`ClassificationTree` объект модели

`'Subtrees'` — Сокращение уровня
0 (значений по умолчанию) | вектор из неотрицательных целых чисел | `'all'`

`'TreeSize'` — Древовидный размер
`'se'` (значение по умолчанию) | `'min'`

`'KFold'` — Количество выборок перекрестной проверки
10 (значений по умолчанию) | положительное целочисленное значение, больше, чем 1

`E` — Ошибка классификации перекрестных проверок
числовой вектор | скалярное значение

`SE` — Стандартная погрешность
числовой вектор | скалярное значение

`Nleaf` — Количество вершин
числовой вектор | скалярное значение

`BestLevel` — Лучше всего сокращение уровня
скалярное значение