Сравните точность двух моделей классификации с помощью новых данных
compareHoldout
статистически оценивает точность двух моделей классификации. Функция сначала сравнивает их предсказанные метки с истинными метками, и затем она обнаруживает, является ли различие между misclassification уровнями статистически значительным.
Можно определить, отличается ли точность моделей классификации или выполняет ли одна модель лучше, чем другой. compareHoldout
может провести несколько тестовых изменений Макнемэра, включая асимптотический тест, точно-условный тест и тест mid-p-value. Для чувствительной к стоимости оценки доступные тесты включают тест хи-квадрата (требует Optimization Toolbox™), и тест отношения правдоподобия.
возвращает тестовое решение в тестирование нулевой гипотезы что обученные модели h
= compareHoldout(C1
,C2
,T1
,T2
,ResponseVarName
)C1
классификации и
C2
имейте равную точность для предсказания истинных меток класса в ResponseVarName
переменная. Альтернативная гипотеза - то, что метки имеют неравную точность.
Первая модель C1
классификации использует данные о предикторе в
T1
, и вторая модель C2
классификации использует данные о предикторе в
T2
. Таблицы T1
и T2
должен содержать ту же переменную отклика, но может содержать различные наборы предикторов. По умолчанию программное обеспечение проводит mid-p-value тест Макнемэра, чтобы сравнить точность.
h
= 1 указывает на отклонение нулевой гипотезы на 5%-м уровне значения.
h
= 0 указывает на не отклонение нулевой гипотезы на 5%-м уровне.
Следующее является примерами тестов, которые можно провести:
Сравните точность простой модели классификации и модели, которая является более комплексной путем передачи того же набора данных о предикторе (то есть, T1
= T2
).
Сравните точность двух потенциально различных моделей с помощью двух потенциально различных наборов предикторов.
Выполните различные типы Выбора признаков. Например, можно сравнить точность модели, обученной с помощью набора предикторов с точностью одного обученного на подмножестве или различного набора тех предикторов. Можно выбрать набор предикторов произвольно или использовать метод выбора признаков, такой как PCA или последовательный выбор признаков (см. pca
и sequentialfs
).
возвращает тестовое решение в тестирование нулевой гипотезы что обученные модели h
= compareHoldout(C1
,C2
,T1
,T2
,Y
)C1
классификации и
C2
имейте равную точность для предсказания, что истинный класс маркирует Y
. Альтернативная гипотеза - то, что метки имеют неравную точность.
Первая модель C1
классификации использует данные о предикторе
T1
, и вторая модель C2
классификации использует данные о предикторе
T2
. По умолчанию программное обеспечение проводит mid-p-value тест Макнемэра, чтобы сравнить точность.
возвращает тестовое решение в тестирование нулевой гипотезы что обученные модели h
= compareHoldout(C1
,C2
,X1
,X2
,Y
)C1
классификации и
C2
имейте равную точность для предсказания, что истинный класс маркирует Y
. Альтернативная гипотеза - то, что метки имеют неравную точность.
Первая модель C1
классификации использует данные о предикторе
X1
, и вторая модель C2
классификации использует данные о предикторе
X2
. По умолчанию программное обеспечение проводит mid-p-value тест Макнемэра, чтобы сравнить точность.
задает опции с помощью одного или нескольких аргументов пары "имя-значение" в дополнение к комбинациям входных аргументов в предыдущих синтаксисах. Например, можно задать тип альтернативной гипотезы, задать тип теста и предоставить матрицу стоимости.h
= compareHoldout(___,Name,Value
)
compareHoldout
не сравнивает модели ECOC, состоявшие из линейных или моделей классификации ядер (то есть, ClassificationLinear
или ClassificationKernel
объекты модели). Сравнить ClassificationECOC
модели, состоявшие из линейных или моделей классификации ядер, используйте testcholdout
вместо этого.
Точно так же compareHoldout
не сравнивает ClassificationLinear
или ClassificationKernel
объекты модели. Чтобы сравнить эти модели, используйте testcholdout
вместо этого.
Один способ выполнить нечувствительный к стоимости выбор признаков:
Обучите первую модель классификации (C1
) использование полного предиктора установлено.
Обучите вторую модель классификации (C2
) использование уменьшаемого предиктора установлено.
Задайте X1
как полные данные о предикторе набора тестов и X2
как уменьшаемые данные о предикторе набора тестов.
Введите compareHoldout(C1,C2,X1,X2,Y,'Alternative','less')
. Если compareHoldout
возвращает 1
, затем существует достаточно доказательства, чтобы предположить, что модель классификации, которая использует меньше предикторов, выполняет лучше, чем модель, которая использует полный набор предиктора.
В качестве альтернативы можно оценить, существует ли значительная разница между точностью этих двух моделей. Чтобы выполнить эту оценку, удалите 'Alternative','less'
спецификация на шаге 4. compareHoldout
проводит двухсторонний тест и h = 0
указывает, что существует недостаточно доказательства, чтобы предложить различие в точности этих двух моделей.
Чувствительные к стоимости тесты выполняют числовую оптимизацию, которая требует дополнительных вычислительных ресурсов. Тест отношения правдоподобия проводит числовую оптимизацию косвенно путем нахождения корня множителя Лагранжа в интервале. Для некоторых наборов данных, если корень находится близко к контурам интервала, то метод может перестать работать. Поэтому, если вы имеете лицензию Optimization Toolbox, рассматриваете проведение чувствительного к стоимости теста хи-квадрата вместо этого. Для получения дополнительной информации смотрите CostTest
и чувствительное к стоимости тестирование.
Чтобы непосредственно сравнить точность двух наборов меток класса в предсказании набора истинных меток класса, используйте testcholdout
.
[1] Agresti, A. Анализ категориальных данных, 2-й Эд. John Wiley & Sons, Inc.: Хобокен, NJ, 2002.
[2] Fagerlan, M.W., С. Лидерсен и П. Лаак. “Тест Макнемэра для Бинарных Данных Совпадающих Пар: середина p и Асимптотический Лучше, Чем Точное Условное выражение”. BMC Медицинская Методология Исследования. Издание 13, 2013, стр 1–8.
[3] Ланкастер, H.O. “Тесты значения в Дискретных распределениях”. JASA, Издание 56, Номер 294, 1961, стр 223–234.
[4] Макнемэр, Q. “Примечание по Ошибке Выборки Различия Между Коррелироваными Пропорциями или Процентами”. Psychometrika, Издание 12, Номер 2, 1947, стр 153–157.
[5] Mosteller, F. “Некоторые Статистические проблемы в Измерении Субъективного Ответа на Наркотики”. Биометрика, Издание 8, Номер 3, 1952, стр 220–226.