Сравнение точности двух классификационных моделей с использованием новых данных
compareHoldout статистически оценивает точность двух классификационных моделей. Функция сначала сравнивает их предсказанные метки с истинными метками, а затем обнаруживает, является ли разница между показателями неправильной классификации статистически значимой.
Можно определить, отличается ли точность классификационных моделей или одна модель работает лучше другой. compareHoldout может проводить несколько вариаций теста МакНемара, включая асимптотический тест, точно-условный тест и тест среднего p-значения. Для оценки с учетом затрат доступные тесты включают тест хи-квадрат (требует Toolbox™ оптимизации) и тест отношения правдоподобия.
возвращает тестовое решение из проверки нулевой гипотезы о том, что обученные модели классификации h = compareHoldout(C1,C2,T1,T2,ResponseVarName)C1 и C2 имеют одинаковую точность для прогнозирования меток истинного класса в ResponseVarName переменная. Альтернативная гипотеза заключается в том, что метки имеют неравную точность.
Первая классификационная модель C1 использует данные предиктора в T1и вторую классификационную модель C2 использует данные предиктора в T2. Столы T1 и T2 должен содержать одну и ту же переменную ответа, но может содержать различные наборы предикторов. По умолчанию программа проводит тест McNemar среднего значения p для сравнения точности.
h = 1 указывает на отклонение нулевой гипотезы на уровне значимости 5%. h = 0 указывает, что не отклоняет нулевую гипотезу на уровне 5%.
Ниже приведены примеры тестов, которые можно провести:
Сравните точность простой классификационной модели и модели, которая более сложна, передав один и тот же набор данных предиктора (то есть T1 = T2).
Сравните точность двух потенциально разных моделей, используя два потенциально разных набора предикторов.
Выполните выбор различных типов элементов. Например, можно сравнить точность модели, обученной с помощью набора предикторов, с точностью модели, обученной на подмножестве или другом наборе этих предикторов. Вы можете выбрать набор предикторов произвольно или использовать метод выбора функции, такой как PCA или последовательный выбор функции (см. pca и sequentialfs).
возвращает тестовое решение из проверки нулевой гипотезы о том, что обученные модели классификации h = compareHoldout(C1,C2,T1,T2,Y)C1 и C2 имеют одинаковую точность для прогнозирования меток истинного класса Y. Альтернативная гипотеза заключается в том, что метки имеют неравную точность.
Первая классификационная модель C1 использует данные предиктора T1и вторую классификационную модель C2 использует данные предиктора T2. По умолчанию программа проводит тест McNemar среднего значения p для сравнения точности.
возвращает тестовое решение из проверки нулевой гипотезы о том, что обученные модели классификации h = compareHoldout(C1,C2,X1,X2,Y)C1 и C2 имеют одинаковую точность для прогнозирования меток истинного класса Y. Альтернативная гипотеза заключается в том, что метки имеют неравную точность.
Первая классификационная модель C1 использует данные предиктора X1и вторую классификационную модель C2 использует данные предиктора X2. По умолчанию программа проводит тест McNemar среднего значения p для сравнения точности.
указывает параметры, использующие один или несколько аргументов пары имя-значение в дополнение к комбинациям входных аргументов в предыдущих синтаксисах. Например, можно указать тип альтернативной гипотезы, указать тип теста и предоставить матрицу затрат.h = compareHoldout(___,Name,Value)
compareHoldout не сравнивает модели ECOC, состоящие из линейных или классификационных моделей ядра (то есть ClassificationLinear или ClassificationKernel объекты модели). Выдерживать сравнение ClassificationECOC модели, состоящие из линейных или классификационных моделей ядра, использование testcholdout вместо этого.
Аналогично, compareHoldout не сравнивает ClassificationLinear или ClassificationKernel объекты модели. Чтобы сравнить эти модели, используйте testcholdout вместо этого.
Одним из способов выбора функций без учета затрат является:
Обучить первую классификационную модель (C1) с использованием полного набора предикторов.
Обучить вторую классификационную модель (C2) с использованием уменьшенного набора предикторов.
Определить X1 в качестве данных предиктора полного набора тестов и X2 в качестве уменьшенных данных предиктора набора тестов.
Войти compareHoldout(C1,C2,X1,X2,Y,'Alternative','less'). Если compareHoldout прибыль 1, то есть достаточно доказательств, чтобы предположить, что модель классификации, в которой используется меньше предикторов, работает лучше, чем модель, в которой используется полный набор предикторов.
В качестве альтернативы можно оценить, существует ли существенная разница между точностью двух моделей. Чтобы выполнить эту оценку, удалите 'Alternative','less' спецификация на шаге 4. compareHoldout проводит двусторонний тест, и h = 0 указывает на то, что недостаточно доказательств, чтобы предположить разницу в точности двух моделей.
Чувствительные к затратам тесты выполняют численную оптимизацию, что требует дополнительных вычислительных ресурсов. Тест отношения правдоподобия проводит численную оптимизацию косвенно путем нахождения корня множителя Лагранжа в интервале. Для некоторых наборов данных, если корень лежит близко к границам интервала, то метод может завершиться ошибкой. Поэтому, если у вас есть лицензия Optimization Toolbox, рассмотрите возможность проведения теста хи-квадрат с учетом затрат. Дополнительные сведения см. в разделе CostTest и тестирование с учетом затрат.
Чтобы непосредственно сравнить точность двух наборов меток класса при прогнозировании набора истинных меток класса, используйте testcholdout.
[1] Agresti, A. Категориальный анализ данных, 2-й ред. Джон Уайли и сыновья, Inc.: Хобокен, Нью-Джерси, 2002.
[2] Фагерлан, М.В., С. Лидерсен и П. Лааке. «Тест McNemar для двоичных согласованных пар данных: Mid-p и асимптотические лучше, чем точные условные». Методология медицинских исследований BMC. Том 13, 2013, стр. 1-8.
[3] Ланкастер, H.O. «Тесты значимости в дискретных распределениях». JASA, том 56, номер 294, 1961, стр. 223-234.
[4] McNemar, Q. «Примечание об ошибке выборки разницы между коррелированными пропорциями или процентами». Психометрика, т. 12, № 2, 1947, с. 153-157.
[5] Мостеллер, Ф. «Некоторые статистические проблемы в измерении субъективной реакции на наркотики». Биометрия, т. 8, № 3, 1952, с. 220-226.