Построение моделей и оценка

Выбор признаков, разработка функции, выбор модели, гипероптимизация параметров управления, перекрестная проверка, прогнозирующая оценка результатов деятельности и тесты сравнения точности классификации

При создавании высококачественной, прогнозирующей модели классификации важно выбрать правильные функции (или предикторы) и гиперпараметры мелодии (параметры модели, которые не оцениваются).

Выбор признаков и настройка гиперпараметра могут дать к многоуровневым моделям. Можно выдержать сравнение, k - сворачивают misclassification уровни, кривые рабочей характеристики приемника (ROC) или матрицы беспорядка среди моделей. Или, проведите статистический тест, чтобы обнаружить, превосходит ли модель классификации значительно другого по характеристикам.

К новым возможностям инженера перед обучением модель классификации использовать gencfeatures.

Чтобы создать и оценить модели классификации в интерактивном режиме, используйте приложение Classification Learner.

Чтобы автоматически выбрать модель настроенными гиперпараметрами, использовать fitcauto. Эта функция пробует выбор типов модели классификации с различными гиперзначениями параметров и возвращает итоговую модель, которая, как ожидают, выполнит хорошо на новых данных. Использование fitcauto когда вы не уверены, который вводит классификатор, лучше всего удовлетворяют вашим данным.

Чтобы настроить гиперпараметры определенной модели, выберите гиперзначения параметров и перекрестный подтвердите модель с помощью тех значений. Например, чтобы настроить модель SVM, выберите набор ограничений поля и шкал ядра, и затем перекрестный подтвердите модель для каждой пары значений. Определенные функции классификации Statistics and Machine Learning Toolbox™ предлагают автоматический гиперпараметр, настраивающийся посредством Байесовой оптимизации, поиска сетки или случайного поиска. Однако основная функция раньше реализовывала Байесовую оптимизацию, bayesopt, достаточно гибко для использования в других приложениях. Смотрите Байесов Рабочий процесс Оптимизации.

Чтобы интерпретировать модель классификации, можно использовать lime, shapley, и plotPartialDependence.

Приложения

Classification Learner

Обучите модели классифицировать данные с помощью машинного обучения с учителем

Функции

развернуть все

Выбор признаков

`fscchi2`	Одномерная функция, занимающая место для классификации с помощью тестов хи-квадрата
`fscmrmr`	Отранжируйте признаки для классификации с помощью алгоритма минимальной уместности максимума сокращения (MRMR)
`fscnca`	Выбор признаков с помощью анализа компонента окружения для классификации
`oobPermutedPredictorImportance`	Важность предиктора оценивает сочетанием наблюдений предиктора из сумки для случайного леса деревьев классификации
`predictorImportance`	Оценки важности предиктора для дерева классификации
`predictorImportance`	Оценки важности предиктора для ансамбля классификации деревьев решений
`sequentialfs`	Последовательный выбор признаков с помощью пользовательского критерия
`relieff`	Оцените важность использования предикторов алгоритм RReliefF или ReliefF

Разработка функции

`gencfeatures`	Выполните автоматизированную разработку функции для классификации
`describe`	Опишите генерированные признаки
`transform`	Преобразуйте новые данные, использующие генерированные признаки

Автоматизированный выбор модели

fitcauto Автоматически выберите модель классификации оптимизированными гиперпараметрами

Гипероптимизация параметров управления

`bayesopt`	Выберите оптимальные гиперпараметры машинного обучения с помощью Байесовой оптимизации
`hyperparameters`	Описания переменной для оптимизации подходящей функции
`optimizableVariable`	Описание переменной для `bayesopt` или другие оптимизаторы

Перекрестная проверка

`crossval`	Оцените потерю с помощью перекрестной проверки
`cvpartition`	Данные о разделе для перекрестной проверки
`repartition`	Данные о повторном разделении для перекрестной проверки
`test`	Протестируйте индексы на перекрестную проверку
`training`	Учебные индексы для перекрестной проверки

Интерпретация модели

Локальные поддающиеся толкованию объяснения модели агностические (LIME)

`lime`	Локальные поддающиеся толкованию объяснения модели агностические (LIME)
`fit`	Подбирайте простую модель локальных поддающихся толкованию объяснений модели агностических (LIME)
`plot`	Постройте результаты локальных поддающихся толкованию объяснений модели агностических (LIME)

Шепли оценивает

`shapley`	Шепли оценивает
`fit`	Вычислите значения Шепли для точки запроса
`plot`	Постройте значения Шепли

Частичная зависимость

`partialDependence`	Вычислите частичную зависимость
`plotPartialDependence`	Создайте графики отдельного условного ожидания (ICE) и частичный график зависимости (PDP)

Оценка результатов деятельности классификации

`confusionchart`	Создайте матричный график беспорядка для проблемы классификации
`confusionmat`	Вычислите матрицу беспорядка для проблемы классификации
`perfcurve`	Кривая рабочей характеристики приемника (ROC) или другая кривая производительности для классификатора выводятся

Тесты сравнения точности модели

`testcholdout`	Сравните прогнозирующую точность двух моделей классификации
`testckfold`	Сравните точность двух моделей классификации повторной перекрестной проверкой

Объекты

развернуть все

Выбор признаков

FeatureSelectionNCAClassification Выбор признаков для классификации с помощью анализа компонента окружения (NCA)

Разработка функции

FeatureTransformer Сгенерированные преобразования функции

Гипероптимизация параметров управления

BayesianOptimization Байесовы результаты оптимизации

Темы

Приложение Classification Learner

Обучите модели классификации в приложении Classification Learner

Рабочий процесс для обучения, выдерживая сравнение и улучшая модели классификации, включая автоматизированное, ручное, и параллельное обучение.

Оцените эффективность классификатора в Classification Learner

Сравните баллы точности модели, визуализируйте результаты путем графического вывода предсказаний класса и проверяйте эффективность в классе в Матрице Беспорядка.

Выбор признаков и преобразование функции Используя приложение Classification Learner

Идентифицируйте полезные предикторы с помощью графиков, вручную избранные функции, чтобы включать, и преобразовать функции с помощью PCA в Classification Learner.

Выбор признаков

Введение в выбор признаков

Узнайте об алгоритмах выбора признаков и исследуйте функции, доступные для выбора признаков.

Последовательный выбор признаков

Эта тема вводит последовательному выбору признаков и обеспечивает пример, который выбирает функции последовательно с помощью пользовательского критерия и sequentialfs функция.

Выбор признаков Анализа компонента окружения (NCA)

Анализ компонента окружения (NCA) является непараметрическим методом для выбора функций с целью максимизации точности предсказания алгоритмов регрессии и классификации.

Настройте параметр регуляризации, чтобы обнаружить функции Используя NCA для классификации

В этом примере показано, как настроить параметр регуляризации в fscnca использование перекрестной проверки.

Упорядочите классификатор дискриминантного анализа

Сделайте более устойчивую и более простую модель путем удаления предикторов, не ставя под угрозу предсказательную силу модели.

Выбор функций классификации высоко-размерных данных

В этом примере показано, как выбрать функции классификации высоко-размерных данных.

Разработка функции

Автоматизированная разработка функции для классификации

Использование gencfeatures к новым возможностям инженера перед обучением модель классификации. Прежде, чем сделать предсказания на новых данных, примените те же преобразования функции к новому набору данных.

Автоматизированный выбор модели

Автоматизированный выбор классификатора с байесовой оптимизацией

Использование fitcauto автоматически попробовать выбор типов модели классификации с различными гиперзначениями параметров, учитывая учебный предиктор и данные об ответе.