Типовое построение и оценка

Выбор элементов, проектирование элементов, выбор модели, оптимизация гиперпараметров, перекрестная проверка, прогнозная оценка производительности и тесты сравнения точности классификации

При построении качественной, прогностической модели классификации важно выбрать правильные элементы (или предикторы) и настроить гиперпараметры (параметры модели, которые не оцениваются).

Выбор функций и настройка гиперпараметров могут дать несколько моделей. Можно сравнить k-кратные коэффициенты неправильной классификации, кривые рабочих характеристик приемника (ROC) или матрицы путаницы между моделями. Или проведите статистический тест, чтобы определить, значительно ли модель классификации превосходит другую.

Для проектирования новых элементов перед обучением модели классификации используйте gencfeatures.

Для создания и оценки моделей классификации в интерактивном режиме используйте приложение Classification Learner.

Чтобы автоматически выбрать модель с настроенными гиперпараметрами, используйте fitcauto. Эта функция пытается выбрать типы классификационных моделей с различными значениями гиперпараметров и возвращает окончательную модель, которая, как ожидается, будет хорошо работать с новыми данными. Использовать fitcauto когда вы не уверены, какие типы классификаторов лучше всего подходят для ваших данных.

Чтобы настроить гиперпараметры определенной модели, выберите значения гиперпараметров и выполните перекрестную проверку модели с использованием этих значений. Например, чтобы настроить модель SVM, выберите набор ограничений поля и масштабов ядра, а затем выполните перекрестную проверку модели для каждой пары значений. Некоторые функции классификации Toolbox™ статистики и машинного обучения обеспечивают автоматическую настройку гиперпараметров посредством байесовской оптимизации, поиска по сетке или случайного поиска. Однако основная функция, используемая для реализации байесовской оптимизации, bayesopt, является достаточно гибким для использования в других приложениях. См. раздел Рабочий процесс байесовской оптимизации.

Для интерпретации классификационной модели можно использовать lime, shapley, и plotPartialDependence.

Приложения

Классификатор

Обучение моделей классификации данных с помощью контролируемого машинного обучения

Функции

развернуть все

Выбор элемента

`fscchi2`	Одномерное ранжирование элементов для классификации с использованием тестов хи-квадрат
`fscmrmr`	Ранговые характеристики для классификации с использованием алгоритма минимальной максимальной релевантности избыточности (MRMR)
`fscnca`	Выбор элемента с использованием анализа компонентов окрестности для классификации
`oobPermutedPredictorImportance`	Оценки важности предиктора путем перестановки наблюдений предиктора вне мешка для случайного леса деревьев классификации
`predictorImportance`	Оценки важности предиктора для дерева классификации
`predictorImportance`	Оценки важности предиктора для классификационного ансамбля деревьев решений
`sequentialfs`	Последовательный выбор элемента с использованием пользовательского критерия
`relieff`	Ранговая важность предикторов с использованием алгоритма ReliefF или RReloringF

Проектирование функций

`gencfeatures`	Выполнение автоматизированного проектирования элементов для классификации
`describe`	Описание созданных функций
`transform`	Преобразование новых данных с помощью созданных функций

Автоматический выбор модели

fitcauto Автоматический выбор классификационной модели с оптимизированными гиперпараметрами

Оптимизация гиперпараметров

`bayesopt`	Выберите оптимальные гиперпараметры машинного обучения с помощью байесовской оптимизации
`hyperparameters`	Описания переменных для оптимизации функции аппроксимации
`optimizableVariable`	Описание переменной для `bayesopt` или другие оптимизаторы

Перекрестная проверка

`crossval`	Оценка потерь с помощью перекрестной проверки
`cvpartition`	Данные секционирования для перекрестной проверки
`repartition`	Данные перераспределения для перекрестной проверки
`test`	Контрольные показатели для перекрестной проверки
`training`	Учебные индексы для перекрестной проверки

Интерпретация модели

Локальная интерпретируемая модель - агностические объяснения (LIME)

`lime`	Локальные интерпретируемые модели-агностические объяснения (LIME)
`fit`	Подгонка простой модели локальных интерпретируемых моделей-агностических объяснений (LIME)
`plot`	Результаты графика локальных интерпретируемых модельно-агностических объяснений (LIME)

Значения Шапли

`shapley`	Значения Шапли
`fit`	Вычислить значения Shapley для точки запроса
`plot`	График значений Шейпли

Частичная зависимость

`partialDependence`	Вычислить частичную зависимость
`plotPartialDependence`	Создание графиков частичной зависимости (PDP) и индивидуального условного ожидания (ICE)

Оценка эффективности классификации

`confusionchart`	Создание матричной диаграммы путаницы для проблемы классификации
`confusionmat`	Вычислить матрицу путаницы для задачи классификации
`perfcurve`	Кривая рабочих характеристик приемника (ROC) или другая кривая рабочих характеристик для выхода классификатора

Тесты сравнения точности модели

`testcholdout`	Сравнение предиктивной точности двух классификационных моделей
`testckfold`	Сравнение точности двух классификационных моделей с помощью повторной перекрестной проверки

Объекты

развернуть все

Выбор элемента

FeatureSelectionNCAClassification Выбор элемента для классификации с использованием анализа компонентов окрестности (NCA)

Проектирование функций

FeatureTransformer Созданные преобразования элементов

Оптимизация гиперпараметров

BayesianOptimization Результаты байесовской оптимизации

Темы

Приложение Classification Learner

Обучение классификационным моделям в приложении Classifier Learner

Рабочий процесс для обучения, сравнения и совершенствования моделей классификации, включая автоматизированное, ручное и параллельное обучение.

Оценка производительности классификатора в классификаторе

Сравните показатели точности модели, визуализируйте результаты путем построения прогнозов классов и проверьте производительность каждого класса в матрице путаницы.

Выбор и преобразование функций с помощью приложения Classification Learner

Определите полезные предикторы с помощью графиков, вручную выберите элементы для включения и преобразуйте элементы с помощью PCA в Classification Learner.

Выбор элемента

Введение в выбор элементов

Узнайте о алгоритмах выбора элементов и изучите функции, доступные для выбора элементов.

Выбор последовательного элемента

В этом разделе описывается последовательный выбор элементов и приводится пример последовательного выбора элементов с использованием пользовательского критерия и sequentialfs функция.

Выбор элементов для анализа компонентов соседства (NCA)

Анализ компонентов окрестности (NCA) - непараметрический метод выбора признаков с целью максимизации точности прогнозирования алгоритмов регрессии и классификации.

Настройка параметра регуляризации для обнаружения функций с помощью NCA для классификации

В этом примере показано, как настроить параметр регуляризации в fscnca с использованием перекрестной проверки.

Упорядочить классификатор дискриминантного анализа

Сделайте модель более надежной и простой, удалив предикторы без ущерба для прогнозирующей силы модели.

Выбор элементов для классификации высокоразмерных данных

В этом примере показано, как выбрать элементы для классификации объемных данных.

Проектирование функций

Автоматизированное проектирование элементов для классификации

Использовать gencfeatures для проектирования новых элементов перед обучением классификационной модели. Прежде чем делать прогнозы для новых данных, примените те же преобразования элементов к новому набору данных.

Автоматический выбор модели

Автоматизированный выбор классификаторов с байесовской оптимизацией

Использовать fitcauto автоматически попробовать выбрать типы классификационных моделей с различными значениями гиперпараметров, учитывая обучающий предиктор и данные ответа.