Построение моделей и оценка

Выбор признаков, разработка функции, выбор модели, оптимизация гиперпараметра, перекрестная проверка, остаточная диагностика и графики

Когда вы создаете высококачественную модель регрессии, важно выбрать правильные функции (или предикторы), гиперпараметры мелодии (параметры модели не подгонка к данным), и оценить предположения модели через остаточную диагностику.

Можно настроить гиперпараметры путем итерации между выбором значений для них и перекрестной проверкой модели с помощью выбора. Этот процесс дает к многоуровневым моделям, и лучшая модель среди них может быть той, которая минимизирует предполагаемую ошибку обобщения. Например, чтобы настроить модель SVM, выберите набор ограничений поля и шкал ядра, перекрестный подтвердите модель для каждой пары значений, и затем сравните их 10-кратное, перекрестное подтвержденное, оценки среднеквадратической ошибки.

К новым возможностям инженера перед обучением модель регрессии использовать genrfeatures.

Чтобы создать и оценить модели регрессии в интерактивном режиме, используйте приложение Regression Learner.

Чтобы автоматически выбрать модель настроенными гиперпараметрами, использовать fitrauto. Функция пробует выбор типов модели регрессии с различными гиперзначениями параметров и возвращает итоговую модель, которая, как ожидают, выполнит хорошо. Использование fitrauto когда вы не уверены, какие типы модели регрессии лучше всего удовлетворяют вашим данным.

Определенные непараметрические функции регрессии в Statistics and Machine Learning Toolbox™ предлагают автоматический гиперпараметр, настраивающийся посредством Байесовой оптимизации, поиска сетки или случайного поиска. bayesopt, основная функция для реализации Байесовой оптимизации, достаточно гибко для многих других приложений также. Для получения дополнительной информации смотрите Байесов Рабочий процесс Оптимизации.

Чтобы интерпретировать модель регрессии, можно использовать lime, shapley, и plotPartialDependence.

Приложения

Regression Learner

Обучите модели регрессии предсказывать данные с помощью машинного обучения с учителем

Функции

развернуть все

Выбор признаков

`fsrftest`	Одномерная функция, занимающая место для регрессии с помощью F - тесты
`fsrnca`	Выбор признаков с помощью анализа компонента окружения для регрессии
`oobPermutedPredictorImportance`	Важность предиктора оценивает сочетанием наблюдений предиктора из сумки для случайного леса деревьев регрессии
`partialDependence`	Вычислите частичную зависимость
`plotPartialDependence`	Создайте графики отдельного условного ожидания (ICE) и частичный график зависимости (PDP)
`predictorImportance`	Оценки важности предиктора для дерева регрессии
`predictorImportance`	Оценки важности предиктора для ансамбля регрессии
`relieff`	Оцените важность использования предикторов алгоритм RReliefF или ReliefF
`sequentialfs`	Последовательный выбор признаков с помощью пользовательского критерия
`stepwiselm`	Выполните ступенчатую регрессию
`stepwiseglm`	Создайте обобщенную линейную модель регрессии ступенчатой регрессией

Разработка функции

`genrfeatures`	Выполните автоматизированную разработку функции для регрессии
`describe`	Опишите генерированные признаки
`transform`	Преобразуйте новые данные, использующие генерированные признаки

Автоматизированный выбор модели

fitrauto Автоматически выберите модель регрессии оптимизированными гиперпараметрами

Гипероптимизация параметров управления

`bayesopt`	Выберите оптимальные гиперпараметры машинного обучения с помощью Байесовой оптимизации
`hyperparameters`	Описания переменной для оптимизации подходящей функции
`optimizableVariable`	Описание переменной для `bayesopt` или другие оптимизаторы

Перекрестная проверка

`crossval`	Оцените потерю с помощью перекрестной проверки
`cvpartition`	Данные о разделе для перекрестной проверки
`repartition`	Данные о повторном разделении для перекрестной проверки
`test`	Протестируйте индексы на перекрестную проверку
`training`	Учебные индексы для перекрестной проверки

Интерпретация модели

Локальные поддающиеся толкованию объяснения модели агностические (LIME)

`lime`	Локальные поддающиеся толкованию объяснения модели агностические (LIME)
`fit`	Подбирайте простую модель локальных поддающихся толкованию объяснений модели агностических (LIME)
`plot`	Постройте результаты локальных поддающихся толкованию объяснений модели агностических (LIME)

Шепли оценивает

`shapley`	Шепли оценивает
`fit`	Вычислите значения Шепли для точки запроса
`plot`	Постройте значения Шепли

Частичная зависимость

`partialDependence`	Вычислите частичную зависимость
`plotPartialDependence`	Создайте графики отдельного условного ожидания (ICE) и частичный график зависимости (PDP)

Линейная диагностика модели

`coefCI`	Доверительные интервалы содействующих оценок модели линейной регрессии
`coefTest`	Линейный тест гипотезы на коэффициентах модели линейной регрессии
`dwtest`	Тест Дербин-Уотсона с объектом модели линейной регрессии
`plot`	График поля точек или добавленный переменный график модели линейной регрессии
`plotAdded`	Добавленный переменный график модели линейной регрессии
`plotAdjustedResponse`	Настроенный график отклика модели линейной регрессии
`plotDiagnostics`	Постройте диагностику наблюдения модели линейной регрессии
`plotEffects`	Постройте основные эффекты предикторов в модели линейной регрессии
`plotInteraction`	Постройте эффекты взаимодействия двух предикторов в модели линейной регрессии
`plotResiduals`	Постройте остаточные значения модели линейной регрессии
`plotSlice`	График срезов через подходящую поверхность линейной регрессии

Обобщенная линейная диагностика модели

`coefCI`	Доверительные интервалы содействующих оценок обобщенной линейной модели регрессии
`coefTest`	Линейный тест гипотезы на обобщенных линейных коэффициентах модели регрессии
`devianceTest`	Анализ отклонения для обобщенной линейной модели регрессии
`plotDiagnostics`	Постройте диагностику наблюдения обобщенной линейной модели регрессии
`plotResiduals`	Постройте остаточные значения обобщенной линейной модели регрессии
`plotSlice`	График срезов через подходящую обобщенную линейную поверхность регрессии

Нелинейная диагностика модели

`coefCI`	Доверительные интервалы содействующих оценок нелинейной модели регрессии
`coefTest`	Линейный тест гипотезы на нелинейных коэффициентах модели регрессии
`plotDiagnostics`	Постройте диагностику нелинейной модели регрессии
`plotResiduals`	Постройте остаточные значения нелинейной модели регрессии
`plotSlice`	График срезов через подходящую нелинейную поверхность регрессии

Линейные тесты гипотезы

linhyptest Линейный тест гипотезы

Объекты

развернуть все

Выбор признаков

FeatureSelectionNCARegression Выбор признаков для регрессии с помощью анализа компонента окружения (NCA)

Разработка функции

FeatureTransformer Сгенерированные преобразования функции

Гипероптимизация параметров управления

BayesianOptimization Байесовы результаты оптимизации

Темы

Рабочий процесс приложения Regression Learner

Обучите модели регрессии в приложении Regression Learner

Рабочий процесс для обучения, выдерживая сравнение и улучшая модели регрессии, включая автоматизированное, ручное, и параллельное обучение.

Выберите Regression Model Options

В Regression Learner автоматически обучите выбор моделей, или сравните и настройте опции моделей линейной регрессии, деревьев регрессии, машин опорных векторов, Гауссовых моделей регрессии процесса, ансамблей деревьев регрессии и нейронных сетей регрессии.

Выбор признаков и преобразование функции Используя приложение Regression Learner

Идентифицируйте полезные предикторы с помощью графиков, вручную избранные функции, чтобы включать, и преобразовать функции с помощью PCA в Regression Learner.

Оцените производительность модели в Regression Learner

Сравните статистику модели и визуализируйте результаты.

Выбор признаков

Введение в выбор признаков

Узнайте об алгоритмах выбора признаков и исследуйте функции, доступные для выбора признаков.

Последовательный выбор признаков

Эта тема вводит последовательному выбору признаков и обеспечивает пример, который выбирает функции последовательно с помощью пользовательского критерия и sequentialfs функция.

Выбор признаков Анализа компонента окружения (NCA)

Анализ компонента окружения (NCA) является непараметрическим методом для выбора функций с целью максимизации точности предсказания алгоритмов регрессии и классификации.

Устойчивый выбор признаков Используя NCA для регрессии

Выполните выбор признаков, который устойчив к выбросам с помощью пользовательской устойчивой функции потерь в NCA.

Выберите Predictors for Random Forests

Выберите предикторы разделения для случайных лесов с помощью алгоритма проверок взаимодействия.

Разработка функции

Автоматизированная разработка функции для регрессии

Использование genrfeatures к новым возможностям инженера перед обучением модель регрессии. Прежде, чем сделать предсказания на новых данных, примените те же преобразования функции к новому набору данных.

Автоматизированный выбор модели

Автоматизированный выбор модели регрессии с байесовой и оптимизацией ASHA

Использование fitrauto автоматически попробовать выбор типов модели регрессии с различными гиперзначениями параметров, учитывая учебный предиктор и данные об ответе.

Гипероптимизация параметров управления

Байесов рабочий процесс оптимизации

Выполните Байесовую оптимизацию с помощью подходящей функции или путем вызова bayesopt непосредственно.

Переменные для байесовой оптимизации

Создайте переменные для Байесовой оптимизации.

Байесовы целевые функции оптимизации

Создайте целевую функцию для Байесовой оптимизации.

Ограничения в байесовой оптимизации

Установите различные типы ограничений для Байесовой оптимизации.

Оптимизируйте повышенный ансамбль регрессии

Минимизируйте утрату перекрестной проверки ансамбля регрессии.

Байесовы функции построения графика оптимизации

Визуально контролируйте Байесовую оптимизацию.

Байесовы выходные функции оптимизации

Контролируйте Байесовую оптимизацию.

Байесов алгоритм оптимизации

Изучите базовые алгоритмы для Байесовой оптимизации.

Найдите что-либо подобное байесовой оптимизации

Как Байесова оптимизация работает параллельно.

Интерпретация модели

Интерпретируйте модели машинного обучения

Объясните предсказания модели с помощью lime, shapley, и plotPartialDependence.

Шепли оценивает за модель машинного обучения

Вычислите значения Шепли для машинного обучения, моделируют использование двух алгоритмов: kernelSHAP и расширение kernelSHAP.

Перекрестная проверка

Реализуйте перекрестную проверку Используя параллельные вычисления

Ускорьте перекрестную проверку с помощью параллельных вычислений.

Линейная диагностика модели

Интерпретируйте результаты линейной регрессии

Отобразите и интерпретируйте линейную регрессию выходная статистика.

Линейная регрессия

Подбирайте модель линейной регрессии и исследуйте результат.

Линейная регрессия с эффектами взаимодействия

Создайте и анализируйте модель линейной регрессии с эффектами взаимодействия и интерпретируйте результаты.

Сводные данные Выхода и диагностической статистики

Оцените подобранную модель при помощи свойств модели и объектных функций.

F-статистическая-величина и t-статистическая-величина

В линейной регрессии F - статистическая величина является тестовой статистической величиной для дисперсионного анализа (Дисперсионный Анализ) подход, чтобы протестировать значение модели или компонентов в модели. t - статистическая величина полезна для того, чтобы сделать выводы о коэффициентах регрессии.

Коэффициент детерминации (R-Squared)

Коэффициент детерминации (R-squared) указывает на пропорциональный объем изменения переменной отклика y, объясненный независимыми переменными X в модели линейной регрессии.

Содействующие стандартные погрешности и доверительные интервалы

Предполагаемые содействующие отклонения и ковариации получают точность оценок коэффициента регрессии.

Остаточные значения

Остаточные значения полезны для обнаружения отдаленных значений y и проверки предположений линейной регрессии относительно остаточного члена в модели регрессии.

Тест Дербин-Уотсона

Тест Дербин-Уотсона оценивает, существует ли автокорреляция среди остаточных значений данных временных рядов.

Расстояние повара

Расстояние повара полезно для идентификации выбросов в значениях X (наблюдения для переменных предикторов).

Матрица шляпы и рычаги

Матрица шляпы обеспечивает меру рычагов.

Удалите 1 статистику

Удалите 1 изменение в ковариации (CovRatio) идентифицирует наблюдения, которые влияют при подгонке регрессии.

Обобщенная линейная диагностика модели

Обобщенные линейные модели

Обобщенные линейные модели используют методы Linear описать потенциально нелинейное отношение между терминами предиктора и переменной отклика.

Нелинейная диагностика модели

Нелинейная регрессия

Параметрические нелинейные модели представляют отношение между непрерывной переменной отклика и одним или несколькими непрерывными переменными предикторами.

Документация

Построение моделей и оценка

Приложения

Функции

Выбор признаков

Разработка функции

Автоматизированный выбор модели

Гипероптимизация параметров управления

Перекрестная проверка

Интерпретация модели

Локальные поддающиеся толкованию объяснения модели агностические (LIME)

Шепли оценивает

Частичная зависимость

Линейная диагностика модели

Обобщенная линейная диагностика модели

Нелинейная диагностика модели

Линейные тесты гипотезы

Объекты

Выбор признаков

Разработка функции

Гипероптимизация параметров управления

Темы

Рабочий процесс приложения Regression Learner

Выбор признаков

Разработка функции

Автоматизированный выбор модели

Гипероптимизация параметров управления

Интерпретация модели

Перекрестная проверка

Линейная диагностика модели

Обобщенная линейная диагностика модели

Нелинейная диагностика модели

Документация Statistics and Machine Learning Toolbox

Поддержка