Построение моделей и оценка

Выбор признаков, гипероптимизация параметров управления, перекрестная проверка, остаточная диагностика, графики

При создавании высококачественной модели регрессии важно выбрать правильные функции (или предикторы), гиперпараметры мелодии (параметры модели не подгонка к данным), и оценить предположения модели через остаточную диагностику.

Можно настроить гиперпараметры путем итерации между выбором значений для них и перекрестной проверкой модели с помощью выбора. Этот процесс дает к многоуровневым моделям, и лучшая модель среди них может быть той, которая минимизирует предполагаемую ошибку обобщения. Например, чтобы настроить модель SVM, выберите набор ограничений поля и шкал ядра, перекрестный подтвердите модель для каждой пары значений, и затем сравните их 10-кратные перекрестные подтвержденные среднеквадратические ошибочные оценки.

Определенные непараметрические функции регрессии в Statistics and Machine Learning Toolbox™ дополнительно предлагают автоматический гиперпараметр, настраивающийся посредством Байесовой оптимизации, поиска сетки или случайного поиска. Однако bayesopt, то, которое является основной функцией, чтобы реализовать Байесовую оптимизацию, достаточно гибко для многих других приложений. Для получения дополнительной информации смотрите Байесов Рабочий процесс Оптимизации.

Приложения

Regression Learner

Обучите модели регрессии предсказывать данные с помощью машинного обучения с учителем

Функции

развернуть все

Выбор признаков

`fsrnca`	Выбор признаков с помощью анализа компонента окружения в регрессии
`oobPermutedPredictorImportance`	Важность предиктора оценивает сочетанием наблюдений предиктора из сумки для случайного леса деревьев регрессии
`plotPartialDependence`	Создайте графики отдельного условного ожидания (ICE) и частичный график зависимости (PDP)
`predictorImportance`	Оценки важности предиктора для дерева регрессии
`predictorImportance`	Оценки важности предиктора для ансамбля регрессии
`relieff`	Оцените важность использования предикторов алгоритм RReliefF или ReliefF
`sequentialfs`	Последовательный выбор признаков с помощью пользовательского критерия
`stepwiselm`	Подходящая модель линейной регрессии использование ступенчатой регрессии
`stepwiseglm`	Создайте обобщенную линейную модель регрессии ступенчатой регрессией

Гипероптимизация параметров управления

`bayesopt`	Выберите оптимальные гиперпараметры машинного обучения с помощью Байесовой оптимизации
`hyperparameters`	Описания переменной для оптимизации подходящей функции
`optimizableVariable`	Описание переменной для bayesopt или других оптимизаторов

Перекрестная проверка

`crossval`	Оценка потерь с помощью перекрестной проверки
`cvpartition`	Создайте раздел перекрестной проверки для данных
`repartition`	Данные о повторном разделении для перекрестной проверки
`test`	Протестируйте индексы на перекрестную проверку
`training`	Учебные индексы для перекрестной проверки

Линейная диагностика модели

`coefCI`	Доверительные интервалы содействующих оценок модели линейной регрессии
`coefTest`	Линейный тест гипотезы на коэффициентах модели линейной регрессии
`dwtest`	Тест Дербин-Уотсона с объектом модели линейной регрессии
`plot`	График поля точек или добавленный переменный график модели линейной регрессии
`plotAdded`	Добавленный переменный график модели линейной регрессии
`plotAdjustedResponse`	Настроенный график отклика модели линейной регрессии
`plotDiagnostics`	Постройте диагностику наблюдения модели линейной регрессии
`plotEffects`	Постройте основные эффекты предикторов в модели линейной регрессии
`plotInteraction`	Постройте эффекты взаимодействия двух предикторов в модели линейной регрессии
`plotResiduals`	Постройте остаточные значения модели линейной регрессии
`plotSlice`	График срезов через подходящую поверхность линейной регрессии

Обобщенная линейная диагностика модели

`coefCI`	Доверительные интервалы содействующих оценок обобщенной линейной модели
`coefTest`	Линейный тест гипотезы на обобщенных линейных коэффициентах модели регрессии
`devianceTest`	Анализ отклонения
`plotDiagnostics`	Постройте диагностику обобщенной линейной модели регрессии
`plotResiduals`	Постройте остаточные значения обобщенной линейной модели регрессии
`plotSlice`	График срезов через подходящую обобщенную линейную поверхность регрессии

Нелинейная диагностика модели

`coefCI`	Доверительные интервалы содействующих оценок нелинейной модели регрессии
`coefTest`	Линейный тест гипотезы на нелинейных коэффициентах модели регрессии
`plotDiagnostics`	Постройте диагностику нелинейной модели регрессии
`plotResiduals`	Постройте остаточные значения нелинейной модели регрессии
`plotSlice`	График срезов через подходящую нелинейную поверхность регрессии

Линейные тесты гипотезы

linhyptest Линейный тест гипотезы

Объекты

развернуть все

Выбор признаков

FeatureSelectionNCARegression Выбор признаков для регрессии с помощью анализа компонента окружения (NCA)

Гипероптимизация параметров управления

BayesianOptimization Байесовы результаты оптимизации

Перекрестная проверка

cvpartition Разделы данных для перекрестной проверки

Темы

Рабочий процесс приложения Regression Learner

Обучите модели регрессии в приложении Regression Learner

Рабочий процесс для обучения, выдерживая сравнение и улучшая модели регрессии, включая автоматизированное, ручное, и параллельное обучение.

Выберите Regression Model Options

В Regression Learner автоматически обучите выбор моделей, или сравните и настройте опции моделей линейной регрессии, деревьев регрессии, машин опорных векторов, Гауссовых моделей регрессии процесса и ансамблей деревьев регрессии.

Выбор признаков и преобразование функции Используя приложение Regression Learner

Идентифицируйте полезные предикторы с помощью графиков, вручную избранные функции, чтобы включать, и преобразовать функции с помощью PCA в Regression Learner.

Оцените производительность модели в Regression Learner

Сравните статистику модели и визуализируйте результаты.

Выбор признаков

Введение в выбор признаков

Узнайте об алгоритмах выбора признаков и исследуйте функции, доступные для выбора признаков.

Последовательный выбор признаков

Эта тема вводит последовательному выбору признаков и обеспечивает пример, который выбирает функции последовательно с помощью пользовательского критерия и sequentialfs функция.

Выбор признаков Анализа компонента окружения (NCA)

Анализ компонента окружения (NCA) является непараметрическим методом для выбора функций с целью максимизации точности прогноза алгоритмов регрессии и классификации.

Устойчивый выбор признаков Используя NCA для регрессии

Выполните выбор признаков, который устойчив к выбросам с помощью пользовательской устойчивой функции потерь в NCA.

Выберите Predictors for Random Forests

Выберите предикторы разделения для случайных лесов с помощью алгоритма проверок взаимодействия.

Гипероптимизация параметров управления

Байесов рабочий процесс оптимизации

Выполните Байесовую оптимизацию с помощью подходящей функции или путем вызова bayesopt непосредственно.

Переменные для байесовой оптимизации

Создайте переменные для Байесовой оптимизации.

Байесовы целевые функции оптимизации

Создайте целевую функцию для Байесовой оптимизации.

Ограничения в байесовой оптимизации

Установите различные типы ограничений для Байесовой оптимизации.

Оптимизируйте повышенный ансамбль регрессии

Минимизируйте утрату перекрестной проверки ансамбля регрессии.

Байесовы функции построения графика оптимизации

Визуально контролируйте Байесовую оптимизацию.

Байесовы выходные функции оптимизации

Контролируйте Байесовую оптимизацию.

Байесов алгоритм оптимизации

Изучите базовые алгоритмы для Байесовой оптимизации.

Найдите что-либо подобное байесовой оптимизации

Как Байесова оптимизация работает параллельно.

Перекрестная проверка

Реализуйте перекрестную проверку Используя параллельные вычисления

Ускорьте перекрестную проверку с помощью параллельных вычислений.

Линейная диагностика модели

Интерпретируйте результаты линейной регрессии

Отобразите и интерпретируйте линейную регрессию выходная статистика.

Линейная регрессия

Подбирайте модель линейной регрессии и исследуйте результат.

Линейная регрессия с эффектами взаимодействия

Создайте и анализируйте модель линейной регрессии с эффектами взаимодействия и интерпретируйте результаты.

Сводные данные Выхода и диагностической статистики

Оцените подобранную модель при помощи свойств модели и объектных функций.

F-статистическая-величина и t-статистическая-величина

В линейной регрессии F - статистическая величина является тестовой статистической величиной для дисперсионного анализа (Дисперсионный Анализ) подход, чтобы протестировать значение модели или компонентов в модели. t - статистическая величина полезна для того, чтобы сделать выводы о коэффициентах регрессии.

Коэффициент детерминации (R-Squared)

Коэффициент детерминации (R-squared) указывает на пропорциональный объем изменения переменной отклика y, объясненный независимыми переменными X в модели линейной регрессии.

Содействующие стандартные погрешности и доверительные интервалы

Предполагаемые содействующие отклонения и ковариации получают точность оценок коэффициента регрессии.

Остаточные значения

Остаточные значения полезны для обнаружения отдаленных значений y и проверки предположений линейной регрессии относительно остаточного члена в модели регрессии.

Тест Дербин-Уотсона

Тест Дербин-Уотсона оценивает, существует ли автокорреляция среди остаточных значений данных временных рядов.

Расстояние повара

Расстояние повара полезно для идентификации выбросов в значениях X (наблюдения для переменных предикторов).

Матрица шляпы и рычаги

Матрица шляпы обеспечивает меру рычагов.

Удалите 1 статистику

Удалите 1 изменение в ковариации (covratio) идентифицирует наблюдения, которые влияют при подгонке регрессии.

Обобщенная линейная диагностика модели

Обобщенные линейные модели

Обобщенные линейные модели используют методы Linear описать потенциально нелинейное отношение между условиями предиктора и переменной отклика.

Нелинейная диагностика модели

Нелинейная регрессия

Параметрические нелинейные модели представляют отношение между непрерывной переменной отклика и одним или несколькими непрерывными переменными предикторами.

Документация

Построение моделей и оценка

Приложения

Функции

Выбор признаков

Гипероптимизация параметров управления

Перекрестная проверка

Линейная диагностика модели

Обобщенная линейная диагностика модели

Нелинейная диагностика модели

Линейные тесты гипотезы

Объекты

Выбор признаков

Гипероптимизация параметров управления

Перекрестная проверка

Темы

Рабочий процесс приложения Regression Learner

Выбор признаков

Гипероптимизация параметров управления

Перекрестная проверка

Линейная диагностика модели

Обобщенная линейная диагностика модели

Нелинейная диагностика модели

Документация Statistics and Machine Learning Toolbox

Поддержка