Пакет: classreg.learning.partition
Суперклассы: RegressionPartitionedModel
Перекрестная подтвержденная модель линейной регрессии для высоко-размерных данных
RegressionPartitionedLinear
является набором моделей линейной регрессии, обученных на перекрестных подтвержденных сгибах. Получить перекрестное подтвержденное, модель линейной регрессии, fitrlinear
использования и задать одну из опций перекрестной проверки. Можно оценить прогнозирующее качество модели, или как хорошо модель линейной регрессии делает вывод, с помощью одного или нескольких из этих “kfold” методов: kfoldPredict
и kfoldLoss
.
Каждый “kfold” метод использует модели, обученные на, окутывают наблюдения, чтобы предсказать ответ для наблюдений из сгиба. Например, предположите, что вы перекрестный подтверждаете использование пяти сгибов. В этом случае программное обеспечение случайным образом присваивает каждое наблюдение в пять примерно одинаково размерных групп. training fold содержит четыре из групп (то есть, примерно 4/5 данных), и test fold содержит другую группу (то есть, примерно 1/5 данных). В этом случае перекрестная проверка продолжает можно следующим образом:
Программное обеспечение обучает первую модель (сохраненный в CVMdl.Trained{1}
) использование наблюдений в последних четырех группах и резервирует наблюдения в первой группе для валидации.
Программное обеспечение обучает вторую модель (сохраненный в CVMdl.Trained{2}
) использование наблюдений в первой группе, и продержитесь три группы. Программное обеспечение резервирует наблюдения во второй группе для валидации.
Программное обеспечение продолжает подобным способом для третьего через пятые модели.
Если вы подтверждаете путем вызова kfoldPredict
, он вычисляет прогнозы для наблюдений в группе 1, использующей первую модель, группу 2 для второй модели, и так далее. Короче говоря, программное обеспечение оценивает ответ для каждого наблюдения с помощью модели, обученной без того наблюдения.
В отличие от другого перекрестного подтвержденного, моделей регрессии, объекты модели RegressionPartitionedLinear
не хранят набор данных предиктора.
CVMdl = fitrlinear(X,Y,Name,Value)
создает перекрестное подтвержденное, модель линейной регрессии, когда Name
является или 'CrossVal'
, 'CVPartition'
, 'Holdout'
или 'KFold'
. Для получения дополнительной информации смотрите fitrlinear
.
kfoldLoss | Потеря регрессии для наблюдений, не используемых в обучении |
kfoldPredict | Предскажите ответы для наблюдений, не используемых для обучения |
Значение. Чтобы изучить, как классы значения влияют на операции копии, смотрите Копирование Объектов (MATLAB).