Пакет: classreg.learning.partition
Суперклассы: RegressionPartitionedModel
Перекрестная подтвержденная модель линейной регрессии для высоко-размерных данных
RegressionPartitionedLinear
набор моделей линейной регрессии, обученных на перекрестных подтвержденных сгибах. Получить перекрестное подтвержденное, модель линейной регрессии, использование fitrlinear
и задайте одну из опций перекрестной проверки. Можно оценить прогнозирующее качество модели, или как хорошо модель линейной регрессии делает вывод, с помощью одного или нескольких из этих “kfold” методов: kfoldPredict
и kfoldLoss
.
Каждый “kfold” метод использует модели, обученные на, окутывают наблюдения, чтобы предсказать ответ для наблюдений из сгиба. Например, предположите, что вы перекрестный подтверждаете использование пяти сгибов. В этом случае программное обеспечение случайным образом присваивает каждое наблюдение в пять примерно одинаково размерных групп. training fold содержит четыре из групп (то есть, примерно 4/5 данных), и test fold содержит другую группу (то есть, примерно 1/5 данных). В этом случае перекрестная проверка продолжает можно следующим образом:
Программное обеспечение обучает первую модель (сохраненный в CVMdl.Trained{1}
) использование наблюдений в последних четырех группах и резервах наблюдения в первой группе для валидации.
Программное обеспечение обучает вторую модель (сохраненный в CVMdl.Trained{2}
) использование наблюдений в первой группе и последних трех группах. Программное обеспечение резервирует наблюдения во второй группе для валидации.
Программное обеспечение продолжает подобным способом для третьего через пятые модели.
Если вы подтверждаете путем вызова kfoldPredict
, это вычисляет предсказания для наблюдений в группе 1, использующей первую модель, группу 2 для второй модели, и так далее. Короче говоря, программное обеспечение оценивает ответ для каждого наблюдения с помощью модели, обученной без того наблюдения.
Примечание
В отличие от другого перекрестного подтвержденного, моделей регрессии, RegressionPartitionedLinear
объекты модели не хранят набор данных предиктора.
CVMdl = fitrlinear(X,Y,Name,Value)
создает перекрестное подтвержденное, модель линейной регрессии когда Name
любой 'CrossVal'
, 'CVPartition'
, 'Holdout'
, или 'KFold'
. Для получения дополнительной информации смотрите fitrlinear
.
kfoldLoss | Потеря регрессии для наблюдений, не используемых в обучении |
kfoldPredict | Предскажите ответы для наблюдений, не используемых для обучения |
Значение. Чтобы узнать, как классы значений влияют на операции копирования, см. раздел "Копирование объектов".