Пакет: classreg.learning.partition
Суперклассы: RegressionPartitionedModel
Перекрестная проверенная линейная регрессионая модель для высоко-размерных данных
RegressionPartitionedLinear
- набор линейных регрессионных моделей, обученных на перекрестных проверенных складках. Чтобы получить перекрестно проверенную, линейную регрессионую модель, используйте fitrlinear
и укажите один из опций перекрестной проверки. Можно оценить прогнозирующее качество модели или как хорошо обобщается линейная регрессионая модель, используя один или несколько из этих методов «kfold»: kfoldPredict
и kfoldLoss
.
Каждый метод «kfold» использует модели, обученные внутрикратным наблюдениям, чтобы предсказать ответ для несовпадающих наблюдений. Например, предположим, что вы перекрестно проверяете с помощью пяти складок. В этом случае программное обеспечение случайным образом присваивает каждое наблюдение пяти группам примерно одинакового размера. training fold содержит четыре группы (то есть примерно 4/5 данных), а test fold - другую группу (то есть примерно 1/5 данных). В этом случае перекрестная валидация выполняется следующим образом:
Программное обеспечение обучает первую модель (хранится в CVMdl.Trained{1}
) использование наблюдений в последних четырех группах и резервирует наблюдения в первой группе для валидации.
Программное обеспечение обучает вторую модель (хранится в CVMdl.Trained{2}
) использование наблюдений в первой группе и последних трех группах. Программа резервирует наблюдения во второй группе для валидации.
Программа работает подобным образом для третьей-пятой моделей.
Если вы проверяете, вызывая kfoldPredict
, он вычисляет предсказания для наблюдений в группе 1, используя первую модель, группу 2 для второй модели и так далее. Короче говоря, программное обеспечение оценивает ответ для каждого наблюдения, используя модель, обученную без этого наблюдения.
Примечание
В отличие от других перекрестно проверенных, регрессионых моделей, RegressionPartitionedLinear
объекты модели не хранят набор данных предиктора.
CVMdl = fitrlinear(X,Y,Name,Value)
создает перекрестно проверенную линейную регрессионую модель при Name
является либо 'CrossVal'
, 'CVPartition'
, 'Holdout'
, или 'KFold'
. Для получения дополнительной информации см. fitrlinear
.
kfoldLoss | Регрессионые потери для наблюдений, не используемых в обучении |
kfoldPredict | Предсказать ответы на наблюдения, не используемые для обучения |
Значение. Чтобы узнать, как классы значений влияют на операции копирования, см. раздел «Копирование объектов».