Пакет: classreg.learning.partition
Суперклассы: RegressionPartitionedModel
Модель перекрестной линейной регрессии для высокоразмерных данных
RegressionPartitionedLinear представляет собой набор моделей линейной регрессии, обученных на перекрестно проверенных складках. Чтобы получить модель с перекрестной проверкой линейной регрессии, используйте fitrlinear и укажите одну из опций перекрестной проверки. Можно оценить прогнозирующее качество модели или то, насколько хорошо обобщается модель линейной регрессии, используя один или несколько из этих методов «kfold»: kfoldPredict и kfoldLoss.
Каждый метод «kfold» использует модели, обученные на кратных наблюдениях, чтобы предсказать ответ для внеплановых наблюдений. Например, предположим, что выполняется перекрестная проверка с использованием пяти сгибов. В этом случае программное обеспечение случайным образом распределяет каждое наблюдение на пять групп примерно одинакового размера. Тренировочная складка содержит четыре группы (то есть примерно 4/5 данных), а тестовая складка содержит другую группу (то есть примерно 1/5 данных). В этом случае перекрестная проверка выполняется следующим образом:
Программное обеспечение обучает первую модель (хранится в CVMdl.Trained{1}) с использованием наблюдений в последних четырех группах и резервирует наблюдения в первой группе для проверки.
Программное обеспечение обучает вторую модель (хранится в CVMdl.Trained{2}) с использованием наблюдений в первой и последних трех группах. Программа резервирует наблюдения во второй группе для проверки.
Аналогичным образом программное обеспечение работает для третьей-пятой моделей.
При проверке по вызову kfoldPredict, он вычисляет прогнозы для наблюдений в группе 1, используя первую модель, группу 2 для второй модели и так далее. Короче говоря, программное обеспечение оценивает отклик для каждого наблюдения, используя модель, обученную без этого наблюдения.
Примечание
В отличие от других перекрестно проверенных регрессионных моделей, RegressionPartitionedLinear объекты модели не хранят набор данных предиктора.
CVMdl = fitrlinear(X,Y,Name,Value) создает перекрестно проверенную модель линейной регрессии, когда Name является либо 'CrossVal', 'CVPartition', 'Holdout', или 'KFold'. Дополнительные сведения см. в разделе fitrlinear.
| kfoldLoss | Регрессионная потеря для наблюдений, не используемых в тренировках |
| kfoldPredict | Прогнозирование ответов для наблюдений, не используемых для обучения |
Значение. Сведения о том, как классы значений влияют на операции копирования, см. в разделе Копирование объектов.