Пакет: classreg.learning.partition
Суперклассы: ClassificationPartitionedModel
Перекрестно проверенная линейная модель для двоичной классификации высокомерных данных
ClassificationPartitionedLinear представляет собой набор моделей линейной классификации, обученных перекрестно проверенным складкам. Для получения модели с перекрестной проверкой линейной классификации используйте fitclinear и укажите одну из опций перекрестной проверки. Оценить качество классификации или то, насколько хорошо обобщается модель линейной классификации, можно с помощью одного или нескольких методов «kfold»: kfoldPredict, kfoldLoss, kfoldMargin, и kfoldEdge.
Каждый метод «kfold» использует модели, обученные на кратных наблюдениях, чтобы предсказать ответ для внеплановых наблюдений. Например, предположим, что выполняется перекрестная проверка с использованием пяти сгибов. В этом случае программное обеспечение случайным образом распределяет каждое наблюдение на пять групп примерно одинакового размера. Тренировочная складка содержит четыре группы (то есть примерно 4/5 данных), а тестовая складка содержит другую группу (то есть примерно 1/5 данных). В этом случае перекрестная проверка выполняется следующим образом:
Программное обеспечение обучает первую модель (хранится в CVMdl.Trained{1}) с использованием наблюдений в последних четырех группах и резервирует наблюдения в первой группе для проверки.
Программное обеспечение обучает вторую модель, которая хранится в CVMdl.Trained{2}, используя наблюдения в первой и последних трех группах. Программа резервирует наблюдения во второй группе для проверки.
Аналогичным образом программное обеспечение работает для третьей-пятой моделей.
При проверке по вызову kfoldPredict, он вычисляет прогнозы для наблюдений в группе 1, используя первую модель, группу 2 для второй модели и так далее. Короче говоря, программное обеспечение оценивает отклик для каждого наблюдения, используя модель, обученную без этого наблюдения.
Примечание
ClassificationPartitionedLinear объекты модели не хранят набор данных предиктора.
CVMdl = fitclinear(X,Y,Name,Value) создает перекрестно проверенную линейную классификационную модель, когда Name является либо 'CrossVal', 'CVPartition', 'Holdout', или 'KFold'. Дополнительные сведения см. в разделе fitclinear.
| kfoldEdge | Край классификации для наблюдений, не используемых для обучения |
| kfoldLoss | Классификационные потери для наблюдений, не используемых в обучении |
| kfoldMargin | Поля классификации для наблюдений, не используемых при обучении |
| kfoldPredict | Прогнозирование меток для наблюдений, не используемых для обучения |
Значение. Сведения о том, как классы значений влияют на операции копирования, см. в разделе Копирование объектов.
ClassificationLinear | fitclinear | kfoldLoss | kfoldPredict