Задайте пользовательскую динамику среды обучения укрепления с помощью функций
Используйте rlFunctionEnv
, чтобы задать пользовательскую среду обучения укрепления. Вы обеспечиваете функции MATLAB®, которые задают шаг и сбрасывают поведение для среды. Этот объект полезен когда это необходимо, чтобы настроить вашу среду вне предопределенных сред, доступных с rlPredefinedEnv
.
env = rlFunctionEnv(obsInfo,actInfo,stepfcn,resetfcn)
getActionInfo | Получите спецификации данных о действии из среды обучения укрепления или агента |
getObservationInfo | Получите спецификации данных о наблюдении из среды обучения укрепления или агента |
sim | Моделируйте обученный агент изучения укрепления в заданной среде |
validateEnvironment | Подтвердите пользовательскую среду обучения укрепления |