Задайте пользовательскую динамику окружения обучения с подкреплением с помощью функций
Использование rlFunctionEnv
для определения пользовательского окружения обучения с подкреплением. Вы предоставляете MATLAB® функции, которые определяют шаг и сброс поведения для окружения. Этот объект полезен, когда вы хотите настроить свое окружение за пределами предопределённых окружений, доступной с rlPredefinedEnv
.
getActionInfo | Получите спецификации данных о действии из окружения обучения с подкреплением или от агента |
getObservationInfo | Получите спецификации данных о наблюдении из окружения обучения с подкреплением или от агента |
train | Обучите агентов обучения с подкреплением в заданном окружении |
sim | Симулируйте обученных агентов обучения с подкреплением в заданном окружении |
validateEnvironment | Проверьте пользовательское окружение обучения с подкреплением |