Задание пользовательской динамики среды обучения армированию с помощью функций
Использовать rlFunctionEnv для определения пользовательской среды обучения армированию. Предоставляются функции MATLAB ®, определяющие поведение шага и сброса для среды. Этот объект полезен, когда требуется настроить среду за пределами предварительно определенных сред, доступных вrlPredefinedEnv.
getActionInfo | Получение спецификаций данных действий из среды обучения подкреплению или агента |
getObservationInfo | Получение спецификаций данных наблюдения из среды обучения армированию или агента |
train | Подготовка обучающих агентов по усилению в определенной среде |
sim | Моделирование обученных агентов по обучению подкреплению в определенной среде |
validateEnvironment | Проверка пользовательской среды обучения армированию |