Окружения Simulink

Моделирование динамики окружения обучения с помощью моделей Simulink®

В сценарии обучения с подкреплением среда моделирует динамику, с которой взаимодействует агент. Среда:

  1. Получает действия от агента

  2. Формирует на выходе наблюдения, следующие из динамического поведения модели среды

  3. Генерирует вознаграждение, измеряющее, насколько хорошо действие способствует достижению задачи

Можно создать предопределенные и пользовательские среды с помощью моделей Simulink. Для получения дополнительной информации смотрите, Создают окружения Simulink для Обучения с подкреплением.

Функции

развернуть все

rlPredefinedEnvСоздайте предопределенную среду обучения с подкреплением
rlSimulinkEnvСоздайте среду обучения с подкреплением с помощью динамической модели, реализованной в Simulink
createIntegratedEnvСоздайте модель Simulink для обучения с подкреплением, с помощью образца модели в качестве среды
validateEnvironmentПроверьте пользовательскую среду обучения с подкреплением
rlFiniteSetSpecСоздайте дискретные спецификации данных о действии или наблюдении для среды обучения с подкреплением
rlNumericSpecСоздайте непрерывные технические требования данных о действии или наблюдении для сред обучения с подкреплением
getActionInfoПолучите спецификации данных о действии из среды обучения с подкреплением или от агента
getObservationInfoПолучите спецификации данных о наблюдении из среды обучения с подкреплением или от агента
bus2RLSpecСоздайте технические требования данных об обучении с подкреплением для элементов шины Simulink

Блоки

RL AgentАгент обучения с подкреплением

Темы

Создайте окружения Simulink для обучения с подкреплением

Моделируйте динамику среды с помощью модели Simulink, которая взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Задайте сигналы вознаграждения

Создайте сигнал вознаграждения, который измеряет, насколько успешен агент при достижении своей цели.

Загрузите предопределенные окружения Simulink

Можно обучать агентов в средах для предопределенных моделей Simulink, для которых уже заданы действия, наблюдения, вознаграждения и динамика.

Модель среды обучения с подкреплением для бака с водой

Создайте окружение Simulink обучения с подкреплением, которое содержит блок RL Agent вместо контроллера для уровня воды в баке.