Окружения Simulink

Моделирование динамики окружения обучения с помощью моделей Simulink®

В сценарии обучения с подкреплением среда моделирует динамику, с которой взаимодействует агент. Среда:

  1. Получает действия от агента

  2. Формирует на выходе наблюдения, следующие из динамического поведения модели среды

  3. Генерирует вознаграждение, измеряющее, насколько хорошо действие способствует достижению задачи

Можно создать предопределенные и пользовательские среды с помощью моделей Simulink. Для получения дополнительной информации смотрите, Создают Среды Обучения с подкреплением Simulink.

Функции

развернуть все

rlPredefinedEnvСоздайте предопределенную среду обучения с подкреплением
rlSimulinkEnvСоздайте среду обучения с подкреплением с помощью динамической модели, реализованной в Simulink
createIntegratedEnvСоздайте модель Simulink для обучения с подкреплением, с помощью образца модели в качестве среды
validateEnvironmentПроверьте пользовательскую среду обучения с подкреплением
SimulinkEnvWithAgentСреда обучения с подкреплением с динамической моделью, реализованной в Simulink
rlFiniteSetSpecСоздайте дискретные спецификации данных о действии или наблюдении для среды обучения с подкреплением
rlNumericSpecСоздайте непрерывные технические требования данных о действии или наблюдении для сред обучения с подкреплением
getActionInfoПолучите спецификации данных о действии из среды обучения с подкреплением или от агента
getObservationInfoПолучите спецификации данных о наблюдении из среды обучения с подкреплением или от агента
bus2RLSpecСоздайте технические требования данных об обучении с подкреплением для элементов шины Simulink

Блоки

RL AgentАгент обучения с подкреплением

Темы

Создайте среды обучения с подкреплением Simulink

Моделируйте динамику среды с помощью модели Simulink, которая взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Создайте окружения Simulink для Reinforcement Learning Designer

Импортируйте пользовательскую среду или создайте предопределенную среду.

Задайте сигналы вознаграждения

Создайте сигнал вознаграждения, который измеряет, насколько успешен агент при достижении своей цели.

Загрузите предопределенные окружения Simulink

Можно обучать агентов в средах для предопределенных моделей Simulink, для которых уже заданы действия, наблюдения, вознаграждения и динамика.

Модель среды обучения с подкреплением для бака с водой

Создайте окружение Simulink обучения с подкреплением, которое содержит блок RL Agent вместо контроллера для уровня воды в баке.