Окружения Simulink

Моделируйте динамику окружения обучения с подкреплением с помощью Simulink® модели

В сценарии обучения с подкреплением окружение моделирует динамику, с которой взаимодействует агент. Далее окружение:

  1. Получает действия от агента

  2. Формирует на выходе наблюдения, следующие из динамического поведения модели окружения

  3. Генерирует вознаграждение, измеряющее, насколько хорошо действие способствует достижению задачи

Предопределённые и пользовательские окружения можно создать с помощью моделей Simulink. Для получения дополнительной информации см. Раздел «Создание окружений обучения с подкреплением Simulink».

Функции

расширить все

rlPredefinedEnvСоздайте предопределённое окружение обучения с подкреплением
rlSimulinkEnvСоздайте окружение обучения с подкреплением с помощью динамической модели, реализованной в Simulink
createIntegratedEnvСоздайте модель Simulink для обучения с подкреплением, используя образец модели как окружение
validateEnvironmentПроверьте пользовательское окружение обучения с подкреплением
SimulinkEnvWithAgentОкружение обучения с подкреплением с динамической моделью, реализованной в Simulink
rlFiniteSetSpecСоздайте дискретные спецификации данных о действии или наблюдении для окружений обучения с подкреплением
rlNumericSpecСоздайте непрерывные спецификации данных о действии или наблюдении для окружений обучения с подкреплением
getActionInfoПолучите спецификации данных о действии из окружения обучения с подкреплением или от агента
getObservationInfoПолучите спецификации данных о наблюдении из окружения обучения с подкреплением или от агента
bus2RLSpecСоздайте спецификации данных обучения с подкреплением для элементов массива шины Simulink

Блоки

RL AgentАгент обучения с подкреплением

Темы

Создайте окружения обучения с подкреплением Simulink

Моделируйте динамику окружения с помощью модели Simulink, которая взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Создайте окружения Simulink для Reinforcement Learning Designer

Импортируйте пользовательское окружение или создайте предопределённое окружение.

Задайте сигналы вознаграждения

Создайте сигнал вознаграждения, который измеряет, насколько успешен агент при достижении своей цели.

Загрузка предопределённых окружений Simulink

Можно обучать агентов в окружениях для предопределенных моделей Simulink, для которых уже заданы действия, наблюдения, вознаграждения и динамика.

Обучение с подкреплением для бака с водой Окружения модель

Создайте окружение Simulink обучения с подкреплением, которая содержит блок RL Agent вместо контроллера уровня воды в баке.