Окружения Simulink

Моделирование динамики окружения обучения с помощью моделей Simulink®

В сценарии обучения с подкреплением среда моделирует динамику, с которой взаимодействует агент. Среда:

  1. Получает действия от агента

  2. Формирует на выходе наблюдения, следующие из динамического поведения модели среды

  3. Вырабатывает вознаграждение, показывающее как хорошо действие способствует достижению задачи

Можно создать предопределенные и пользовательские среды с помощью моделей Simulink. Для получения дополнительной информации смотрите, Создают окружения Simulink для Обучения с подкреплением.

Функции

развернуть все

rlPredefinedEnvСоздайте предопределенную среду обучения с подкреплением
rlSimulinkEnvСоздайте среду обучения с подкреплением с помощью динамической модели, реализованной в Simulink
createIntegratedEnvСоздайте модель Simulink для обучения с подкреплением, с помощью эталонной модели в качестве среды
validateEnvironmentПроверьте пользовательскую среду обучения с подкреплением
rlFiniteSetSpecСоздайте дискретные спецификации данных о действии или наблюдении для среды обучения с подкреплением
rlNumericSpecСоздайте непрерывные спецификации данных о действии или наблюдении для сред обучения с подкреплением
getActionInfoПолучите спецификации данных о действии из среды обучения с подкреплением или от агента
getObservationInfoПолучите спецификации данных о наблюдении из среды обучения с подкреплением или от агента
bus2RLSpecСоздайте спецификации данных об обучении с подкреплением для элементов шины Simulink

Блоки

RL AgentАгент обучения с подкреплением

Темы

Создайте окружения Simulink для обучения с подкреплением

Динамика среды модели с помощью модели Simulink, которая взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Задайте сигналы вознаграждения

Создайте сигнал вознаграждения, который измеряется, насколько успешный агент при достижении его цели.

Загрузите предопределенные окружения Simulink

Можно обучить агентов в средах для предопределенных моделей Simulink, для которых уже заданы действия, наблюдения, вознаграждения и динамика.

Для просмотра документации необходимо авторизоваться на сайте