exponenta event banner

Среды Simulink

Динамика среды обучения для усиления модели с использованием моделей Simulink ®

В сценарии обучения усилению среда моделирует динамику, с которой взаимодействует агент. Окружающая среда:

  1. Получает действия от агента

  2. Вывод результатов наблюдений, полученных в результате динамического поведения модели среды

  3. Создает вознаграждение, измеряющее, насколько хорошо действие способствует выполнению задачи

С помощью моделей Simulink можно создавать стандартные и пользовательские среды. Дополнительные сведения см. в разделе Создание учебных сред усиления Simulink.

Функции

развернуть все

rlPredefinedEnvСоздание предварительно определенной среды обучения армированию
rlSimulinkEnvСоздание среды обучения армированию с использованием динамической модели, реализованной в Simulink
createIntegratedEnvСоздание модели Simulink для обучения армированию с использованием ссылочной модели в качестве среды
validateEnvironmentПроверка пользовательской среды обучения армированию
SimulinkEnvWithAgentУсиливающая среда обучения с динамической моделью, реализованной в Simulink
rlFiniteSetSpecСоздание спецификаций дискретного действия или данных наблюдения для сред обучения по усилению
rlNumericSpecСоздание спецификаций данных непрерывного действия или наблюдения для сред обучения усиления
getActionInfoПолучение спецификаций данных действий из среды обучения подкреплению или агента
getObservationInfoПолучение спецификаций данных наблюдения из среды обучения армированию или агента
bus2RLSpecСоздание спецификаций данных обучения армированию для элементов шины Simulink

Блоки

Агент RLУсиливающий обучающий агент

Темы

Создание учебных сред для усиления Simulink

Моделирование динамики среды с использованием модели Simulink, которая взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Создание сред Simulink для конструктора обучения по усилению

Импортируйте пользовательскую среду или создайте стандартную среду.

Определение сигналов поощрения

Создайте сигнал вознаграждения, который измеряет успешность агента в достижении его цели.

Загрузка предопределенных сред Simulink

Можно обучать агентов в средах для предварительно определенных моделей Simulink, для которых уже определены действия, наблюдения, вознаграждения и динамика.

Модель учебной среды для усиления резервуаров для воды

Создайте среду обучения усилению Simulink, которая содержит блок агента RL вместо контроллера уровня воды в резервуаре.