В сценарии изучения укрепления среда моделирует динамику, с которой взаимодействует агент. Среда:
Получает действия от агента
Выходные наблюдения, следующие из динамического поведения модели среды
Генерирует премиальное измерение, как хорошо действие способствует достижению задачи
Можно создать предопределенные и пользовательские среды в MATLAB. Для получения дополнительной информации смотрите, Создают Среды MATLAB для Изучения Укрепления.
Создайте среды MATLAB для изучения укрепления
Образцовая динамика среды с помощью объекта MATLAB, который взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.
Создайте премиальный сигнал, что меры, насколько успешный агент при достижении его цели.
Загрузите предопределенные среды системы управления
Можно обучить агенты в предопределенных средах системы управления MATLAB, для которых уже заданы действия, наблюдения, вознаграждения и динамика.
Загрузите предопределенные среды мира сетки
Можно обучить агенты в предопределенных средах мира сетки MATLAB, для которых уже заданы действия, наблюдения и вознаграждения.
Создайте пользовательские среды мира сетки
Можно создать пользовательские среды мира сетки MATLAB путем определения собственного размера, вознаграждений и препятствий.
Создайте Среду MATLAB с помощью Пользовательских Функций
Создайте среду обучения укрепления путем предоставления пользовательских динамических функций.
Создайте пользовательскую среду MATLAB из шаблона
Можно задать пользовательскую среду обучения укрепления путем создания и изменения объекта среды шаблона.