В сценарии обучения с подкреплением окружение моделирует динамику, с которой взаимодействует агент. Далее окружение:
Получает действия от агента
Формирует на выходе наблюдения, следующие из динамического поведения модели окружения
Генерирует вознаграждение, измеряющее, насколько хорошо действие способствует достижению задачи
Можно создать предопределённые и пользовательские окружения в MATLAB. Для получения дополнительной информации смотрите Создание окружений обучения с подкреплением MATLAB.
Создайте окружения обучения с подкреплением MATLAB
Моделируйте динамику окружения с помощью объекта MATLAB, который взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.
Создайте Окружения MATLAB для Reinforcement Learning Designer
Импортируйте пользовательское окружение или создайте предопределённое окружение.
Задайте сигналы вознаграждения
Создайте сигнал вознаграждения, который измеряет, насколько успешен агент при достижении своей цели.
Загрузка предопределённых окружений системы управления
Можно обучать агентов в предопределённых окружениях системы управления MATLAB, для которых уже заданы действия, наблюдения, вознаграждения и динамика.
Загрузка предопределённых окружений мира сетки
Можно обучать агентов в предопределённых окружениях мира сетки MATLAB, для которых уже заданы действия, наблюдения и вознаграждения.
Создайте пользовательские окружения мира сетки
Можно создать пользовательские окружения мира сетки MATLAB путем определения собственного размера, вознаграждений и препятствий.
Создайте окружение MATLAB с помощью пользовательских функций
Создайте окружение обучения с подкреплением путем предоставления пользовательских динамических функций.
Создайте пользовательское окружение MATLAB из шаблона
Можно задать пользовательское окружение обучения с подкреплением путем создания и изменения объекта окружения шаблона.