Окружения MATLAB

Моделируйте динамику окружения обучения с подкреплением с помощью MATLAB®

В сценарии обучения с подкреплением окружение моделирует динамику, с которой взаимодействует агент. Далее окружение:

  1. Получает действия от агента

  2. Формирует на выходе наблюдения, следующие из динамического поведения модели окружения

  3. Генерирует вознаграждение, измеряющее, насколько хорошо действие способствует достижению задачи

Можно создать предопределённые и пользовательские окружения в MATLAB. Для получения дополнительной информации смотрите Создание окружений обучения с подкреплением MATLAB.

Функции

расширить все

rlPredefinedEnvСоздайте предопределённое окружение обучения с подкреплением
rlFunctionEnvЗадайте пользовательскую динамику окружения обучения с подкреплением с помощью функций
rlCreateEnvTemplateСоздайте пользовательский шаблон окружения обучения с подкреплением
rlMDPEnvСоздайте окружение марковского процесса принятия решений для обучения с подкреплением
createMDPСоздайте модель марковского процесса принятия решений
createGridWorldСоздайте двумерный мир сетки для обучения с подкреплением
validateEnvironmentПроверьте пользовательское окружение обучения с подкреплением
rlFiniteSetSpecСоздайте дискретные спецификации данных о действии или наблюдении для окружений обучения с подкреплением
rlNumericSpecСоздайте непрерывные спецификации данных о действии или наблюдении для окружений обучения с подкреплением
getActionInfoПолучите спецификации данных о действии из окружения обучения с подкреплением или от агента
getObservationInfoПолучите спецификации данных о наблюдении из окружения обучения с подкреплением или от агента

Темы

Создайте окружения обучения с подкреплением MATLAB

Моделируйте динамику окружения с помощью объекта MATLAB, который взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Создайте Окружения MATLAB для Reinforcement Learning Designer

Импортируйте пользовательское окружение или создайте предопределённое окружение.

Задайте сигналы вознаграждения

Создайте сигнал вознаграждения, который измеряет, насколько успешен агент при достижении своей цели.

Загрузка предопределённых окружений системы управления

Можно обучать агентов в предопределённых окружениях системы управления MATLAB, для которых уже заданы действия, наблюдения, вознаграждения и динамика.

Загрузка предопределённых окружений мира сетки

Можно обучать агентов в предопределённых окружениях мира сетки MATLAB, для которых уже заданы действия, наблюдения и вознаграждения.

Создайте пользовательские окружения мира сетки

Можно создать пользовательские окружения мира сетки MATLAB путем определения собственного размера, вознаграждений и препятствий.

Создайте окружение MATLAB с помощью пользовательских функций

Создайте окружение обучения с подкреплением путем предоставления пользовательских динамических функций.

Создайте пользовательское окружение MATLAB из шаблона

Можно задать пользовательское окружение обучения с подкреплением путем создания и изменения объекта окружения шаблона.