Окружения MATLAB

Моделирование динамики окружения обучения с помощью MATLAB®

В сценарии обучения с подкреплением среда моделирует динамику, с которой взаимодействует агент. Среда:

  1. Получает действия от агента

  2. Формирует на выходе наблюдения, следующие из динамического поведения модели среды

  3. Генерирует вознаграждение, измеряющее, насколько хорошо действие способствует достижению задачи

Можно создать предопределенные и пользовательские среды в MATLAB. Для получения дополнительной информации смотрите, Создают Среды MATLAB для Обучения с подкреплением.

Функции

развернуть все

rlPredefinedEnvСоздайте предопределенную среду обучения с подкреплением
rlFunctionEnvЗадайте пользовательскую динамику среды обучения с подкреплением с помощью функций
rlCreateEnvTemplateСоздайте пользовательский шаблон среды обучения с подкреплением
rlMDPEnvСоздайте среду марковского процесса принятия решений для обучения с подкреплением
createMDPСоздайте модель марковского процесса принятия решений
createGridWorldСоздайте двумерный мир сетки для обучения с подкреплением
validateEnvironmentПроверьте пользовательскую среду обучения с подкреплением
rlFiniteSetSpecСоздайте дискретные спецификации данных о действии или наблюдении для среды обучения с подкреплением
rlNumericSpecСоздайте непрерывные технические требования данных о действии или наблюдении для сред обучения с подкреплением
getActionInfoПолучите спецификации данных о действии из среды обучения с подкреплением или от агента
getObservationInfoПолучите спецификации данных о наблюдении из среды обучения с подкреплением или от агента

Темы

Создайте среды MATLAB для обучения с подкреплением

Динамика окружения модели с помощью объекта MATLAB, который взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Задайте сигналы вознаграждения

Создайте сигнал вознаграждения, который измеряет, насколько успешен агент при достижении своей цели.

Загрузите предопределенные среды системы управления

Можно обучить агентов в предопределенных средах системы управления MATLAB, для которых уже заданы действия, наблюдения, вознаграждения и динамика.

Загрузите предопределенные среды мира сетки

Можно обучить агентов в предопределенных средах мира сетки MATLAB, для которых уже заданы действия, наблюдения и вознаграждения.

Создайте пользовательские среды мира сетки

Можно создать пользовательские среды мира сетки MATLAB путем определения собственного размера, вознаграждений и препятствий.

Создайте среду MATLAB Используя пользовательские функции

Создайте среду обучения с подкреплением путем предоставления пользовательских динамических функций.

Создайте пользовательскую среду MATLAB из шаблона

Можно задать пользовательскую среду обучения с подкреплением путем создания и изменения объекта среды шаблона.