Окружения MATLAB

Моделируйте динамику окружения обучения с подкреплением, используя MATLAB®

В сценарии обучения с подкреплением среда моделирует динамику, с которой взаимодействует агент. Среда:

  1. Получает действия от агента

  2. Формирует на выходе наблюдения, следующие из динамического поведения модели среды

  3. Генерирует вознаграждение, измеряющее, насколько хорошо действие способствует достижению задачи

Можно создать предопределенные и пользовательские среды в MATLAB. Для получения дополнительной информации смотрите, Создают Среды Обучения с подкреплением MATLAB.

Функции

развернуть все

rlPredefinedEnvСоздайте предопределенную среду обучения с подкреплением
rlFunctionEnvЗадайте пользовательскую динамику среды обучения с подкреплением с помощью функций
rlCreateEnvTemplateСоздайте пользовательский шаблон среды обучения с подкреплением
rlMDPEnvСоздайте среду марковского процесса принятия решений для обучения с подкреплением
createMDPСоздайте модель марковского процесса принятия решений
createGridWorldСоздайте двумерный мир сетки для обучения с подкреплением
validateEnvironmentПроверьте пользовательскую среду обучения с подкреплением
generateRewardFunctionСгенерируйте премиальную функцию из технических требований управления, чтобы обучить агента обучения с подкреплением
exteriorPenaltyВнешнее значение штрафа для точки относительно ограниченной области
hyperbolicPenaltyГиперболическое значение штрафа для точки относительно ограниченной области
barrierPenaltyЛогарифмическое значение штрафа барьера для точки относительно ограниченной области
rlFiniteSetSpecСоздайте дискретные спецификации данных о действии или наблюдении для среды обучения с подкреплением
rlNumericSpecСоздайте непрерывные технические требования данных о действии или наблюдении для сред обучения с подкреплением
getActionInfoПолучите спецификации данных о действии из среды обучения с подкреплением или от агента
getObservationInfoПолучите спецификации данных о наблюдении из среды обучения с подкреплением или от агента

Темы

Создайте среды обучения с подкреплением MATLAB

Динамика окружения модели с помощью объекта MATLAB, который взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Создайте среды MATLAB для Reinforcement Learning Designer

Импортируйте пользовательскую среду MATLAB или создайте предопределенную среду MATLAB.

Задайте сигналы вознаграждения

Создайте сигнал вознаграждения, который измеряет, насколько успешен агент при достижении своей цели.

Загрузите предопределенные среды системы управления

Загрузите предопределил среды системы управления MATLAB.

Загрузите предопределенные среды мира сетки

Можно обучить агентов в предопределенных средах мира сетки MATLAB, для которых уже заданы действия, наблюдения и вознаграждения.

Создайте пользовательские среды мира сетки

Можно создать пользовательские среды мира сетки MATLAB путем определения собственного размера, вознаграждений и препятствий.

Создайте среду MATLAB Используя пользовательские функции

Создайте среду обучения с подкреплением путем предоставления пользовательских динамических функций.

Создайте пользовательскую среду MATLAB из шаблона

Можно задать пользовательскую среду обучения с подкреплением путем создания и изменения объекта среды шаблона.