Среды MATLAB

Образцовая динамика среды обучения укрепления с помощью MATLAB®

В сценарии изучения укрепления среда моделирует динамику, с которой взаимодействует агент. Среда:

  1. Получает действия от агента

  2. Выходные наблюдения, следующие из динамического поведения модели среды

  3. Генерирует премиальное измерение, как хорошо действие способствует достижению задачи

Можно создать предопределенные и пользовательские среды в MATLAB. Для получения дополнительной информации смотрите, Создают Среды MATLAB для Изучения Укрепления.

Функции

развернуть все

rlPredefinedEnvСоздайте предопределенную среду обучения укрепления
rlFunctionEnvЗадайте пользовательскую динамику среды обучения укрепления с помощью функций
rlCreateEnvTemplateСоздайте пользовательский шаблон среды обучения укрепления
rlMDPEnvСоздайте среду процесса принятия решений Маркова для изучения укрепления
createMDPСоздайте модель процесса принятия решений Маркова
createGridWorldСоздайте двумерный мир сетки для изучения укрепления
validateEnvironmentПодтвердите пользовательскую среду обучения укрепления
rlFiniteSetSpecСоздайте дискретные спецификации данных о действии или наблюдении для среды обучения укрепления
rlNumericSpecСоздайте непрерывные спецификации данных о действии или наблюдении для среды обучения укрепления
getActionInfoПолучите спецификации данных о действии из среды обучения укрепления или агента
getObservationInfoПолучите спецификации данных о наблюдении из среды обучения укрепления или агента

Темы

Создайте среды MATLAB для изучения укрепления

Образцовая динамика среды с помощью объекта MATLAB, который взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Задайте премиальные сигналы

Создайте премиальный сигнал, что меры, насколько успешный агент при достижении его цели.

Загрузите предопределенные среды системы управления

Можно обучить агенты в предопределенных средах системы управления MATLAB, для которых уже заданы действия, наблюдения, вознаграждения и динамика.

Загрузите предопределенные среды мира сетки

Можно обучить агенты в предопределенных средах мира сетки MATLAB, для которых уже заданы действия, наблюдения и вознаграждения.

Создайте пользовательские среды мира сетки

Можно создать пользовательские среды мира сетки MATLAB путем определения собственного размера, вознаграждений и препятствий.

Создайте Среду MATLAB с помощью Пользовательских Функций

Создайте среду обучения укрепления путем предоставления пользовательских динамических функций.

Создайте пользовательскую среду MATLAB из шаблона

Можно задать пользовательскую среду обучения укрепления путем создания и изменения объекта среды шаблона.

Для просмотра документации необходимо авторизоваться на сайте