exponenta event banner

Среды MATLAB

Моделирование динамики среды обучения усиления с использованием MATLAB ®

В сценарии обучения усилению среда моделирует динамику, с которой взаимодействует агент. Окружающая среда:

  1. Получает действия от агента

  2. Вывод результатов наблюдений, полученных в результате динамического поведения модели среды

  3. Создает вознаграждение, измеряющее, насколько хорошо действие способствует выполнению задачи

В MATLAB можно создавать предопределенные и пользовательские среды. Дополнительные сведения см. в разделе Создание учебных сред для усиления MATLAB.

Функции

развернуть все

rlPredefinedEnvСоздание предварительно определенной среды обучения армированию
rlFunctionEnvЗадание пользовательской динамики среды обучения армированию с помощью функций
rlCreateEnvTemplateСоздание пользовательского шаблона среды обучения армированию
rlMDPEnvСоздание среды процесса принятия решений Маркова для обучения усилению
createMDPСоздание модели процесса принятия решений Маркова
createGridWorldСоздание двумерного мира сетки для обучения армированию
validateEnvironmentПроверка пользовательской среды обучения армированию
rlFiniteSetSpecСоздание спецификаций дискретного действия или данных наблюдения для сред обучения по усилению
rlNumericSpecСоздание спецификаций данных непрерывного действия или наблюдения для сред обучения усиления
getActionInfoПолучение спецификаций данных действий из среды обучения подкреплению или агента
getObservationInfoПолучение спецификаций данных наблюдения из среды обучения армированию или агента

Темы

Создание учебных сред для усиления MATLAB

Моделирование динамики среды с использованием объекта MATLAB, который взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Создание среды MATLAB для конструктора обучения по усилению

Импортируйте пользовательскую среду или создайте стандартную среду.

Определение сигналов поощрения

Создайте сигнал вознаграждения, который измеряет успешность агента в достижении его цели.

Загрузка предопределенных сред системы управления

Можно обучать агентов в предварительно определенных средах системы управления MATLAB, для которых уже определены действия, наблюдения, вознаграждения и динамика.

Загрузка предопределенных сред Grid World

Можно обучать агентов в предварительно определенных средах grid world MATLAB, для которых уже определены действия, наблюдения и вознаграждения.

Создание пользовательских сред Grid World

Можно создавать пользовательские среды grid world MATLAB, определяя собственные размеры, награды и препятствия.

Создание среды MATLAB с помощью пользовательских функций

Создание среды обучения армированию путем предоставления пользовательских динамических функций.

Создание пользовательской среды MATLAB на основе шаблона

Можно определить пользовательскую среду обучения армированию, создав и изменив объект среды шаблона.