Окружения MATLAB

Моделирование динамики окружения обучения с помощью MATLAB^®

В сценарии обучения с подкреплением среда моделирует динамику, с которой взаимодействует агент. Среда:

Получает действия от агента
Формирует на выходе наблюдения, следующие из динамического поведения модели среды
Генерирует вознаграждение, измеряющее, насколько хорошо действие способствует достижению задачи

Можно создать предопределенные и пользовательские среды в MATLAB. Для получения дополнительной информации смотрите, Создают Среды Обучения с подкреплением MATLAB.

Функции

развернуть все

Создание среды

`rlPredefinedEnv`	Создайте предопределенную среду обучения с подкреплением
`rlFunctionEnv`	Задайте пользовательскую динамику среды обучения с подкреплением с помощью функций
`rlCreateEnvTemplate`	Создайте пользовательский шаблон среды обучения с подкреплением
`rlMDPEnv`	Создайте среду марковского процесса принятия решений для обучения с подкреплением
`createMDP`	Создайте модель марковского процесса принятия решений
`createGridWorld`	Создайте двумерный мир сетки для обучения с подкреплением
`validateEnvironment`	Проверьте пользовательскую среду обучения с подкреплением

Интерфейс среды

`rlFiniteSetSpec`	Создайте дискретные спецификации данных о действии или наблюдении для среды обучения с подкреплением
`rlNumericSpec`	Создайте непрерывные технические требования данных о действии или наблюдении для сред обучения с подкреплением
`getActionInfo`	Получите спецификации данных о действии из среды обучения с подкреплением или от агента
`getObservationInfo`	Получите спецификации данных о наблюдении из среды обучения с подкреплением или от агента

Темы

Создайте среды обучения с подкреплением MATLAB

Динамика окружения модели с помощью объекта MATLAB, который взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Создайте среды MATLAB для Reinforcement Learning Designer

Импортируйте пользовательскую среду или создайте предопределенную среду.

Задайте сигналы вознаграждения

Создайте сигнал вознаграждения, который измеряет, насколько успешен агент при достижении своей цели.

Загрузите предопределенные среды системы управления

Можно обучить агентов в предопределенных средах системы управления MATLAB, для которых уже заданы действия, наблюдения, вознаграждения и динамика.

Загрузите предопределенные среды мира сетки

Можно обучить агентов в предопределенных средах мира сетки MATLAB, для которых уже заданы действия, наблюдения и вознаграждения.

Создайте пользовательские среды мира сетки

Можно создать пользовательские среды мира сетки MATLAB путем определения собственного размера, вознаграждений и препятствий.

Создайте среду MATLAB Используя пользовательские функции

Создайте среду обучения с подкреплением путем предоставления пользовательских динамических функций.

Создайте пользовательскую среду MATLAB из шаблона

Можно задать пользовательскую среду обучения с подкреплением путем создания и изменения объекта среды шаблона.

Документация Reinforcement Learning Toolbox

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.