Окружения Simulink

Моделирование динамики окружения обучения с помощью моделей Simulink^®

В сценарии обучения с подкреплением среда моделирует динамику, с которой взаимодействует агент. Среда:

Получает действия от агента
Формирует на выходе наблюдения, следующие из динамического поведения модели среды
Вырабатывает вознаграждение, показывающее как хорошо действие способствует достижению задачи

Можно создать предопределенные и пользовательские среды с помощью моделей Simulink. Для получения дополнительной информации смотрите, Создают окружения Simulink для Обучения с подкреплением.

Функции

развернуть все

Создание среды

`rlPredefinedEnv`	Создайте предопределенную среду обучения с подкреплением
`rlSimulinkEnv`	Создайте среду обучения с подкреплением с помощью динамической модели, реализованной в Simulink
`createIntegratedEnv`	Создайте модель Simulink для обучения с подкреплением, с помощью эталонной модели в качестве среды
`validateEnvironment`	Проверьте пользовательскую среду обучения с подкреплением

Интерфейс среды

`rlFiniteSetSpec`	Создайте дискретные спецификации данных о действии или наблюдении для среды обучения с подкреплением
`rlNumericSpec`	Создайте непрерывные спецификации данных о действии или наблюдении для сред обучения с подкреплением
`getActionInfo`	Получите спецификации данных о действии из среды обучения с подкреплением или от агента
`getObservationInfo`	Получите спецификации данных о наблюдении из среды обучения с подкреплением или от агента
`bus2RLSpec`	Создайте спецификации данных об обучении с подкреплением для элементов шины Simulink

Блоки

RL Agent

Агент обучения с подкреплением

Темы

Создайте окружения Simulink для обучения с подкреплением

Динамика среды модели с помощью модели Simulink, которая взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Задайте сигналы вознаграждения

Создайте сигнал вознаграждения, который измеряется, насколько успешный агент при достижении его цели.

Загрузите предопределенные окружения Simulink

Можно обучить агентов в средах для предопределенных моделей Simulink, для которых уже заданы действия, наблюдения, вознаграждения и динамика.

Документация Reinforcement Learning Toolbox

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.