Окружения Simulink

Моделирование динамики окружения обучения с помощью Simulink^® модели

В сценарии обучения с подкреплением среда моделирует динамику, с которой взаимодействует агент. Среда:

Получает действия от агента
Формирует на выходе наблюдения, следующие из динамического поведения модели среды
Генерирует вознаграждение, измеряющее, насколько хорошо действие способствует достижению задачи

Можно создать предопределенные и пользовательские среды с помощью моделей Simulink. Для получения дополнительной информации смотрите, Создают Среды Обучения с подкреплением Simulink.

Функции

развернуть все

Создание среды

`rlPredefinedEnv`	Создайте предопределенную среду обучения с подкреплением
`rlSimulinkEnv`	Создайте среду обучения с подкреплением с помощью динамической модели, реализованной в Simulink
`createIntegratedEnv`	Создайте модель Simulink для обучения с подкреплением, с помощью образца модели в качестве среды
`validateEnvironment`	Проверьте пользовательскую среду обучения с подкреплением
`SimulinkEnvWithAgent`	Среда обучения с подкреплением с динамической моделью, реализованной в Simulink

Вознаградите расчет

`generateRewardFunction`	Сгенерируйте премиальную функцию из технических требований управления, чтобы обучить агента обучения с подкреплением
`exteriorPenalty`	Внешнее значение штрафа для точки относительно ограниченной области
`hyperbolicPenalty`	Гиперболическое значение штрафа для точки относительно ограниченной области
`barrierPenalty`	Логарифмическое значение штрафа барьера для точки относительно ограниченной области

Интерфейс среды

`rlFiniteSetSpec`	Создайте дискретные спецификации данных о действии или наблюдении для среды обучения с подкреплением
`rlNumericSpec`	Создайте непрерывные технические требования данных о действии или наблюдении для сред обучения с подкреплением
`getActionInfo`	Получите спецификации данных о действии из среды обучения с подкреплением или от агента
`getObservationInfo`	Получите спецификации данных о наблюдении из среды обучения с подкреплением или от агента
`bus2RLSpec`	Создайте технические требования данных об обучении с подкреплением для элементов шины Simulink

Блоки

RL Agent

Агент обучения с подкреплением

Темы

Создайте среды обучения с подкреплением Simulink

Моделируйте динамику среды с помощью модели Simulink, которая взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Создайте окружения Simulink для Reinforcement Learning Designer

Импортируйте пользовательское окружение Simulink или создайте предопределенное окружение Simulink.

Задайте сигналы вознаграждения

Создайте сигнал вознаграждения, который измеряет, насколько успешен агент при достижении своей цели.

Загрузите предопределенные окружения Simulink

Загрузите предопределил среды системы управления Simulink.

Модель среды обучения с подкреплением для бака с водой

Создайте окружение Simulink обучения с подкреплением, которое содержит блок RL Agent вместо контроллера для уровня воды в баке.

Документация Reinforcement Learning Toolbox

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.