Окружения Simulink

Образцовая динамика среды обучения укрепления с помощью моделей Simulink^®

В сценарии изучения укрепления среда моделирует динамику, с которой взаимодействует агент. Среда:

Получает действия от агента
Выходные наблюдения, следующие из динамического поведения модели среды
Генерирует премиальное измерение, как хорошо действие способствует достижению задачи

Можно создать предопределенное и пользовательское использование сред Simulinkmodels. Для получения дополнительной информации смотрите, Создают окружения Simulink для Изучения Укрепления.

Функции

развернуть все

Создание среды

`rlPredefinedEnv`	Создайте предопределенную среду обучения укрепления
`rlSimulinkEnv`	Создайте среду обучения укрепления с помощью динамической модели, реализованной в Simulink
`createIntegratedEnv`	Создайте модель Simulink для изучения укрепления, с помощью эталонной модели в качестве среды
`validateEnvironment`	Подтвердите пользовательскую среду обучения укрепления

Интерфейс среды

`rlFiniteSetSpec`	Создайте дискретные спецификации данных о действии или наблюдении для среды обучения укрепления
`rlNumericSpec`	Создайте непрерывные спецификации данных о действии или наблюдении для среды обучения укрепления
`getActionInfo`	Получите спецификации данных о действии из среды обучения укрепления или агента
`getObservationInfo`	Получите спецификации данных о наблюдении из среды обучения укрепления или агента
`bus2RLSpec`	Создайте укрепление, изучив спецификации данных для элементов шины Simulink

Блоки

RL Agent

Агент изучения укрепления

Темы

Создайте окружения Simulink для изучения укрепления

Образцовая динамика среды с помощью модели Simulink, которая взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Задайте премиальные сигналы

Создайте премиальный сигнал, что меры, насколько успешный агент при достижении его цели.

Загрузите предопределенные окружения Simulink

Можно обучить агенты в средах для предопределенных моделей Simulink, для которых уже заданы действия, наблюдения, вознаграждения и динамика.

Документация Reinforcement Learning Toolbox

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.