Среды Simulink

Динамика среды обучения для усиления модели с использованием моделей Simulink ®

В сценарии обучения усилению среда моделирует динамику, с которой взаимодействует агент. Окружающая среда:

Получает действия от агента
Вывод результатов наблюдений, полученных в результате динамического поведения модели среды
Создает вознаграждение, измеряющее, насколько хорошо действие способствует выполнению задачи

С помощью моделей Simulink можно создавать стандартные и пользовательские среды. Дополнительные сведения см. в разделе Создание учебных сред усиления Simulink.

Функции

развернуть все

Создание среды

`rlPredefinedEnv`	Создание предварительно определенной среды обучения армированию
`rlSimulinkEnv`	Создание среды обучения армированию с использованием динамической модели, реализованной в Simulink
`createIntegratedEnv`	Создание модели Simulink для обучения армированию с использованием ссылочной модели в качестве среды
`validateEnvironment`	Проверка пользовательской среды обучения армированию
`SimulinkEnvWithAgent`	Усиливающая среда обучения с динамической моделью, реализованной в Simulink

Интерфейс среды

`rlFiniteSetSpec`	Создание спецификаций дискретного действия или данных наблюдения для сред обучения по усилению
`rlNumericSpec`	Создание спецификаций данных непрерывного действия или наблюдения для сред обучения усиления
`getActionInfo`	Получение спецификаций данных действий из среды обучения подкреплению или агента
`getObservationInfo`	Получение спецификаций данных наблюдения из среды обучения армированию или агента
`bus2RLSpec`	Создание спецификаций данных обучения армированию для элементов шины Simulink

Блоки

Агент RL

Усиливающий обучающий агент

Темы

Создание учебных сред для усиления Simulink

Моделирование динамики среды с использованием модели Simulink, которая взаимодействует с агентом, генерируя вознаграждения и наблюдения в ответ на действия агента.

Создание сред Simulink для конструктора обучения по усилению

Импортируйте пользовательскую среду или создайте стандартную среду.

Определение сигналов поощрения

Создайте сигнал вознаграждения, который измеряет успешность агента в достижении его цели.

Загрузка предопределенных сред Simulink

Можно обучать агентов в средах для предварительно определенных моделей Simulink, для которых уже определены действия, наблюдения, вознаграждения и динамика.

Модель учебной среды для усиления резервуаров для воды

Создайте среду обучения усилению Simulink, которая содержит блок агента RL вместо контроллера уровня воды в резервуаре.

Документация по инструментам обучения для усиления

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.