Агент обучения с подкреплением
Reinforcement Learning Toolbox
Используйте блок RL Agent для симуляции и обучения агента обучения с подкреплением в Simulink®. Вы связываете блок с агентом, хранящимся в MATLAB® рабочая область или словарь данных как объект агента, такой как rlACAgent
или rlDDPGAgent
объект. Вы соединяете блок так, чтобы он получил наблюдение и вычисленное вознаграждение. Например, рассмотрите следующий блок rlSimplePendulumModel
модель.
The observation
входной порт блока RL Agent получает сигнал, который выводится из мгновенных угла и скорости вращения маятника. The reward
порт получает вознаграждение, рассчитанное из тех же двух значений и приложенного действия. Вы конфигурируете наблюдения и расчеты вознаграждения, соответствующие вашей системе.
Блок использует агента, чтобы сгенерировать действие на основе наблюдений и вознаграждения, которое вы предоставляете. Соедините action
выходной порт на соответствующий вход для вашей системы. Для образца, в rlSimplePendulumModel
, а action
порт является крутящим моментом, приложенным к системе маятника. Для получения дополнительной информации об этой модели см. «Train агента DQN к качанию» и «Баланс маятника».
Чтобы обучить агента обучения с подкреплением в Simulink, вы генерируете окружение из модели Simulink. Затем вы создаете и конфигурируете агента для обучения с этим окружением. Для получения дополнительной информации см. Раздел «Создание окружений обучения с подкреплением Simulink». Когда вы звоните train
используя окружение, train
моделирует модель и обновляет агента, связанного с блоком.