Агент изучения укрепления
Reinforcement Learning Toolbox
![]()
Используйте блок RL Agent, чтобы моделировать и обучить агент изучения укрепления в Simulink®. Вы сопоставляете блок с агентом, сохраненным в рабочей области MATLAB® или словаре данных как объект агента, такой как объект rlACAgent или rlDDPGAgent. Вы соединяете блок так, чтобы он получил наблюдение и вычисленное вознаграждение. Например, рассмотрите следующую блок-схему модели SimplePendulumModel.

Входной порт observation блока RL Agent получает сигнал, который выведен от мгновенного угла и угловой скорости маятника. Порт reward получает вознаграждение, вычисленное от тех же двух значений и прикладного действия. Вы конфигурируете наблюдения и вознаграждаете вычисления, которые соответствуют вашей системе.
Блок использует агент, чтобы сгенерировать действие на основе наблюдения и вознаграждения, которое вы предоставляете. Соедините выходной порт action с соответствующим входом для вашей системы. Например, в SimplePendulumModel, порт action является крутящим моментом, применился к системе маятника. Для получения дополнительной информации об этой модели, смотрите Train Агент DQN к Swing и Маятнику Баланса.
Чтобы обучить агент изучения укрепления в Simulink, вы генерируете среду из модели Simulink. Вы затем создаете и конфигурируете агент для обучения против той среды. Для получения дополнительной информации смотрите, Создают окружения Simulink для Изучения Укрепления. Когда вы вызываете train с помощью среды, train моделирует модель и обновляет агент, сопоставленный с блоком.