Создайте агент изучения укрепления градиента политики
agent = rlPGAgent(actor)
agent = rlPGAgent(actor,critic)
agent = rlPGAgent(___,opt)
создает агент PG с заданной сетью агента. По умолчанию свойством agent
= rlPGAgent(actor
)UseBaseline
агента является false
для этого случая. Для получения дополнительной информации об агентах PG смотрите Агенты Градиента политики.
создает агент PG с заданным агентом и сетями критика. По умолчанию опцией agent
= rlPGAgent(actor
,critic
)UseBaseline
является true
для этого случая.
создает агент PG с помощью заданных опций агента, чтобы заменить значения по умолчанию агента.agent
= rlPGAgent(___,opt
)