Создайте агент изучения укрепления градиента политики
agent = rlPGAgent(actor)agent = rlPGAgent(actor,critic)agent = rlPGAgent(___,opt) создает агент PG с заданной сетью агента. По умолчанию свойством agent = rlPGAgent(actor)UseBaseline агента является false для этого случая. Для получения дополнительной информации об агентах PG смотрите Агенты Градиента политики.
создает агент PG с заданным агентом и сетями критика. По умолчанию опцией agent = rlPGAgent(actor,critic)UseBaseline является true для этого случая.
создает агент PG с помощью заданных опций агента, чтобы заменить значения по умолчанию агента.agent = rlPGAgent(___,opt)