Создайте агента обучения с подкреплением градиента политики
создает агента PG с заданной сетью агента. По умолчанию, agent = rlPGAgent(actor)UseBaseline свойством агента является false для этого случая. Для получения дополнительной информации об агентах PG смотрите Агентов Градиента политики.
создает агента PG с заданным агентом и сетями критика. По умолчанию, agent = rlPGAgent(actor,critic)UseBaseline опцией является true для этого случая.
создает агента PG с помощью заданных опций агента, чтобы заменить значения по умолчанию агента.agent = rlPGAgent(___,opt)