Создайте агента обучения с подкреплением градиента политики
создает агента PG с заданной сетью агента. По умолчанию, agent
= rlPGAgent(actor
)UseBaseline
свойством агента является false
для этого случая. Для получения дополнительной информации об агентах PG смотрите Агентов Градиента политики.
создает агента PG с заданным агентом и сетями критика. По умолчанию, agent
= rlPGAgent(actor
,critic
)UseBaseline
опцией является true
для этого случая.
создает агента PG с помощью заданных опций агента, чтобы заменить значения по умолчанию агента.agent
= rlPGAgent(___,opt
)