Агент обучения с подкреплением глубокой Q-сети
Алгоритм глубокой Q-сети (DQN) является онлайновым методом обучения с подкреплением без моделей и без политики. Агент DQN является агентом обучения с подкреплением на основе ценностей, который обучает критика оценивать текущее или будущее вознаграждения. DQN является вариантом Q-обучения, и он действует только в дискретных пространствах действий.
Для получения дополнительной информации, агенты глубоких Q-сетей. Для получения дополнительной информации о различных типах агентов обучения с подкреплением смотрите Reinforcement Learning Agents.
создает агент DQN для окружения с заданным наблюдением и спецификаций действия с помощью опций инициализации по умолчанию. Представление критика в агенте использует глубокую нейронную сеть с множественным выходным Q-значением по умолчанию, созданную из спецификации наблюдений agent
= rlDQNAgent(observationInfo
,actionInfo
)observationInfo
и спецификация действия actionInfo
.
создает агент DQN для окружения с заданным наблюдением и спецификаций действия. Агент использует сеть по умолчанию, настроенную с помощью опций, заданных в agent
= rlDQNAgent(observationInfo
,actionInfo
,initOpts
)initOpts
объект. Для получения дополнительной информации об опциях инициализации смотрите rlAgentInitializationOptions
.
создает агента DQN с указанной сетью критика с помощью набора опций по умолчанию для агента DQN.agent
= rlDQNAgent(critic
)
создает агента DQN с заданной сетью критика и устанавливает agent
= rlDQNAgent(critic
,agentOptions
)AgentOptions
свойство для agentOptions
входной параметр. Используйте этот синтаксис после любого из входных параметров в предыдущих синтаксисах.
train | Обучите агентов обучения с подкреплением в заданном окружении |
sim | Симулируйте обученных агентов обучения с подкреплением в заданном окружении |
getAction | Получите действие от агента или представления актера заданных наблюдений окружения |
getActor | Получите представление актера от агента обучения с подкреплением |
setActor | Установите представление актера агента обучения с подкреплением |
getCritic | Получите представление критика от агента обучения с подкреплением |
setCritic | Установите представление критика агента обучения с подкреплением |
generatePolicyFunction | Создайте функцию, которая оценивает обученную политику агента обучения с подкреплением |
Deep Network Designer | rlAgentInitializationOptions
| rlDQNAgentOptions
| rlQValueRepresentation