Глубокий агент обучения с подкреплением Q-сети
Алгоритм глубокой Q-сети (DQN) является онлайновым, методом обучения с подкреплением вне политики без моделей. Агент DQN является основанным на значении агентом обучения с подкреплением, который обучает критика оценивать возврат или будущие вознаграждения. DQN является вариантом Q-изучения, и это действует только в дискретных пространствах действий.
Для получения дополнительной информации, Глубокие Агенты Q-сети. Для получения дополнительной информации о различных типах агентов обучения с подкреплением смотрите Агентов Обучения с подкреплением.
создает агента DQN для среды с заданным наблюдением и спецификациями действия, с помощью опций инициализации по умолчанию. Представление критика в агенте использует мультивыходную глубокую нейронную сеть Q-значения по умолчанию, созданную из спецификации наблюдений agent = rlDQNAgent(observationInfo,actionInfo)observationInfo и спецификация действия actionInfo.
создает агента DQN для среды с заданным наблюдением и спецификациями действия. Агент использует сеть по умолчанию, сконфигурированную с помощью опций, заданных в agent = rlDQNAgent(observationInfo,actionInfo,initOpts)initOpts объект. Для получения дополнительной информации об опциях инициализации смотрите rlAgentInitializationOptions.
создает агента DQN с заданной сетью критика использование набора опции по умолчанию для агента DQN.agent = rlDQNAgent(critic)
создает агента DQN с заданной сетью критика и устанавливает agent = rlDQNAgent(critic,agentOptions)AgentOptions свойство к agentOptions входной параметр. Используйте этот синтаксис после любого из входных параметров в предыдущих синтаксисах..
train | Обучите агентов обучения с подкреплением в заданной среде |
sim | Симулируйте обученных агентов обучения с подкреплением в заданной среде |
getAction | Получите действие из агента или представления актера, данного наблюдения среды |
getActor | Получите представление актера от агента обучения с подкреплением |
setActor | Установите представление актера агента обучения с подкреплением |
getCritic | Получите представление критика от агента обучения с подкреплением |
setCritic | Установите представление критика агента обучения с подкреплением |
generatePolicyFunction | Создайте функцию, которая оценивает обученную политику агента обучения с подкреплением |
rlAgentInitializationOptions | rlDQNAgentOptions | rlQValueRepresentation | Deep Network Designer