Агент обучения усилению глубокой Q-сети
Алгоритм глубокой Q-сети (DQN) - это метод обучения без модели, онлайн, вне политики. Агент DQN - это агент обучения усилению на основе стоимости, который обучает критика оценивать прибыль или будущие вознаграждения. DQN является вариантом Q-обучения, и он работает только в дискретных пространствах действия.
Дополнительные сведения см. в разделе Агенты Deep Q-Network. Дополнительные сведения о различных типах агентов обучения усилению см. в разделе Агенты обучения усилению.
создает агент DQN для среды с заданными спецификациями наблюдения и действий, используя параметры инициализации по умолчанию. Критическое представление в агенте использует многовыходную Q-значную глубокую нейронную сеть по умолчанию, построенную из спецификации наблюдения agent = rlDQNAgent(observationInfo,actionInfo)observationInfo и спецификацию действия actionInfo.
создает агент DQN для среды с заданными характеристиками наблюдения и действий. Агент использует сеть по умолчанию, настроенную с помощью параметров, указанных в agent = rlDQNAgent(observationInfo,actionInfo,initOpts)initOpts объект. Дополнительные сведения о параметрах инициализации см. в разделе rlAgentInitializationOptions.
создает агент DQN с указанной сетью критиков, используя набор параметров по умолчанию для агента DQN.agent = rlDQNAgent(critic)
создает агент DQN с указанной сетью критиков и устанавливает agent = rlDQNAgent(critic,agentOptions)AgentOptions к свойству agentOptions входной аргумент. Используйте этот синтаксис после любого из входных аргументов в предыдущих синтаксисах..
train | Подготовка обучающих агентов по усилению в определенной среде |
sim | Моделирование обученных агентов по обучению подкреплению в определенной среде |
getAction | Получить действие от агента или актора при наблюдении за окружающей средой |
getActor | Получение представления актера от обучающего агента усиления |
setActor | Задать представление актора обучающего агента усиления |
getCritic | Получение критического представления от агента обучения усиления |
setCritic | Задать критическое представление агента обучения усилению |
generatePolicyFunction | Создание функции, оценивающей обученную политику усиления агента обучения |
Конструктор глубоких сетей | rlAgentInitializationOptions | rlDQNAgentOptions | rlQValueRepresentation