Агент по обучению Q-learning
Алгоритм Q-learning - это метод обучения без модели, онлайн, вне политики. Агент Q-learning - это агент обучения усилению на основе стоимости, который обучает критика оценивать отдачу или будущие вознаграждения.
Дополнительные сведения об агентах Q-learning см. в разделе Агенты Q-Learning.
Дополнительные сведения о различных типах агентов обучения усилению см. в разделе Агенты обучения усилению.
создает Q-обучающий агент с указанной сетью критиков и устанавливает agent = rlQAgent(critic,agentOptions)AgentOptions собственность.
train | Подготовка обучающих агентов по усилению в определенной среде |
sim | Моделирование обученных агентов по обучению подкреплению в определенной среде |
getAction | Получить действие от агента или актора при наблюдении за окружающей средой |
getActor | Получение представления актера от обучающего агента усиления |
setActor | Задать представление актора обучающего агента усиления |
getCritic | Получение критического представления от агента обучения усиления |
setCritic | Задать критическое представление агента обучения усилению |
generatePolicyFunction | Создание функции, оценивающей обученную политику усиления агента обучения |