Агенты

Создайте и сконфигурируйте агентов обучения с подкреплением, используя общие алгоритмы, такие как SARSA, DQN, DDPG и A2C

Агент обучения с подкреплением получает наблюдения и вознаграждение от окружения. Используя свою политику, агент выбирает действие на основе наблюдений и вознаграждения и отправляет действие в окружение. Во время обучения агент постоянно обновляет параметры политики на основе действия, наблюдений и вознаграждения. Это позволяет агенту научиться оптимальной политике при заданных окружении и сигнале вознаграждения.

Пакет Reinforcement Learning Toolbox™ предоставляет агентов обучения с подкреплением, которые используют несколько общих алгоритмов, таких как SARSA, DQN, DDPG и A2C. Можно также реализовать другие алгоритмы агента, создав собственных пользовательских агентов.

Для получения дополнительной информации см. Раздел «Агенты обучения с подкреплением». Дополнительные сведения об определении представлений политики см. в разделах Создание представлений политики и функции ценности.

Приложения

Reinforcement Learning Designer

Проектируйте, обучайте и симулируйте агентов обучения с подкреплением

Функции

расширить все

Агенты

`rlQAgent`	Агент обучения с подкреплением Q-обучения
`rlSARSAAgent`	Агент обучения с подкреплением SARSA
`rlDQNAgent`	Агент обучения с подкреплением глубокой Q-сети
`rlPGAgent`	Агент обучения с подкреплением с градиентом политики
`rlDDPGAgent`	Агент глубокого детерминированного градиента обучения с подкреплением политики
`rlTD3Agent`	Агент обучения с подкреплением с двумя задержками в глубоком детерминировании политики
`rlACAgent`	Агент обучения с подкреплением актёра-критика
`rlPPOAgent`	Проксимальный агент обучения с подкреплением оптимизации политики
`rlSACAgent`	Мягкий агент обучения с подкреплением актёра-критика

Опции агента

`rlQAgentOptions`	Опции для агента Q-обучения
`rlSARSAAgentOptions`	Опции для агента SARSA
`rlDQNAgentOptions`	Опции для агента DQN
`rlPGAgentOptions`	Опции для агента PG
`rlDDPGAgentOptions`	Опции для агента DDPG
`rlTD3AgentOptions`	Опции для TD3 агента
`rlACAgentOptions`	Опции для агента AC
`rlPPOAgentOptions`	Опции для агента PPO
`rlSACAgentOptions`	Опции для агента SAC
`rlAgentInitializationOptions`	Опции для инициализации агентов обучения с подкреплением

Получение и задание представлений

`getActor`	Получите представление актера от агента обучения с подкреплением
`getCritic`	Получите представление критика от агента обучения с подкреплением
`setActor`	Установите представление актера агента обучения с подкреплением
`setCritic`	Установите представление критика агента обучения с подкреплением