Агенты

Создайте и сконфигурируйте агентов обучения с подкреплением с помощью общих алгоритмов, таких как SARSA, DQN, DDPG и PPO

Агент обучения с подкреплением получает наблюдения и вознаграждение от окружения. Используя свою политику, агент выбирает действие на основе наблюдений и вознаграждения и отправляет действие в окружение. Во время обучения агент постоянно обновляет параметры политики на основе действия, наблюдений и вознаграждения. Это позволяет агенту научиться оптимальной политике при заданных окружении и сигнале вознаграждения.

Пакет Reinforcement Learning Toolbox™ предоставляет агентов обучения с подкреплением, которые используют несколько общих алгоритмов, таких как SARSA, DQN, DDPG и PPO. Можно также реализовать другие алгоритмы агента путем создания собственных агентов.

Для получения дополнительной информации смотрите Агентов Обучения с подкреплением. Для получения дополнительной информации об определении представлений политики смотрите, Создают Представления Функции ценности и политика.

Приложения

Reinforcement Learning Designer

Спроектируйте, обучите и симулируйте агентов обучения с подкреплением

Функции

развернуть все

Агенты

`rlQAgent`	Агент обучения с подкреплением Q-изучения
`rlSARSAAgent`	Агент обучения с подкреплением SARSA
`rlDQNAgent`	Глубокий агент обучения с подкреплением Q-сети
`rlPGAgent`	Агент обучения с подкреплением градиента политики
`rlDDPGAgent`	Глубоко детерминированный агент обучения с подкреплением градиента политики
`rlTD3Agent`	Задержанный близнецами глубоко детерминированный агент обучения с подкреплением градиента политики
`rlACAgent`	Агент обучения с подкреплением критика агента
`rlPPOAgent`	Ближайший агент обучения с подкреплением оптимизации политики
`rlTRPOAgent`	Доверительный агент обучения с подкреплением оптимизации политики области
`rlSACAgent`	Мягкий агент обучения с подкреплением критика агента

Опции агента

`rlQAgentOptions`	Опции для агента Q-обучения
`rlSARSAAgentOptions`	Опции для агента SARSA
`rlDQNAgentOptions`	Опции для агента DQN
`rlPGAgentOptions`	Опции для агента PG
`rlDDPGAgentOptions`	Опции для агента DDPG
`rlTD3AgentOptions`	Опции для агента TD3
`rlACAgentOptions`	Опции для агента AC
`rlPPOAgentOptions`	Опции для агента PPO
`rlTRPOAgentOptions`	Опции для агента TRPO
`rlSACAgentOptions`	Опции для агента SAC
`rlAgentInitializationOptions`	Опции для инициализации агентов обучения с подкреплением

Чтение и запись представлений

`getActor`	Получите представление актера от агента обучения с подкреплением
`getCritic`	Получите представление критика от агента обучения с подкреплением
`setActor`	Установите представление актера агента обучения с подкреплением
`setCritic`	Установите представление критика агента обучения с подкреплением