Агенты

Создайте и сконфигурируйте агентов обучения с подкреплением с помощью общих алгоритмов, таких как SARSA, DQN, DDPG и A2C

Агент обучения с подкреплением получает наблюдения и вознаграждение от окружения. Используя свою политику, агент выбирает действие на основе наблюдений и вознаграждения и отправляет действие в окружение. Во время обучения агент постоянно обновляет параметры политики на основе действия, наблюдений и вознаграждения. Это позволяет агенту научиться оптимальной политике при заданных окружении и сигнале вознаграждения.

Пакет Reinforcement Learning Toolbox™ предоставляет агентов обучения с подкреплением, которые используют несколько общих алгоритмов, таких как SARSA, DQN, DDPG и A2C. Можно также реализовать другие алгоритмы агента путем создания собственных агентов. Для получения дополнительной информации смотрите Агентов Обучения с подкреплением.

Для получения дополнительной информации об определении представлений политики смотрите, Создают Представления Функции ценности и политика.

Функции

развернуть все

Агенты

`rlQAgent`	Агент обучения с подкреплением Q-изучения
`rlSARSAAgent`	Агент обучения с подкреплением SARSA
`rlDQNAgent`	Глубокий агент обучения с подкреплением Q-сети
`rlPGAgent`	Агент обучения с подкреплением градиента политики
`rlDDPGAgent`	Глубоко детерминированный агент обучения с подкреплением градиента политики
`rlTD3Agent`	Задержанный близнецами глубоко детерминированный агент обучения с подкреплением градиента политики
`rlACAgent`	Агент обучения с подкреплением критика агента
`rlPPOAgent`	Ближайший агент обучения с подкреплением оптимизации политики

Опции агента

`rlQAgentOptions`	Опции для агента Q-обучения
`rlSARSAAgentOptions`	Опции для агента SARSA
`rlDQNAgentOptions`	Опции для агента DQN
`rlPGAgentOptions`	Опции для агента градиента политики
`rlDDPGAgentOptions`	Опции для агента DDPG
`rlTD3AgentOptions`	Опции для агента TD3
`rlACAgentOptions`	Опции для агента AC
`rlPPOAgentOptions`	Опции для ближайшего агента обучения с подкреплением оптимизации политики

Чтение и запись представлений

`getActor`	Получите представление актера от агента обучения с подкреплением
`getCritic`	Получите представление критика от агента обучения с подкреплением
`setActor`	Установите представление актера агента обучения с подкреплением
`setCritic`	Установите представление критика агента обучения с подкреплением