Агенты

Создайте и сконфигурируйте агентов обучения с подкреплением с помощью общих алгоритмов, таких как SARSA, DQN, DDPG и A2C

Агент обучения с подкреплением получает наблюдения и вознаграждение средой. Используя его политику, агент выбирает действие на основе наблюдений и вознаграждения, и отправляет действие в среду. Во время обучения агент постоянно обновляет параметры политики на основе действия, наблюдений и вознаграждения. Выполнение так, позволяет агенту изучать оптимальную политику для данной среды и сигнала вознаграждения.

Пакет Reinforcement Learning Toolbox™ обеспечивает агентов обучения с подкреплением, которые используют несколько общих алгоритмов, таких как SARSA, DQN, DDPG и A2C. Можно также реализовать другие алгоритмы агента путем создания собственных агентов. Для получения дополнительной информации смотрите Агентов Обучения с подкреплением.

Для получения дополнительной информации об определении представлений политики смотрите, Создают политику и Представления Функции Значения.

Функции

развернуть все

rlQAgentСоздайте агента обучения с подкреплением Q-изучения
rlSARSAAgentСоздайте агента обучения с подкреплением SARSA
rlDQNAgentСоздайте глубокого агента обучения с подкреплением Q-сети
rlDDPGAgentСоздайте глубоко детерминированного агента обучения с подкреплением градиента политики
rlPGAgentСоздайте агента обучения с подкреплением градиента политики
rlACAgentСоздайте агента обучения с подкреплением критика агента
rlPPOAgentСоздайте ближайшего агента обучения с подкреплением оптимизации политики
rlQAgentOptionsСоздайте опции для агента Q-изучения
rlSARSAAgentOptionsСоздайте опции для агента SARSA
rlDQNAgentOptionsСоздайте опции для агента DQN
rlDDPGAgentOptionsСоздайте опции для агента DDPG
rlPGAgentOptionsСоздайте опции для агента PG
rlACAgentOptionsСоздайте опции для агента AC
rlPPOAgentOptionsСоздайте опции для агента PPO
getActorПолучите представление агента от агента обучения с подкреплением
getCriticПолучите представление критика от агента обучения с подкреплением
setActorУстановите представление агента агента обучения с подкреплением
setCriticУстановите представление критика агента обучения с подкреплением

Темы

Агенты обучения с подкреплением

Можно создать агента с помощью одного из нескольких стандартных алгоритмов обучения с подкреплением или задать собственного агента.

Агенты Q-изучения

Создайте агентов Q-изучения для обучения с подкреплением.

Агенты SARSA

Создайте агентов SARSA для обучения с подкреплением.

Глубокие агенты Q-сети

Создайте агентов DQN для обучения с подкреплением.

Глубоко детерминированные агенты градиента политики

Создайте агентов DDPG для обучения с подкреплением.

Агенты градиента политики

Создайте агентов PG для обучения с подкреплением.

Агенты критика агента

Создайте агентов AC для обучения с подкреплением.

Ближайшие агенты оптимизации политики

Создайте агентов PPO для обучения с подкреплением.

Пользовательские агенты

Создайте агентов, которые используют пользовательские алгоритмы обучения с подкреплением.

Для просмотра документации необходимо авторизоваться на сайте