exponenta event banner

Агенты

Создание и настройка агентов обучения усилению с использованием общих алгоритмов, таких как SARSA, DQN, DDPG и A2C

Усиливающий обучающий агент получает наблюдения и вознаграждение от окружающей среды. Используя свою политику, агент выбирает действие, основываясь на наблюдениях и вознаграждении, и отправляет действие в среду. Во время обучения агент постоянно обновляет параметры политики, основываясь на действии, наблюдениях и вознаграждении. Это позволяет агенту узнать оптимальную политику для данной среды и наградной сигнал.

Программное обеспечение Reinforcement Learning Toolbox™ предоставляет агентам изучения укрепления, которые используют несколько общих алгоритмов, таких как SARSA, DQN, DDPG и A2C. Можно также реализовать другие алгоритмы агентов, создав собственные пользовательские агенты.

Дополнительные сведения см. в разделе Усиление агентов обучения. Дополнительные сведения об определении представлений политик см. в разделе Создание представлений политик и функций значений.

Приложения

Дизайнер обучения по усилениюПроектирование, обучение и моделирование агентов обучения усилению

Функции

развернуть все

rlQAgentАгент по обучению Q-learning
rlSARSAAgentАгент обучения по усилению SARSA
rlDQNAgentАгент обучения усилению глубокой Q-сети
rlPGAgentАгент обучения для усиления градиента политики
rlDDPGAgentГлубокая детерминированная политика градиентного усиления обучающий агент
rlTD3AgentДвойная задержка глубокого детерминированного усиления градиента политики обучающий агент
rlACAgentАктерско-критический агент по обучению
rlPPOAgentАгент обучения по оптимизации проксимальной политики
rlSACAgentМягкий актерско-критический агент по обучению
rlQAgentOptionsВарианты для агента Q-learning
rlSARSAAgentOptionsВарианты для агента SARSA
rlDQNAgentOptionsПараметры агента DQN
rlPGAgentOptionsОпции для агента PG
rlDDPGAgentOptionsПараметры агента DDPG
rlTD3AgentOptionsПараметры агента TD3
rlACAgentOptionsОпции для агента переменного тока
rlPPOAgentOptionsПараметры агента PPO
rlSACAgentOptionsПараметры агента SAC
rlAgentInitializationOptionsВарианты инициализации агентов обучения для усиления
getActorПолучение представления актера от обучающего агента усиления
getCriticПолучение критического представления от агента обучения усиления
setActorЗадать представление актора обучающего агента усиления
setCriticЗадать критическое представление агента обучения усилению
getActionПолучить действие от агента или актора при наблюдении за окружающей средой

Темы

Основные сведения об агентах

Усиление обучающих агентов

Можно создать агента с помощью одного из нескольких стандартных алгоритмов обучения усилению или определить собственного пользовательского агента.

Создание агентов с помощью конструктора по обучению усилению

Интерактивное создание или импорт агентов для обучения с помощью приложения «Дизайнер обучения усиления».

Типы агентов

Агенты Q-Learning

Создание Q-обучающих агентов для усиления обучения.

Агенты SARSA

Создание агентов SARSA для обучения усилению.

Агенты Deep Q-Network

Создание агентов DQN для обучения усилению.

Агенты градиента политики

Создание агентов PG для обучения усилению.

Агенты градиента глубокой детерминированной политики

Создание агентов DDPG для обучения усилению.

Агенты градиента глубоких детерминированных политик с двойной задержкой

Создание TD3 агентов для обучения усилению.

Актер-критик Агенты

Создание агентов переменного тока для обучения усилению.

Агенты оптимизации проксимальной политики

Создание агентов PPO для обучения усилению.

Мягкий актер-критик Агенты

Создание агентов SAC для обучения усилению.

Настраиваемые агенты

Создание пользовательских агентов обучения по усилению

Создайте агенты, использующие пользовательские алгоритмы обучения усилению.