Агенты

Создайте и сконфигурируйте укрепление, изучив агенты с помощью общих алгоритмов, таких как SARSA, DQN, DDPG и A2C

Агент изучения укрепления получает наблюдения и вознаграждение от среды. Используя его политику, агент выбирает действие на основе наблюдений и вознаграждения, и отправляет действие в среду. Во время обучения агент постоянно обновляет параметры политики на основе действия, наблюдений и вознаграждения. Выполнение так, позволяет агенту изучать оптимальную политику для данной среды и премиального сигнала.

Программное обеспечение Reinforcement Learning Toolbox™ обеспечивает агенты изучения укрепления, которые используют несколько общих алгоритмов, таких как SARSA, DQN, DDPG и A2C. Можно также реализовать другие алгоритмы агента путем создания собственных агентов. Для получения дополнительной информации смотрите, что Укрепление Изучает Агенты.

Для получения дополнительной информации об определении представлений политики смотрите, Создают политику и Представления Функции Значения.

Функции

развернуть все

rlQAgentСоздайте агент изучения укрепления Q-изучения
rlSARSAAgentСоздайте агент изучения укрепления SARSA
rlDQNAgentСоздайте глубокий агент изучения укрепления Q-сети
rlDDPGAgentСоздайте глубоко детерминированный агент изучения укрепления градиента политики
rlPGAgentСоздайте агент изучения укрепления градиента политики
rlACAgentСоздайте агент изучения укрепления критика агента
rlQAgentOptionsСоздайте опции для агента Q-изучения
rlSARSAAgentOptionsСоздайте опции для агента SARSA
rlDQNAgentOptionsСоздайте опции для агента DQN
rlDDPGAgentOptionsСоздайте опции для агента DDPG
rlPGAgentOptionsСоздайте опции для агента PG
rlACAgentOptionsСоздайте опции для агента AC
getActorПолучите представление агента от агента изучения укрепления
getCriticПолучите представление критика от агента изучения укрепления
setActorУстановите представление агента агента изучения укрепления
setCriticУстановите представление критика агента изучения укрепления

Темы

Агенты изучения укрепления

Можно создать агент с помощью одного из нескольких стандартных алгоритмов изучения укрепления или задать собственный агент.

Агенты Q-изучения

Создайте агенты Q-изучения для изучения укрепления.

Агенты SARSA

Создайте агенты SARSA для изучения укрепления.

Глубокие агенты Q-сети

Создайте агенты DQN для изучения укрепления.

Глубоко детерминированные агенты градиента политики

Создайте агенты DDPG для изучения укрепления.

Агенты градиента политики

Создайте агенты PG для изучения укрепления.

Агенты критика агента

Создайте агенты AC для изучения укрепления.

Пользовательские агенты

Создайте агенты, которые используют пользовательские алгоритмы изучения укрепления.

Для просмотра документации необходимо авторизоваться на сайте