rlPPOAgent

Создайте ближайшего агента обучения с подкреплением оптимизации политики

Синтаксис

agent = rlPPOAgent(actor,critic,opt)

Описание

agent = rlPPOAgent(actor,critic,opt) создает агента ближайшей оптимизации политики (PPO) с заданным агентом и сетями критика, с помощью заданных опций агента PPO. Для получения дополнительной информации об агентах PPO смотрите Ближайших Агентов Оптимизации политики.

Примеры

свернуть все

Создайте ближайшего агента оптимизации политики

Скрипт Open Live Script

Создайте интерфейс среды и получите его наблюдение и спецификации действия.

env = rlPredefinedEnv("CartPole-Discrete");
obsInfo = getObservationInfo(env);
actInfo = getActionInfo(env);

Создайте представление критика.

criticNetwork = [
    imageInputLayer([4 1 1],'Normalization','none','Name','state')
    fullyConnectedLayer(1,'Name','CriticFC')];
criticOpts = rlRepresentationOptions('LearnRate',8e-3,'GradientThreshold',1);
critic = rlRepresentation(criticNetwork,obsInfo,'Observation',{'state'},criticOpts);

Создайте представление агента.

actorNetwork = [
    imageInputLayer([4 1 1],'Normalization','none','Name','state')
    fullyConnectedLayer(2,'Name','action')];
actorOpts = rlRepresentationOptions('LearnRate',8e-3,'GradientThreshold',1);
actor = rlRepresentation(actorNetwork,obsInfo,actInfo,...
    'Observation',{'state'},'Action',{'action'},actorOpts);

Задайте опции агента и создайте агента PPO с помощью среды, агента и критика.

agentOpts = rlPPOAgentOptions(...
    'ExperienceHorizon',1024, ...
    'DiscountFactor',0.95);
agent = rlPPOAgent(actor,critic,agentOpts);

Входные параметры

свернуть все

`actor` — Представление сети Actor
`rlLayerRepresentation` возразите | `rlDLNetworkRepresentation` объект

Представление сети Actor для представления политики, заданной как любой rlLayerRepresentation или rlDLNetworkRepresentation объект, созданный с помощью rlRepresentation. Для получения дополнительной информации о создании представлений агента смотрите, Создают политику и Представления Функции Значения.

`critic` — Представление сети Critic
`rlLayerRepresentation` возразите | `rlDLNetworkRepresentation` объект

Представление сети Critic для оценки функции значения состояния, заданной как любой rlLayerRepresentation или rlDLNetworkRepresentation объект, созданный с помощью rlRepresentation. Для получения дополнительной информации о создании представлений критика смотрите, Создают политику и Представления Функции Значения.

`opt` — Опции агента
`rlPPOAgentOptions` объект

Опции агента, заданные как rlPPOAgentOptions объект.

Выходные аргументы

свернуть все

`agent` — Агент PPO
`rlPPOAgent` объект

Агент PPO, возвращенный как rlPPOAgent объект.

Смотрите также

rlPPOAgentOptions | train

Темы

Введенный в R2019b

Документация Reinforcement Learning Toolbox

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.

Документация

rlPPOAgent

Синтаксис

Описание

Примеры

Создайте ближайшего агента оптимизации политики

Входные параметры

actor — Представление сети Actor rlLayerRepresentation возразите | rlDLNetworkRepresentation объект

critic — Представление сети Critic rlLayerRepresentation возразите | rlDLNetworkRepresentation объект

opt — Опции агента rlPPOAgentOptions объект

Выходные аргументы

agent — Агент PPO rlPPOAgent объект

Смотрите также

Темы

Введенный в R2019b

Документация Reinforcement Learning Toolbox

Поддержка

`actor` — Представление сети Actor
`rlLayerRepresentation` возразите | `rlDLNetworkRepresentation` объект

`critic` — Представление сети Critic
`rlLayerRepresentation` возразите | `rlDLNetworkRepresentation` объект

`opt` — Опции агента
`rlPPOAgentOptions` объект

`agent` — Агент PPO
`rlPPOAgent` объект