rlPGAgent

Создайте агент изучения укрепления градиента политики

Синтаксис

agent = rlPGAgent(actor)

agent = rlPGAgent(actor,critic)

agent = rlPGAgent(___,opt)

Описание

agent = rlPGAgent(actor) создает агент PG с заданной сетью агента. По умолчанию свойством UseBaseline агента является false для этого случая. Для получения дополнительной информации об агентах PG смотрите Агенты Градиента политики.

agent = rlPGAgent(actor,critic) создает агент PG с заданным агентом и сетями критика. По умолчанию опцией UseBaseline является true для этого случая.

agent = rlPGAgent(___,opt) создает агент PG с помощью заданных опций агента, чтобы заменить значения по умолчанию агента.

Примеры

свернуть все

Создайте агент PG

Создайте интерфейс среды.

env = rlPredefinedEnv("DoubleIntegrator-Discrete");
obsInfo = getObservationInfo(env);
numObservations = obsInfo.Dimension(1);
actInfo = getActionInfo(env);
numActions = numel(actInfo);

Создайте представление критика, чтобы использовать в качестве базовой линии.

baselineNetwork = [
    imageInputLayer([numObservations 1 1], 'Normalization', 'none', 'Name', 'state')
    fullyConnectedLayer(8, 'Name', 'BaselineFC')
    reluLayer('Name', 'CriticRelu1')
    fullyConnectedLayer(1, 'Name', 'BaselineFC2', 'BiasLearnRateFactor', 0)];
baselineOpts = rlRepresentationOptions('LearnRate',5e-3,'GradientThreshold',1);
baseline = rlRepresentation(baselineNetwork,baselineOpts,'Observation',{'state'},obsInfo);

Создайте представление агента.

actorNetwork = [
    imageInputLayer([numObservations 1 1], 'Normalization', 'none', 'Name', 'state')
    fullyConnectedLayer(numActions, 'Name', 'action', 'BiasLearnRateFactor', 0)];
actorOpts = rlRepresentationOptions('LearnRate',5e-3,'GradientThreshold',1);
actor = rlRepresentation(actorNetwork,actorOpts,...
    'Observation',{'state'},obsInfo,'Action',{'action'},actInfo);

Задайте опции агента и создайте агент PG с помощью среды, агента и критика.

agentOpts = rlPGAgentOptions(...
    'UseBaseline',true, ...
    'DiscountFactor', 0.99);
agent = rlPGAgent(actor,baseline,agentOpts);

Входные параметры

свернуть все

Представление сети `actor` — Actor
Объект `rlLayerRepresentation`

Представление сети Actor, заданное как объект rlLayerRepresentation, созданный с помощью rlRepresentation. Для получения дополнительной информации о создании представлений агента смотрите, Создают политику и Представления Функции Значения.

Представление сети `critic` — Critic
Объект `rlLayerRepresentation`

Представление сети Critic, заданное как объект rlLayerRepresentation, созданный с помощью rlRepresentation. Для получения дополнительной информации о создании представлений критика смотрите, Создают политику и Представления Функции Значения.

`opt` — Опции агента
Объект `rlPGAgentOptions`

Опции агента, заданные как объект rlPGAgentOptions.

Выходные аргументы

свернуть все

`agent` — Агент PG
`rlPGAgent`

Агент PG, возвращенный как объект rlPGAgent.

Смотрите также

rlPGAgentOptions | train

Документация

rlPGAgent

Синтаксис

Описание

Примеры

Создайте агент PG

Входные параметры

Представление сети `actor` — Actor
Объект `rlLayerRepresentation`

Представление сети `critic` — Critic
Объект `rlLayerRepresentation`

`opt` — Опции агента
Объект `rlPGAgentOptions`

Выходные аргументы

`agent` — Агент PG
`rlPGAgent`

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Документация

rlPGAgent

Синтаксис

Описание

Примеры

Создайте агент PG

Входные параметры

Представление сети actor — Actor Объект rlLayerRepresentation

Представление сети critic — Critic Объект rlLayerRepresentation

opt — Опции агента Объект rlPGAgentOptions

Выходные аргументы

agent — Агент PG rlPGAgent

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Представление сети `actor` — Actor
Объект `rlLayerRepresentation`

Представление сети `critic` — Critic
Объект `rlLayerRepresentation`

`opt` — Опции агента
Объект `rlPGAgentOptions`

`agent` — Агент PG
`rlPGAgent`