rlACAgent

Создайте агента обучения с подкреплением критика агента

Описание

пример

agent = rlACAgent(actor,critic,opt) создает агента критика агента (AC) с заданным агентом и сетями критика, с помощью заданных опций агента AC. Для получения дополнительной информации об агентах AC смотрите Агентов Критика Агента.

Примеры

свернуть все

Создайте среду, соединяют интерфейсом и получают ее наблюдение и спецификации действия.

env = rlPredefinedEnv("CartPole-Discrete");
obsInfo = getObservationInfo(env);
actInfo = getActionInfo(env);

Создайте представление критика.

criticNetwork = [
    imageInputLayer([4 1 1],'Normalization','none','Name','state')
    fullyConnectedLayer(1,'Name','CriticFC')];
criticOpts = rlRepresentationOptions('LearnRate',8e-3,'GradientThreshold',1);
critic = rlRepresentation(criticNetwork,obsInfo,'Observation',{'state'},criticOpts);

Создайте представление агента.

actorNetwork = [
    imageInputLayer([4 1 1],'Normalization','none','Name','state')
    fullyConnectedLayer(2,'Name','action')];
actorOpts = rlRepresentationOptions('LearnRate',8e-3,'GradientThreshold',1);
actor = rlRepresentation(actorNetwork,obsInfo,actInfo,...
    'Observation',{'state'},'Action',{'action'},actorOpts);

Задайте опции агента и создайте агента AC с помощью среды, агента и критика.

agentOpts = rlACAgentOptions(...
    'NumStepsToLookAhead',32, ...
    'DiscountFactor',0.99);
agent = rlACAgent(actor,critic,agentOpts);

Входные параметры

свернуть все

Представление сети Actor для представления политики, заданной как любой rlLayerRepresentation или rlDLNetworkRepresentation объект, созданный с помощью rlRepresentation. Для получения дополнительной информации о создании представлений агента смотрите, Создают политику и Представления Функции Значения.

Представление сети Critic для оценки функции значения состояния, заданной как любой rlLayerRepresentation или rlDLNetworkRepresentation объект, созданный с помощью rlRepresentation. Для получения дополнительной информации о создании представлений критика смотрите, Создают политику и Представления Функции Значения.

Опции агента, заданные как rlACAgentOptions объект.

Выходные аргументы

свернуть все

Агент AC, возвращенный как rlACAgent объект.

Введенный в R2019a