setCritic

Установите представление критика агента обучения с подкреплением

Синтаксис

newAgent = setActor(oldAgent,critic)

Описание

newAgent = setActor(oldAgent,critic) возвращает нового агента обучения с подкреплением, newAgent, это использует заданное представление критика. Кроме представления критика, новый агент имеет ту же настройку как заданный исходный агент, oldAgent.

Примеры

свернуть все

Измените значения параметров критика

Скрипт Open Live Script

Примите, что у вас есть существующий обученный агент обучения с подкреплением. В данном примере загрузите обученного агента от, Обучают Агента DDPG Управлять Двойной Системой Интегратора.

load('DoubleIntegDDPG.mat','agent')

Получите представление критика от агента.

critic = getCritic(agent);

Получите learnable параметры от критика.

params = getLearnableParameterValues(critic);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым модифицированным значениям.

critic = setLearnableParameterValues(critic,modifiedParams);

Установите критика в агенте новому модифицированному критику.

agent = setCritic(agent,critic);

Добавьте слой в представление критика

Примите, что у вас есть существующий агент обучения с подкреплением, agent.

Далее, примите, что этот агент имеет представление критика, которое содержит следующую структуру глубокой нейронной сети.

originalCritic = [
        imageInputLayer([4 1 1],'Normalization','none','Name','state')
        fullyConnectedLayer(1,'Name','CriticFC')];

Создайте представление агента с дополнительным полносвязным слоем.

criticNetwork = [
        imageInputLayer([4 1 1],'Normalization','none','Name','state')
        fullyConnectedLayer(3,'Name','x');
        fullyConnectedLayer(1,'Name','CriticFC')];
critic = rlRepresentation(criticNetwork,'Observation',{'state'},...
    getObservationInfo(env));

Установите представление критика агента новому увеличенному критику.

agent = setCritic(critic);

Удалите базового критика из агента PG

Примите, что у вас есть существующий агент PG, agent, с базовым представлением критика. Можно удалить базового критика из агента с помощью setCritic.

agent = setCritic(agent,[]);

Когда вы удаляете базового критика таким образом, UseBaseline опция агента автоматически установлена в false.

Добавьте базового критика в агента PG

Примите, что у вас есть существующий агент PG, agent, без базового представления критика. Можно добавить базового критика в агента с помощью setCritic.

Во-первых, создайте представление критика, приняв, что у вас есть существующая сеть критика, criticNetwork.

baseline = rlRepresentation(criticNetwork,'Observation',{'state'},...
    getObservationInfo(env));

Затем установите критика в агенте.

agent = setCritic(agent,baseline);

Когда вы добавляете базового критика таким образом, UseBaseline опция агента автоматически установлена в true.

Входные параметры

свернуть все

`oldAgent` — Исходный агент обучения с подкреплением
`rlQAgent` возразите | `rlSARSAAgent` возразите | `rlDQNAgent` возразите | `rlDDPGAgent` возразите | `rlPGAgent` возразите | `rlACAgent` объект

Исходный агент обучения с подкреплением, который содержит представление критика, заданное как одно из следующего:

rlQAgent объект
rlSARSAAgent объект
rlDQNAgent объект
rlDDPGAgent объект
rlACAgent объект
rlPGAgent возразите, что оценивает базовую функцию значения использование критика

`critic` — Представление критика
`rlLayerRepresentation` возразите | `rlTableRepresentation` объект

Объект представления критика, возвращенный как одно из следующего:

rlLayerRepresentation объект для представлений глубокой нейронной сети
rlTableRepresentation объект для таблицы значения или представлений Q-таблицы

Чтобы создать представление критика, используйте один из следующих методов:

Создайте представление с помощью rlRepresentation.
Получите существующее представление критика от агента с помощью getCritic

Выходные аргументы

свернуть все

`newAgent` — Обновленный агент обучения с подкреплением
`rlQAgent` возразите | `rlSARSAAgent` возразите | `rlDQNAgent` возразите | `rlDDPGAgent` возразите | `rlPGAgent` возразите | `rlACAgent` объект

Обновленный агент обучения с подкреплением, возвращенный как агент, возражает, что использует заданное представление критика. Кроме представления агента, новый агент имеет ту же настройку как oldAgent.

Документация

setCritic

Синтаксис

Описание

Примеры

Измените значения параметров критика

Добавьте слой в представление критика

Удалите базового критика из агента PG

Добавьте базового критика в агента PG

Входные параметры

`oldAgent` — Исходный агент обучения с подкреплением
`rlQAgent` возразите | `rlSARSAAgent` возразите | `rlDQNAgent` возразите | `rlDDPGAgent` возразите | `rlPGAgent` возразите | `rlACAgent` объект

`critic` — Представление критика
`rlLayerRepresentation` возразите | `rlTableRepresentation` объект

Выходные аргументы

`newAgent` — Обновленный агент обучения с подкреплением
`rlQAgent` возразите | `rlSARSAAgent` возразите | `rlDQNAgent` возразите | `rlDDPGAgent` возразите | `rlPGAgent` возразите | `rlACAgent` объект

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Документация

setCritic

Синтаксис

Описание

Примеры

Измените значения параметров критика

Добавьте слой в представление критика

Удалите базового критика из агента PG

Добавьте базового критика в агента PG

Входные параметры

oldAgent — Исходный агент обучения с подкреплением rlQAgent возразите | rlSARSAAgent возразите | rlDQNAgent возразите | rlDDPGAgent возразите | rlPGAgent возразите | rlACAgent объект

critic — Представление критика rlLayerRepresentation возразите | rlTableRepresentation объект

Выходные аргументы

newAgent — Обновленный агент обучения с подкреплением rlQAgent возразите | rlSARSAAgent возразите | rlDQNAgent возразите | rlDDPGAgent возразите | rlPGAgent возразите | rlACAgent объект

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

`oldAgent` — Исходный агент обучения с подкреплением
`rlQAgent` возразите | `rlSARSAAgent` возразите | `rlDQNAgent` возразите | `rlDDPGAgent` возразите | `rlPGAgent` возразите | `rlACAgent` объект

`critic` — Представление критика
`rlLayerRepresentation` возразите | `rlTableRepresentation` объект

`newAgent` — Обновленный агент обучения с подкреплением
`rlQAgent` возразите | `rlSARSAAgent` возразите | `rlDQNAgent` возразите | `rlDDPGAgent` возразите | `rlPGAgent` возразите | `rlACAgent` объект