getCritic

Получите представление критика от агента изучения укрепления

Синтаксис

critic = getCritic(agent)

Описание

пример

critic = getCritic(agent) возвращает объект представления критика для заданного агента изучения укрепления.

Примеры

свернуть все

Примите, что у вас есть существующий обученный агент изучения укрепления, agent.

Получите представление критика от агента.

critic = getCritic(agent);

Получите learnable параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым измененным значениям.

critic = setLearnableParameterValues(critic,modifiedParams);

Установите критика в агенте новому измененному критику.

agent = setCritic(agent,critic);

Примите, что у вас есть существующий агент изучения укрепления, agent.

Далее, примите, что этот агент имеет представление критика, которое содержит следующую структуру глубокой нейронной сети.

originalCritic = [
        imageInputLayer([4 1 1],'Normalization','none','Name','state')
        fullyConnectedLayer(1,'Name','CriticFC')];

Создайте представление агента с дополнительным полносвязным слоем.

criticNetwork = [
        imageInputLayer([4 1 1],'Normalization','none','Name','state')
        fullyConnectedLayer(3,'Name','x');
        fullyConnectedLayer(1,'Name','CriticFC')];
critic = rlRepresentation(criticNetwork,'Observation',{'state'},...
    getObservationInfo(env));

Установите представление критика агента новому увеличенному критику.

agent = setCritic(critic);

Входные параметры

свернуть все

Агент изучения укрепления, который содержит представление критика, заданное как одно из следующего:

Выходные аргументы

свернуть все

Объект представления критика, возвращенный как одно из следующего:

  • Объект rlLayerRepresentation для представлений глубокой нейронной сети

  • Объект rlTableRepresentation для таблицы значения или представлений таблицы Q

Введенный в R2019a

Для просмотра документации необходимо авторизоваться на сайте