exponenta event banner

getLearnableParameters

Получение узнаваемых значений параметров из представления политики или функции значений

Описание

пример

val = getLearnableParameters(rep) возвращает значения обучаемых параметров из политики обучения усиления или представления функции значения rep.

Примеры

свернуть все

Предположим, что у вас есть обученный агент по обучению усилению. В этом примере следует загрузить обученного агента из Train DDPG Agent в систему двойного интегратора Control.

load('DoubleIntegDDPG.mat','agent') 

Получите представление критика от агента.

critic = getCritic(agent);

Получите обучаемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. Для этого примера просто умножьте все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Задайте для параметров критика новые измененные значения.

critic = setLearnableParameters(critic,modifiedParams);

Установите для критика в агенте нового модифицированного критика.

agent = setCritic(agent,critic);

Предположим, что у вас есть обученный агент по обучению усилению. В этом примере следует загрузить обученного агента из Train DDPG Agent в систему двойного интегратора Control.

load('DoubleIntegDDPG.mat','agent') 

Получить представление актера от агента.

actor = getActor(agent);

Получение обучаемых параметров от актера.

params = getLearnableParameters(actor);

Измените значения параметров. Для этого примера просто умножьте все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров актера на новые измененные значения.

actor = setLearnableParameters(actor,modifiedParams);

Установите актера в агенте на нового измененного актера.

agent = setActor(agent,actor);

Входные аргументы

свернуть все

Представление функции политики или значения, указанное как одно из следующих значений:

Чтобы создать представление политики или функции значения, используйте один из следующих методов.

  • Создайте представление, используя соответствующий объект представления.

  • Получение существующего представления функции значения от агента с помощью getCritic

  • Получение существующего представления политики от агента с помощью getActor.

Выходные аргументы

свернуть все

Распознаваемые значения параметров для объекта представления, возвращаемые в виде массива ячеек. Можно изменить эти значения параметров и задать их в исходном агенте или другом агенте с помощью setLearnableParameters функция.

Вопросы совместимости

развернуть все

В R2020a изменилось поведение

Представлен в R2019a