getLearnableParameters

Получите значения настраиваемого параметра из представления функции ценности или политики

Описание

пример

val = getLearnableParameters(rep) возвращает значения настраиваемых параметров от политики обучения с подкреплением или представления функции ценности rep.

Примеры

свернуть все

Примите, что у вас есть существующий обученный агент обучения с подкреплением. В данном примере загрузите обученного агента от, Обучают Агента DDPG Управлять Двойной Системой Интегратора.

load('DoubleIntegDDPG.mat','agent') 

Получите представление критика от агента.

critic = getCritic(agent);

Получите настраиваемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым модифицированным значениям.

critic = setLearnableParameters(critic,modifiedParams);

Установите критика в агенте новому модифицированному критику.

agent = setCritic(agent,critic);

Примите, что у вас есть существующий обученный агент обучения с подкреплением. В данном примере загрузите обученного агента от, Обучают Агента DDPG Управлять Двойной Системой Интегратора.

load('DoubleIntegDDPG.mat','agent') 

Получите представление актера из агента.

actor = getActor(agent);

Получите настраиваемые параметры из агента.

params = getLearnableParameters(actor);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров агента к новым модифицированным значениям.

actor = setLearnableParameters(actor,modifiedParams);

Настройте актера в агенте к новому модифицированному агенту.

agent = setActor(agent,actor);

Входные параметры

свернуть все

Политика или представление функции ценности в виде одного из следующего:

Чтобы создать политику или представление функции ценности, используйте один из следующих методов:

  • Создайте представление с помощью соответствующего объекта представления.

  • Получите существующее представление функции ценности от агента с помощью getCritic

  • Получите существующее представление политики от агента с помощью getActor.

Выходные аргументы

свернуть все

Значения настраиваемого параметра для объекта представления, возвращенного как массив ячеек. Можно изменить эти значения параметров и установить их в исходном агенте или различном агенте с помощью setLearnableParameters функция.

Вопросы совместимости

развернуть все

Поведение изменяется в R2020a

Введенный в R2019a