setLearnableParameters

Установите значения настраиваемого параметра представления функции ценности или политики

Описание

пример

newRep = setLearnableParameters(oldRep,val) возвращает новую политику или представление функции ценности, newRep, с той же структурой как исходное представление, oldRep, и значения настраиваемого параметра заданы в val.

Примеры

свернуть все

Примите, что у вас есть существующий обученный агент обучения с подкреплением. В данном примере загрузите обученного агента от, Обучают Агента DDPG Управлять Двойной Системой Интегратора.

load('DoubleIntegDDPG.mat','agent') 

Получите представление критика от агента.

critic = getCritic(agent);

Получите настраиваемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым модифицированным значениям.

critic = setLearnableParameters(critic,modifiedParams);

Установите критика в агенте новому модифицированному критику.

agent = setCritic(agent,critic);

Примите, что у вас есть существующий обученный агент обучения с подкреплением. В данном примере загрузите обученного агента от, Обучают Агента DDPG Управлять Двойной Системой Интегратора.

load('DoubleIntegDDPG.mat','agent') 

Получите представление актера из агента.

actor = getActor(agent);

Получите настраиваемые параметры из агента.

params = getLearnableParameters(actor);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров агента к новым модифицированным значениям.

actor = setLearnableParameters(actor,modifiedParams);

Настройте актера в агенте к новому модифицированному агенту.

agent = setActor(agent,actor);

Входные параметры

свернуть все

Исходная политика или представление функции ценности в виде одного из следующего:

Чтобы создать политику или представление функции ценности, используйте один из следующих методов:

  • Создайте представление с помощью соответствующего объекта представления.

  • Получите существующее представление функции ценности от использования агента getCritic

  • Получите существующее представление политики от использования агента getActor.

Значения настраиваемого параметра для представления возражают в виде массива ячеек. Параметры в val должно быть совместимо со структурой и параметризацией oldRep.

Получить массив ячеек значений настраиваемого параметра от существующего представления, которое можно затем изменить, использование getLearnableParameters функция.

Выходные аргументы

свернуть все

Новая политика или представление функции ценности, возвращенное как объект представления того же типа как oldRep. newRep имеет ту же структуру как oldRep но со значениями параметров от val.

Вопросы совместимости

развернуть все

Поведение изменяется в R2020a

Введенный в R2019a