setLearnableParameters

Установите настраиваемые параметры политики или представления функции ценности

Описание

пример

newRep = setLearnableParameters(oldRep,val) возвращает новую политику или представление функции ценности, newRep, с той же структурой, что и исходное представление, oldRep, и настраиваемые параметры, заданные в val.

Примеры

свернуть все

Предположим, что у вас есть обученный агент обучения с подкреплением. В данном примере загружает обученного агента из Train DDPG Agent в систему Double Integrator.

load('DoubleIntegDDPG.mat','agent') 

Получите представление критика от агента.

critic = getCritic(agent);

Получите настраиваемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножите все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика в новые измененные значения.

critic = setLearnableParameters(critic,modifiedParams);

Установите критика в агенте на нового модифицированного критика.

agent = setCritic(agent,critic);

Предположим, что у вас есть обученный агент обучения с подкреплением. В данном примере загружает обученного агента из Train DDPG Agent в систему Double Integrator.

load('DoubleIntegDDPG.mat','agent') 

Получите представление актера от агента.

actor = getActor(agent);

Получите настраиваемые параметры от актёра.

params = getLearnableParameters(actor);

Измените значения параметров. В данном примере просто умножите все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров актёра в новые измененные значения.

actor = setLearnableParameters(actor,modifiedParams);

Установите актёра в агенте на нового модифицированного актёра.

agent = setActor(agent,actor);

Входные параметры

свернуть все

Представление исходной политики или функции ценности, заданное как одно из следующего:

Чтобы создать представление политики или функции ценности, используйте один из следующих методов:

  • Создайте представление с помощью соответствующего объекта представления.

  • Получите существующее представление функции ценности от агента, используя getCritic

  • Получите существующее представление политики от агента, используя getActor.

Настраиваемые параметры для объекта представления, заданные как массив ячеек. Параметры в val должна быть совместима со структурой и параметризацией oldRep.

Чтобы получить массив ячеек с настраиваемым параметром значениями из существующего представления, которое можно затем изменить, используйте getLearnableParameters функция.

Выходные аргументы

свернуть все

Представление новой политики или функции ценности, возвращаемое как объект представления того же типа, что и oldRep. newRep имеет ту же структуру, что и oldRep но со значениями параметров из val.

Вопросы совместимости

расширить все

Поведение изменено в R2020a

Введенный в R2019a