exponenta event banner

setLearnableParameters

Установка значений обучаемых параметров для представления политики или функции значений

Описание

пример

newRep = setLearnableParameters(oldRep,val) возвращает новую политику или представление функции значения, newRep, с той же структурой, что и исходное представление, oldRepи значения обучаемых параметров, указанные в val.

Примеры

свернуть все

Предположим, что у вас есть обученный агент по обучению усилению. В этом примере следует загрузить обученного агента из Train DDPG Agent в систему двойного интегратора Control.

load('DoubleIntegDDPG.mat','agent') 

Получите представление критика от агента.

critic = getCritic(agent);

Получите обучаемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. Для этого примера просто умножьте все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Задайте для параметров критика новые измененные значения.

critic = setLearnableParameters(critic,modifiedParams);

Установите для критика в агенте нового модифицированного критика.

agent = setCritic(agent,critic);

Предположим, что у вас есть обученный агент по обучению усилению. В этом примере следует загрузить обученного агента из Train DDPG Agent в систему двойного интегратора Control.

load('DoubleIntegDDPG.mat','agent') 

Получить представление актера от агента.

actor = getActor(agent);

Получение обучаемых параметров от актера.

params = getLearnableParameters(actor);

Измените значения параметров. Для этого примера просто умножьте все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров актера на новые измененные значения.

actor = setLearnableParameters(actor,modifiedParams);

Установите актера в агенте на нового измененного актера.

agent = setActor(agent,actor);

Входные аргументы

свернуть все

Представление исходной политики или функции значения, указанное как одно из следующих значений:

Чтобы создать представление политики или функции значения, используйте один из следующих методов.

  • Создайте представление, используя соответствующий объект представления.

  • Получение существующего представления функции значения от агента с помощью getCritic

  • Получение существующего представления политики от агента с помощью getActor.

Узнаваемые значения параметров для объекта представления, заданные как массив ячеек. Параметры в val должны быть совместимы со структурой и параметризацией oldRep.

Чтобы получить массив ячеек значений обучаемых параметров из существующего представления, которое затем можно изменить, используйте getLearnableParameters функция.

Выходные аргументы

свернуть все

Новое представление политики или функции значения, возвращаемое как объект представления того же типа, что и oldRep. newRep имеет ту же структуру, что и oldRep но со значениями параметров из val.

Вопросы совместимости

развернуть все

В R2020a изменилось поведение

Представлен в R2019a