setLearnableParameterValues

Установите learnable значения параметров политики или представления функции значения

Синтаксис

newRep = setLearnableParameterValues(oldRep,val)

Описание

пример

newRep = setLearnableParameterValues(oldRep,val) возвращает новую политику или представление функции значения, newRep, с той же структурой как исходное представление, oldRep и learnable значения параметров, заданные в val.

Примеры

свернуть все

Примите, что у вас есть существующий обученный агент изучения укрепления, agent.

Получите представление критика от агента.

critic = getCritic(agent);

Получите learnable параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым измененным значениям.

critic = setLearnableParameterValues(critic,modifiedParams);

Установите критика в агенте новому измененному критику.

agent = setCritic(agent,critic);

Примите, что у вас есть существующий обученный агент изучения укрепления, agent.

Получите представление агента от агента.

actor = getActor(agent);

Получите learnable параметры от критика.

params = getLearnableParameters(actor);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым измененным значениям.

actor = setLearnableParameterValues(actor,modifiedParams);

Установите критика в агенте новому измененному критику.

agent = setActor(agent,actor);

Входные параметры

свернуть все

Исходная политика или представление функции значения, заданное как одно из следующего:

  • Объект rlLayerRepresentation для представлений глубокой нейронной сети

  • Объект rlTableRepresentation для таблицы значения или представлений таблицы Q

Чтобы создать политику или представление функции значения, используйте один из следующих методов:

  • Создайте представление с помощью rlRepresentation.

  • Получите существующее представление функции значения от агента с помощью getCritic

  • Получите существующее представление политики от агента с помощью getActor.

Значения параметров Learnable для объекта представления, заданного как массив ячеек. Параметры в val должны быть совместимы со структурой и параметризацией oldRep.

Чтобы получить массив ячеек learnable значений параметров от существующего представления, которое можно затем изменить, используют функцию getLearnableParameterValues.

Выходные аргументы

свернуть все

Новая политика или представление функции значения, возвращенное как объект представления того же типа как oldRep. newRep имеет ту же структуру как oldRep, но со значениями параметров от val.

Введенный в R2019a

Для просмотра документации необходимо авторизоваться на сайте