setLearnableParameterValues

Установите learnable значения параметров политики или представления функции значения

Синтаксис

newRep = setLearnableParameterValues(oldRep,val)

Описание

newRep = setLearnableParameterValues(oldRep,val) возвращает новую политику или представление функции значения, newRep, с той же структурой как исходное представление, oldRep и learnable значения параметров, заданные в val.

Примеры

свернуть все

Измените значения параметров критика

Примите, что у вас есть существующий обученный агент изучения укрепления, agent.

Получите представление критика от агента.

critic = getCritic(agent);

Получите learnable параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым измененным значениям.

critic = setLearnableParameterValues(critic,modifiedParams);

Установите критика в агенте новому измененному критику.

agent = setCritic(agent,critic);

Измените значения параметров агента

Примите, что у вас есть существующий обученный агент изучения укрепления, agent.

Получите представление агента от агента.

actor = getActor(agent);

Получите learnable параметры от критика.

params = getLearnableParameters(actor);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым измененным значениям.

actor = setLearnableParameterValues(actor,modifiedParams);

Установите критика в агенте новому измененному критику.

agent = setActor(agent,actor);

Входные параметры

свернуть все

`oldRep` — Исходная политика или представление функции значения
Объект `rlLayerRepresentation` | объект `rlTableRepresentation`

Исходная политика или представление функции значения, заданное как одно из следующего:

Объект rlLayerRepresentation для представлений глубокой нейронной сети
Объект rlTableRepresentation для таблицы значения или представлений таблицы Q

Чтобы создать политику или представление функции значения, используйте один из следующих методов:

Создайте представление с помощью rlRepresentation.
Получите существующее представление функции значения от агента с помощью getCritic
Получите существующее представление политики от агента с помощью getActor.

`val` — Значения параметров Learnable
cellArray

Значения параметров Learnable для объекта представления, заданного как массив ячеек. Параметры в val должны быть совместимы со структурой и параметризацией oldRep.

Чтобы получить массив ячеек learnable значений параметров от существующего представления, которое можно затем изменить, используют функцию getLearnableParameterValues.

Выходные аргументы

свернуть все

`newRep` — Новая политика или представление функции значения
Объект `rlLayerRepresentation` | объект `rlTableRepresentation`

Новая политика или представление функции значения, возвращенное как объект представления того же типа как oldRep. newRep имеет ту же структуру как oldRep, но со значениями параметров от val.

Документация

setLearnableParameterValues

Синтаксис

Описание

Примеры

Измените значения параметров критика

Измените значения параметров агента

Входные параметры

`oldRep` — Исходная политика или представление функции значения
Объект `rlLayerRepresentation` | объект `rlTableRepresentation`

`val` — Значения параметров Learnable
cellArray

Выходные аргументы

`newRep` — Новая политика или представление функции значения
Объект `rlLayerRepresentation` | объект `rlTableRepresentation`

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Документация

setLearnableParameterValues

Синтаксис

Описание

Примеры

Измените значения параметров критика

Измените значения параметров агента

Входные параметры

oldRep — Исходная политика или представление функции значения Объект rlLayerRepresentation | объект rlTableRepresentation

val — Значения параметров Learnable cellArray

Выходные аргументы

newRep — Новая политика или представление функции значения Объект rlLayerRepresentation | объект rlTableRepresentation

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

`oldRep` — Исходная политика или представление функции значения
Объект `rlLayerRepresentation` | объект `rlTableRepresentation`

`val` — Значения параметров Learnable
cellArray

`newRep` — Новая политика или представление функции значения
Объект `rlLayerRepresentation` | объект `rlTableRepresentation`