setLearnableParameterValues

Установите learnable значения параметров политики или представления функции значения

Синтаксис

newRep = setLearnableParameterValues(oldRep,val)

Описание

newRep = setLearnableParameterValues(oldRep,val) возвращает новую политику или представление функции значения, newRep, с той же структурой как исходное представление, oldRep, и learnable значения параметров заданы в val.

Примеры

свернуть все

Измените значения параметров критика

Скрипт Open Live Script

Примите, что у вас есть существующий обученный агент обучения с подкреплением. В данном примере загрузите обученного агента от, Обучают Агента DDPG Управлять Двойной Системой Интегратора.

load('DoubleIntegDDPG.mat','agent')

Получите представление критика от агента.

critic = getCritic(agent);

Получите learnable параметры от критика.

params = getLearnableParameterValues(critic);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым модифицированным значениям.

critic = setLearnableParameterValues(critic,modifiedParams);

Установите критика в агенте новому модифицированному критику.

agent = setCritic(agent,critic);

Измените значения параметров агента

Скрипт Open Live Script

load('DoubleIntegDDPG.mat','agent')

Получите представление агента от агента.

actor = getActor(agent);

Получите learnable параметры из агента.

params = getLearnableParameterValues(actor);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров агента к новым модифицированным значениям.

actor = setLearnableParameterValues(actor,modifiedParams);

Установите агента в агенте к новому модифицированному агенту.

agent = setActor(agent,actor);

Входные параметры

свернуть все

`oldRep` — Исходная политика или представление функции значения
`rlLayerRepresentation` возразите | `rlTableRepresentation` объект

Исходная политика или представление функции значения, заданное как одно из следующего:

rlLayerRepresentation объект для представлений глубокой нейронной сети
rlTableRepresentation объект для таблицы значения или представлений Q-таблицы

Чтобы создать политику или представление функции значения, используйте один из следующих методов:

Создайте представление с помощью rlRepresentation.
Получите существующее представление функции значения от агента с помощью getCritic
Получите существующее представление политики от агента с помощью getActor.

`val` — Значения параметров Learnable
cellArray

Значения параметров Learnable для объекта представления, заданного как массив ячеек. Параметры в val должно быть совместимо со структурой и параметризацией oldRep.

Чтобы получить массив ячеек learnable значений параметров от существующего представления, которое можно затем изменить, используют getLearnableParameterValues функция.

Выходные аргументы

свернуть все

`newRep` — Новая политика или представление функции значения
`rlLayerRepresentation` возразите | `rlTableRepresentation` объект

Новая политика или представление функции значения, возвращенное как объект представления того же типа как oldRep. newRep имеет ту же структуру как oldRep но со значениями параметров от val.

Документация

setLearnableParameterValues

Синтаксис

Описание

Примеры

Измените значения параметров критика

Измените значения параметров агента

Входные параметры

`oldRep` — Исходная политика или представление функции значения
`rlLayerRepresentation` возразите | `rlTableRepresentation` объект

`val` — Значения параметров Learnable
cellArray

Выходные аргументы

`newRep` — Новая политика или представление функции значения
`rlLayerRepresentation` возразите | `rlTableRepresentation` объект

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Документация

setLearnableParameterValues

Синтаксис

Описание

Примеры

Измените значения параметров критика

Измените значения параметров агента

Входные параметры

oldRep — Исходная политика или представление функции значения rlLayerRepresentation возразите | rlTableRepresentation объект

val — Значения параметров Learnable cellArray

Выходные аргументы

newRep — Новая политика или представление функции значения rlLayerRepresentation возразите | rlTableRepresentation объект

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

`oldRep` — Исходная политика или представление функции значения
`rlLayerRepresentation` возразите | `rlTableRepresentation` объект

`val` — Значения параметров Learnable
cellArray

`newRep` — Новая политика или представление функции значения
`rlLayerRepresentation` возразите | `rlTableRepresentation` объект