getLearnableParameters

Получите значения настраиваемого параметра из представления функции ценности или политики

Синтаксис

val = getLearnableParameters(rep)

Описание

val = getLearnableParameters(rep) возвращает значения настраиваемых параметров от политики обучения с подкреплением или представления функции ценности rep.

Примеры

свернуть все

Измените значения параметров критика

Скрипт Open Live Script

Примите, что у вас есть существующий обученный агент обучения с подкреплением. В данном примере загрузите обученного агента от, Обучают Агента DDPG Управлять Двойной Системой Интегратора.

load('DoubleIntegDDPG.mat','agent')

Получите представление критика от агента.

critic = getCritic(agent);

Получите настраиваемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым модифицированным значениям.

critic = setLearnableParameters(critic,modifiedParams);

Установите критика в агенте новому модифицированному критику.

agent = setCritic(agent,critic);

Измените значения параметров агента

Скрипт Open Live Script

load('DoubleIntegDDPG.mat','agent')

Получите представление актера из агента.

actor = getActor(agent);

Получите настраиваемые параметры из агента.

params = getLearnableParameters(actor);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров агента к новым модифицированным значениям.

actor = setLearnableParameters(actor,modifiedParams);

Настройте актера в агенте к новому модифицированному агенту.

agent = setActor(agent,actor);

Входные параметры

свернуть все

`rep` — Политика или представление функции ценности
`rlValueRepresentation` возразите | `rlQValueRepresentation` возразите | `rlDeterministicActorRepresentation` возразите | `rlStochasticActorRepresentation` объект

Политика или представление функции ценности в виде одного из следующего:

rlValueRepresentation объект — представление Функции ценности
rlQValueRepresentation объект — представление Q-функции-ценности
rlDeterministicActorRepresentation объект — Представление актера с детерминированными действиями
rlStochasticActorRepresentation объект — Представление актера со стохастическими действиями

Чтобы создать политику или представление функции ценности, используйте один из следующих методов:

Создайте представление с помощью соответствующего объекта представления.
Получите существующее представление функции ценности от агента с помощью getCritic
Получите существующее представление политики от агента с помощью getActor.

Выходные аргументы

свернуть все

`val` — Значения настраиваемого параметра
cellArray

Значения настраиваемого параметра для объекта представления, возвращенного как массив ячеек. Можно изменить эти значения параметров и установить их в исходном агенте или различном агенте с помощью setLearnableParameters функция.

Вопросы совместимости

развернуть все

`getLearnableParameterValues` теперь `getLearnableParameters`

Поведение изменяется в R2020a

getLearnableParameterValues теперь getLearnableParameters. Чтобы обновить ваш код, поменяйте имя функции от getLearnableParameterValues к getLearnableParameters. Синтаксисы эквивалентны.

Документация

getLearnableParameters

Синтаксис

Описание

Примеры

Измените значения параметров критика

Измените значения параметров агента

Входные параметры

`rep` — Политика или представление функции ценности
`rlValueRepresentation` возразите | `rlQValueRepresentation` возразите | `rlDeterministicActorRepresentation` возразите | `rlStochasticActorRepresentation` объект

Выходные аргументы

`val` — Значения настраиваемого параметра
cellArray

Вопросы совместимости

`getLearnableParameterValues` теперь `getLearnableParameters`

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Документация

getLearnableParameters

Синтаксис

Описание

Примеры

Измените значения параметров критика

Измените значения параметров агента

Входные параметры

rep — Политика или представление функции ценности rlValueRepresentation возразите | rlQValueRepresentation возразите | rlDeterministicActorRepresentation возразите | rlStochasticActorRepresentation объект

Выходные аргументы

val — Значения настраиваемого параметра cellArray

Вопросы совместимости

getLearnableParameterValues теперь getLearnableParameters

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

`rep` — Политика или представление функции ценности
`rlValueRepresentation` возразите | `rlQValueRepresentation` возразите | `rlDeterministicActorRepresentation` возразите | `rlStochasticActorRepresentation` объект

`val` — Значения настраиваемого параметра
cellArray

`getLearnableParameterValues` теперь `getLearnableParameters`