setLearnableParameters

Установите значения настраиваемого параметра представления функции ценности или политики

Синтаксис

newRep = setLearnableParameters(oldRep,val)

Описание

newRep = setLearnableParameters(oldRep,val) возвращает новую политику или представление функции ценности, newRep, с той же структурой как исходное представление, oldRep, и значения настраиваемого параметра заданы в val.

Примеры

свернуть все

Измените значения параметров критика

Скрипт Open Live Script

Примите, что у вас есть существующий обученный агент обучения с подкреплением. В данном примере загрузите обученного агента от, Обучают Агента DDPG Управлять Двойной Системой Интегратора.

load('DoubleIntegDDPG.mat','agent')

Получите представление критика от агента.

critic = getCritic(agent);

Получите настраиваемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика к новым модифицированным значениям.

critic = setLearnableParameters(critic,modifiedParams);

Установите критика в агенте новому модифицированному критику.

agent = setCritic(agent,critic);

Измените значения параметров агента

Скрипт Open Live Script

load('DoubleIntegDDPG.mat','agent')

Получите представление актера из агента.

actor = getActor(agent);

Получите настраиваемые параметры из агента.

params = getLearnableParameters(actor);

Измените значения параметров. В данном примере просто умножьте все параметры 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров агента к новым модифицированным значениям.

actor = setLearnableParameters(actor,modifiedParams);

Настройте актера в агенте к новому модифицированному агенту.

agent = setActor(agent,actor);

Входные параметры

свернуть все

`oldRep` — Исходная политика или представление функции ценности
`rlValueRepresentation` возразите | `rlQValueRepresentation` возразите | `rlDeterministicActorRepresentation` возразите | `rlStochasticActorRepresentation` объект

Исходная политика или представление функции ценности в виде одного из следующего:

rlValueRepresentation объект — представление Функции ценности
rlQValueRepresentation объект — представление Q-функции-ценности
rlDeterministicActorRepresentation объект — Представление актера с детерминированными действиями
rlStochasticActorRepresentation объект — Представление актера со стохастическими действиями

Чтобы создать политику или представление функции ценности, используйте один из следующих методов:

Создайте представление с помощью соответствующего объекта представления.
Получите существующее представление функции ценности от агента с помощью getCritic
Получите существующее представление политики от агента с помощью getActor.

`val` — Значения настраиваемого параметра
cellArray

Значения настраиваемого параметра для представления возражают в виде массива ячеек. Параметры в val должно быть совместимо со структурой и параметризацией oldRep.

Чтобы получить массив ячеек значений настраиваемого параметра от существующего представления, которое можно затем изменить, используют getLearnableParameters функция.

Выходные аргументы

свернуть все

`newRep` — Новая политика или представление функции ценности
`rlValueRepresentation` | `rlQValueRepresentation` | `rlDeterministicActorRepresentation` | `rlStochasticActorRepresentation`

Новая политика или представление функции ценности, возвращенное как объект представления того же типа как oldRep. newRep имеет ту же структуру как oldRep но со значениями параметров от val.

Вопросы совместимости

развернуть все

`setLearnableParameterValues` теперь `setLearnableParameters`

Поведение изменяется в R2020a

setLearnableParameterValues теперь setLearnableParameters. Чтобы обновить ваш код, поменяйте имя функции от setLearnableParameterValues к setLearnableParameters. Синтаксисы эквивалентны.

Документация

setLearnableParameters

Синтаксис

Описание

Примеры

Измените значения параметров критика

Измените значения параметров агента

Входные параметры

`val` — Значения настраиваемого параметра
cellArray

Выходные аргументы

`newRep` — Новая политика или представление функции ценности
`rlValueRepresentation` | `rlQValueRepresentation` | `rlDeterministicActorRepresentation` | `rlStochasticActorRepresentation`

Вопросы совместимости

`setLearnableParameterValues` теперь `setLearnableParameters`

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Документация

setLearnableParameters

Синтаксис

Описание

Примеры

Измените значения параметров критика

Измените значения параметров агента

Входные параметры

oldRep — Исходная политика или представление функции ценности rlValueRepresentation возразите | rlQValueRepresentation возразите | rlDeterministicActorRepresentation возразите | rlStochasticActorRepresentation объект

val — Значения настраиваемого параметра cellArray

Выходные аргументы

newRep — Новая политика или представление функции ценности rlValueRepresentation | rlQValueRepresentation | rlDeterministicActorRepresentation | rlStochasticActorRepresentation

Вопросы совместимости

setLearnableParameterValues теперь setLearnableParameters

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

`val` — Значения настраиваемого параметра
cellArray

`newRep` — Новая политика или представление функции ценности
`rlValueRepresentation` | `rlQValueRepresentation` | `rlDeterministicActorRepresentation` | `rlStochasticActorRepresentation`

`setLearnableParameterValues` теперь `setLearnableParameters`