setLearnableParameters

Установите настраиваемые параметры политики или представления функции ценности

Синтаксис

newRep = setLearnableParameters(oldRep,val)

Описание

newRep = setLearnableParameters(oldRep,val) возвращает новую политику или представление функции ценности, newRep, с той же структурой, что и исходное представление, oldRep, и настраиваемые параметры, заданные в val.

Примеры

свернуть все

Изменение значений параметров критика

Открыть Live Script

Предположим, что у вас есть обученный агент обучения с подкреплением. В данном примере загружает обученного агента из Train DDPG Agent в систему Double Integrator.

load('DoubleIntegDDPG.mat','agent')

Получите представление критика от агента.

critic = getCritic(agent);

Получите настраиваемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножите все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика в новые измененные значения.

critic = setLearnableParameters(critic,modifiedParams);

Установите критика в агенте на нового модифицированного критика.

agent = setCritic(agent,critic);

Изменение значений параметров актёра

Открыть Live Script

load('DoubleIntegDDPG.mat','agent')

Получите представление актера от агента.

actor = getActor(agent);

Получите настраиваемые параметры от актёра.

params = getLearnableParameters(actor);

Измените значения параметров. В данном примере просто умножите все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров актёра в новые измененные значения.

actor = setLearnableParameters(actor,modifiedParams);

Установите актёра в агенте на нового модифицированного актёра.

agent = setActor(agent,actor);

Входные параметры

свернуть все

`oldRep` - Исходная политика или представление функции ценности
`rlValueRepresentation` | объекта `rlQValueRepresentation` | объекта `rlDeterministicActorRepresentation` | объекта `rlStochasticActorRepresentation` объект

Представление исходной политики или функции ценности, заданное как одно из следующего:

rlValueRepresentation объект - Представление функции ценности
rlQValueRepresentation объект - представление функции Q-значения
rlDeterministicActorRepresentation объект - Представление актера с детерминированными действиями
rlStochasticActorRepresentation объект - Представление актера с стохастическими действиями

Чтобы создать представление политики или функции ценности, используйте один из следующих методов:

Создайте представление с помощью соответствующего объекта представления.
Получите существующее представление функции ценности от агента, используя getCritic
Получите существующее представление политики от агента, используя getActor.

`val` - Выученные значения параметров
массив ячеек

Настраиваемые параметры для объекта представления, заданные как массив ячеек. Параметры в val должна быть совместима со структурой и параметризацией oldRep.

Чтобы получить массив ячеек с настраиваемым параметром значениями из существующего представления, которое можно затем изменить, используйте getLearnableParameters функция.

Выходные аргументы

свернуть все

`newRep` - Представление новой политики или функции ценности
`rlValueRepresentation` | `rlQValueRepresentation` | `rlDeterministicActorRepresentation` | `rlStochasticActorRepresentation`

Представление новой политики или функции ценности, возвращаемое как объект представления того же типа, что и oldRep. newRep имеет ту же структуру, что и oldRep но со значениями параметров из val.

Вопросы совместимости

расширить все

`setLearnableParameterValues` сейчас `setLearnableParameters`

Поведение изменено в R2020a

setLearnableParameterValues сейчас setLearnableParameters. Чтобы обновить код, измените имя функции на setLearnableParameterValues кому setLearnableParameters. Синтаксисы эквивалентны.

См. также

getActor | getCritic | getLearnableParameters | setActor | setCritic

Темы

Введенный в R2019a

Документация

setLearnableParameters

Синтаксис

Описание

Примеры

Изменение значений параметров критика

Изменение значений параметров актёра

Входные параметры

`oldRep` - Исходная политика или представление функции ценности
`rlValueRepresentation` | объекта `rlQValueRepresentation` | объекта `rlDeterministicActorRepresentation` | объекта `rlStochasticActorRepresentation` объект

`val` - Выученные значения параметров
массив ячеек

Выходные аргументы

`newRep` - Представление новой политики или функции ценности
`rlValueRepresentation` | `rlQValueRepresentation` | `rlDeterministicActorRepresentation` | `rlStochasticActorRepresentation`

Вопросы совместимости

`setLearnableParameterValues` сейчас `setLearnableParameters`

См. также

Темы

Документация по приложению Reinforcement Learning Toolbox

Поддержка

Документация

setLearnableParameters

Синтаксис

Описание

Примеры

Изменение значений параметров критика

Изменение значений параметров актёра

Входные параметры

oldRep - Исходная политика или представление функции ценности rlValueRepresentation | объекта rlQValueRepresentation | объекта rlDeterministicActorRepresentation | объекта rlStochasticActorRepresentation объект

val - Выученные значения параметров массив ячеек

Выходные аргументы

newRep - Представление новой политики или функции ценности rlValueRepresentation | rlQValueRepresentation | rlDeterministicActorRepresentation | rlStochasticActorRepresentation

Вопросы совместимости

setLearnableParameterValues сейчас setLearnableParameters

См. также

Темы

Документация по приложению Reinforcement Learning Toolbox

Поддержка

`oldRep` - Исходная политика или представление функции ценности
`rlValueRepresentation` | объекта `rlQValueRepresentation` | объекта `rlDeterministicActorRepresentation` | объекта `rlStochasticActorRepresentation` объект

`val` - Выученные значения параметров
массив ячеек

`newRep` - Представление новой политики или функции ценности
`rlValueRepresentation` | `rlQValueRepresentation` | `rlDeterministicActorRepresentation` | `rlStochasticActorRepresentation`

`setLearnableParameterValues` сейчас `setLearnableParameters`