getLearnableParameters

Получите настраиваемый параметр значения из политики или представления функции ценности

Синтаксис

val = getLearnableParameters(rep)

Описание

val = getLearnableParameters(rep) возвращает значения настраиваемых параметров из политики обучения с подкреплением или представления функции ценности rep.

Примеры

свернуть все

Изменение значений параметров критика

Открыть Live Script

Предположим, что у вас есть обученный агент обучения с подкреплением. В данном примере загружает обученного агента из Train DDPG Agent в систему Double Integrator.

load('DoubleIntegDDPG.mat','agent')

Получите представление критика от агента.

critic = getCritic(agent);

Получите настраиваемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножите все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика в новые измененные значения.

critic = setLearnableParameters(critic,modifiedParams);

Установите критика в агенте на нового модифицированного критика.

agent = setCritic(agent,critic);

Изменение значений параметров актёра

Открыть Live Script

load('DoubleIntegDDPG.mat','agent')

Получите представление актера от агента.

actor = getActor(agent);

Получите настраиваемые параметры от актёра.

params = getLearnableParameters(actor);

Измените значения параметров. В данном примере просто умножите все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров актёра в новые измененные значения.

actor = setLearnableParameters(actor,modifiedParams);

Установите актёра в агенте на нового модифицированного актёра.

agent = setActor(agent,actor);

Входные параметры

свернуть все

`rep` - Представление политики или функции ценности
`rlValueRepresentation` | объекта `rlQValueRepresentation` | объекта `rlDeterministicActorRepresentation` | объекта `rlStochasticActorRepresentation` объект

Представление политики или функции ценности, заданное как одно из следующего:

rlValueRepresentation объект - Представление функции ценности
rlQValueRepresentation объект - представление функции Q-значения
rlDeterministicActorRepresentation объект - Представление актера с детерминированными действиями
rlStochasticActorRepresentation объект - Представление актера с стохастическими действиями

Чтобы создать представление политики или функции ценности, используйте один из следующих методов:

Создайте представление с помощью соответствующего объекта представления.
Получите существующее представление функции ценности от агента, используя getCritic
Получите существующее представление политики от агента, используя getActor.

Выходные аргументы

свернуть все

`val` - Выученные значения параметров
массив ячеек

Настраиваемые параметры для объекта представления, возвращенные как массив ячеек. Можно изменить эти значения параметров и задать их в исходном агенте или другом агенте, используя setLearnableParameters функция.

Вопросы совместимости

расширить все

`getLearnableParameterValues` сейчас `getLearnableParameters`

Поведение изменено в R2020a

getLearnableParameterValues сейчас getLearnableParameters. Чтобы обновить код, измените имя функции на getLearnableParameterValues кому getLearnableParameters. Синтаксисы эквивалентны.

См. также

getActor | getCritic | setActor | setCritic | setLearnableParameters

Темы

Введенный в R2019a

Документация

getLearnableParameters

Синтаксис

Описание

Примеры

Изменение значений параметров критика

Изменение значений параметров актёра

Входные параметры

`rep` - Представление политики или функции ценности
`rlValueRepresentation` | объекта `rlQValueRepresentation` | объекта `rlDeterministicActorRepresentation` | объекта `rlStochasticActorRepresentation` объект

Выходные аргументы

`val` - Выученные значения параметров
массив ячеек

Вопросы совместимости

`getLearnableParameterValues` сейчас `getLearnableParameters`

См. также

Темы

Документация по приложению Reinforcement Learning Toolbox

Поддержка

Документация

getLearnableParameters

Синтаксис

Описание

Примеры

Изменение значений параметров критика

Изменение значений параметров актёра

Входные параметры

rep - Представление политики или функции ценности rlValueRepresentation | объекта rlQValueRepresentation | объекта rlDeterministicActorRepresentation | объекта rlStochasticActorRepresentation объект

Выходные аргументы

val - Выученные значения параметров массив ячеек

Вопросы совместимости

getLearnableParameterValues сейчас getLearnableParameters

См. также

Темы

Документация по приложению Reinforcement Learning Toolbox

Поддержка

`rep` - Представление политики или функции ценности
`rlValueRepresentation` | объекта `rlQValueRepresentation` | объекта `rlDeterministicActorRepresentation` | объекта `rlStochasticActorRepresentation` объект

`val` - Выученные значения параметров
массив ячеек

`getLearnableParameterValues` сейчас `getLearnableParameters`