setLearnableParameters

Установка значений обучаемых параметров для представления политики или функции значений

Синтаксис

newRep = setLearnableParameters (oldRep, val)

Описание

newRep = setLearnableParameters(oldRep,val) возвращает новую политику или представление функции значения, newRep, с той же структурой, что и исходное представление, oldRepи значения обучаемых параметров, указанные в val.

Примеры

свернуть все

Изменение значений критических параметров

Открыть сценарий в реальном времени

Предположим, что у вас есть обученный агент по обучению усилению. В этом примере следует загрузить обученного агента из Train DDPG Agent в систему двойного интегратора Control.

load('DoubleIntegDDPG.mat','agent')

Получите представление критика от агента.

critic = getCritic(agent);

Получите обучаемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. Для этого примера просто умножьте все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Задайте для параметров критика новые измененные значения.

critic = setLearnableParameters(critic,modifiedParams);

Установите для критика в агенте нового модифицированного критика.

agent = setCritic(agent,critic);

Изменение значений параметров актера

Открыть сценарий в реальном времени

load('DoubleIntegDDPG.mat','agent')

Получить представление актера от агента.

actor = getActor(agent);

Получение обучаемых параметров от актера.

params = getLearnableParameters(actor);

Измените значения параметров. Для этого примера просто умножьте все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров актера на новые измененные значения.

actor = setLearnableParameters(actor,modifiedParams);

Установите актера в агенте на нового измененного актера.

agent = setActor(agent,actor);

Входные аргументы

свернуть все

`oldRep` - Представление исходной политики или функции значения
`rlValueRepresentation` объект | `rlQValueRepresentation` объект | `rlDeterministicActorRepresentation` объект | `rlStochasticActorRepresentation` объект

Представление исходной политики или функции значения, указанное как одно из следующих значений:

rlValueRepresentation object - Представление функции Value
rlQValueRepresentation object - представление функции Q-value
rlDeterministicActorRepresentation object - Представление актера с детерминированными действиями
rlStochasticActorRepresentation object - Представление актера со стохастическими действиями

Чтобы создать представление политики или функции значения, используйте один из следующих методов.

Создайте представление, используя соответствующий объект представления.
Получение существующего представления функции значения от агента с помощью getCritic
Получение существующего представления политики от агента с помощью getActor.

`val` - Значения обучаемых параметров
массив ячеек

Узнаваемые значения параметров для объекта представления, заданные как массив ячеек. Параметры в val должны быть совместимы со структурой и параметризацией oldRep.

Чтобы получить массив ячеек значений обучаемых параметров из существующего представления, которое затем можно изменить, используйте getLearnableParameters функция.

Выходные аргументы

свернуть все

`newRep` - Новая политика или представление функции значения
`rlValueRepresentation` | `rlQValueRepresentation` | `rlDeterministicActorRepresentation` | `rlStochasticActorRepresentation`

Новое представление политики или функции значения, возвращаемое как объект представления того же типа, что и oldRep. newRep имеет ту же структуру, что и oldRep но со значениями параметров из val.

Вопросы совместимости

развернуть все

`setLearnableParameterValues` сейчас `setLearnableParameters`

В R2020a изменилось поведение

setLearnableParameterValues сейчас setLearnableParameters. Чтобы обновить код, измените имя функции с setLearnableParameterValues кому setLearnableParameters. Синтаксы эквивалентны.

См. также

getActor | getCritic | getLearnableParameters | setActor | setCritic

Темы

Представлен в R2019a

Документация

setLearnableParameters

Синтаксис

Описание

Примеры

Изменение значений критических параметров

Изменение значений параметров актера

Входные аргументы

`oldRep` - Представление исходной политики или функции значения
`rlValueRepresentation` объект | `rlQValueRepresentation` объект | `rlDeterministicActorRepresentation` объект | `rlStochasticActorRepresentation` объект

`val` - Значения обучаемых параметров
массив ячеек

Выходные аргументы

`newRep` - Новая политика или представление функции значения
`rlValueRepresentation` | `rlQValueRepresentation` | `rlDeterministicActorRepresentation` | `rlStochasticActorRepresentation`

Вопросы совместимости

`setLearnableParameterValues` сейчас `setLearnableParameters`

См. также

Темы

Документация по инструментам обучения для усиления

Поддержка

Документация

setLearnableParameters

Синтаксис

Описание

Примеры

Изменение значений критических параметров

Изменение значений параметров актера

Входные аргументы

oldRep - Представление исходной политики или функции значения rlValueRepresentation объект | rlQValueRepresentation объект | rlDeterministicActorRepresentation объект | rlStochasticActorRepresentation объект

val - Значения обучаемых параметров массив ячеек

Выходные аргументы

newRep - Новая политика или представление функции значения rlValueRepresentation | rlQValueRepresentation | rlDeterministicActorRepresentation | rlStochasticActorRepresentation

Вопросы совместимости

setLearnableParameterValues сейчас setLearnableParameters

См. также

Темы

Документация по инструментам обучения для усиления

Поддержка

`oldRep` - Представление исходной политики или функции значения
`rlValueRepresentation` объект | `rlQValueRepresentation` объект | `rlDeterministicActorRepresentation` объект | `rlStochasticActorRepresentation` объект

`val` - Значения обучаемых параметров
массив ячеек

`newRep` - Новая политика или представление функции значения
`rlValueRepresentation` | `rlQValueRepresentation` | `rlDeterministicActorRepresentation` | `rlStochasticActorRepresentation`

`setLearnableParameterValues` сейчас `setLearnableParameters`