getLearnableParameters

Получите настраиваемый параметр значения из политики или представления функции ценности

Описание

пример

val = getLearnableParameters(rep) возвращает значения настраиваемых параметров из политики обучения с подкреплением или представления функции ценности rep.

Примеры

свернуть все

Предположим, что у вас есть обученный агент обучения с подкреплением. В данном примере загружает обученного агента из Train DDPG Agent в систему Double Integrator.

load('DoubleIntegDDPG.mat','agent') 

Получите представление критика от агента.

critic = getCritic(agent);

Получите настраиваемые параметры от критика.

params = getLearnableParameters(critic);

Измените значения параметров. В данном примере просто умножите все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров критика в новые измененные значения.

critic = setLearnableParameters(critic,modifiedParams);

Установите критика в агенте на нового модифицированного критика.

agent = setCritic(agent,critic);

Предположим, что у вас есть обученный агент обучения с подкреплением. В данном примере загружает обученного агента из Train DDPG Agent в систему Double Integrator.

load('DoubleIntegDDPG.mat','agent') 

Получите представление актера от агента.

actor = getActor(agent);

Получите настраиваемые параметры от актёра.

params = getLearnableParameters(actor);

Измените значения параметров. В данном примере просто умножите все параметры на 2.

modifiedParams = cellfun(@(x) x*2,params,'UniformOutput',false);

Установите значения параметров актёра в новые измененные значения.

actor = setLearnableParameters(actor,modifiedParams);

Установите актёра в агенте на нового модифицированного актёра.

agent = setActor(agent,actor);

Входные параметры

свернуть все

Представление политики или функции ценности, заданное как одно из следующего:

Чтобы создать представление политики или функции ценности, используйте один из следующих методов:

  • Создайте представление с помощью соответствующего объекта представления.

  • Получите существующее представление функции ценности от агента, используя getCritic

  • Получите существующее представление политики от агента, используя getActor.

Выходные аргументы

свернуть все

Настраиваемые параметры для объекта представления, возвращенные как массив ячеек. Можно изменить эти значения параметров и задать их в исходном агенте или другом агенте, используя setLearnableParameters функция.

Вопросы совместимости

расширить все

Поведение изменено в R2020a

Введенный в R2019a