rlDQNAgent

Создайте глубокий агент изучения укрепления Q-сети

Синтаксис

agent = rlDQNAgent(critic,opt)

Описание

agent = rlDQNAgent(critic,opt) создает агент DQN с заданной сетью критика и опции агента DQN. Для получения дополнительной информации об агентах DQN смотрите Глубокие Агенты Q-сети.

Примеры

свернуть все

Создайте агент DQN

Создайте среду, соединяют интерфейсом и получают ее наблюдение и спецификации действия.

env = rlPredefinedEnv("CartPole-Discrete");
obsInfo = getObservationInfo(env);
actInfo = getActionInfo(env);

Создайте представление критика.

statePath = [
    imageInputLayer([4 1 1], 'Normalization', 'none', 'Name', 'state')
    fullyConnectedLayer(24, 'Name', 'CriticStateFC1')
    reluLayer('Name', 'CriticRelu1')
    fullyConnectedLayer(24, 'Name', 'CriticStateFC2')];
actionPath = [
    imageInputLayer([1 1 1], 'Normalization', 'none', 'Name', 'action')
    fullyConnectedLayer(24, 'Name', 'CriticActionFC1')];
commonPath = [
    additionLayer(2,'Name', 'add')
    reluLayer('Name','CriticCommonRelu')
    fullyConnectedLayer(1, 'Name', 'output')];
criticNetwork = layerGraph(statePath);
criticNetwork = addLayers(criticNetwork, actionPath);
criticNetwork = addLayers(criticNetwork, commonPath);    
criticNetwork = connectLayers(criticNetwork,'CriticStateFC2','add/in1');
criticNetwork = connectLayers(criticNetwork,'CriticActionFC1','add/in2');
criticOpts = rlRepresentationOptions('LearnRate',0.01,'GradientThreshold',1);
critic = rlRepresentation(criticNetwork,obsInfo,actInfo,...
    'Observation',{'state'},'Action',{'action'},criticOpts);

Задайте опции агента и создайте агент DQN с помощью среды и критика.

agentOpts = rlDQNAgentOptions(...
    'UseDoubleDQN',false, ...    
    'TargetUpdateMethod',"periodic", ...
    'TargetUpdateFrequency',4, ...   
    'ExperienceBufferLength',100000, ...
    'DiscountFactor',0.99, ...
    'MiniBatchSize',256);
agent = rlDQNAgent(critic,agentOpts);

Входные параметры

свернуть все

Представление сети `critic` — Critic
Объект `rlLayerRepresentation`

Представление сети Critic, заданное как объект rlLayerRepresentation, созданный с помощью rlRepresentation. Для получения дополнительной информации о создании представлений критика смотрите, Создают политику и Представления Функции Значения.

`opt` — Опции агента
Объект `rlDQNAgentOptions`

Опции агента, заданные как объект rlDQNAgentOptions.

Выходные аргументы

свернуть все

`agent` — Агент DQN
Объект `rlDQNAgent`

Агент DQN, возвращенный как объект rlDQNAgent.

Смотрите также

rlDQNAgentOptions | train

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.

Документация

rlDQNAgent

Синтаксис

Описание

Примеры

Создайте агент DQN

Входные параметры

Представление сети critic — Critic Объект rlLayerRepresentation

opt — Опции агента Объект rlDQNAgentOptions

Выходные аргументы

agent — Агент DQN Объект rlDQNAgent

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Представление сети `critic` — Critic
Объект `rlLayerRepresentation`

`opt` — Опции агента
Объект `rlDQNAgentOptions`

`agent` — Агент DQN
Объект `rlDQNAgent`