getObservationInfo

Получите спецификации данных о наблюдении из среды обучения укрепления или агента

свернуть все на странице

Синтаксис

obsInfo = getObservationInfo(env)

obsInfo = getObservationInfo(agent)

Описание

пример

obsInfo = getObservationInfo(env) информация о наблюдении извлечений от среды обучения укрепления env.

obsInfo = getObservationInfo(agent) информация о наблюдении извлечений от укрепления, изучающего агент agent.

Примеры

свернуть все

Извлеките информацию о действии и наблюдении от среды обучения укрепления

Скрипт Open Live Script

Извлеките информацию о действии и наблюдении, которую можно использовать, чтобы создать другие среды или агенты.

Среда обучения укрепления для этого примера является простой продольной динамикой для автомобиля эго и ведущего автомобиля. Учебная цель состоит в том, чтобы сделать автомобильное перемещение эго в скорости набора при поддержании безопасного расстояния от ведущего автомобиля путем управления продольным ускорением (и торможения). Этот пример использует ту же модель автомобиля в качестве Адаптивной Системы Круиз-контроля Используя Образцовое Прогнозирующее Управление (Model Predictive Control Toolbox) пример.

Откройте модель и создайте среду обучения укрепления.

mdl = 'rlACCMdl';
open_system(mdl);
agentblk = [mdl '/RL Agent'];
% create the observation info
obsInfo = rlNumericSpec([3 1],'LowerLimit',-inf*ones(3,1),'UpperLimit',inf*ones(3,1));
obsInfo.Name = 'observations';
obsInfo.Description = 'information on velocity error and ego velocity';
% action Info
actInfo = rlNumericSpec([1 1],'LowerLimit',-3,'UpperLimit',2);
actInfo.Name = 'acceleration';
% define environment
env = rlSimulinkEnv(mdl,agentblk,obsInfo,actInfo)

env = 
  SimulinkEnvWithAgent with properties:

             Model: "rlACCMdl"
        AgentBlock: "rlACCMdl/RL Agent"
          ResetFcn: []
    UseFastRestart: 'on'

Среда обучения укрепления env является объектом SimulinkWithAgent с вышеупомянутыми свойствами.

Извлеките информацию о действии и наблюдении от среды обучения укрепления env.

actInfoExt = getActionInfo(env)

actInfoExt = 
  rlNumericSpec with properties:

     LowerLimit: -3
     UpperLimit: 2
           Name: "acceleration"
    Description: [0x0 string]
      Dimension: [1 1]
       DataType: "double"

obsInfoExt = getObservationInfo(env)

obsInfoExt = 
  rlNumericSpec with properties:

     LowerLimit: [3x1 double]
     UpperLimit: [3x1 double]
           Name: "observations"
    Description: "information on velocity error and ego velocity"
      Dimension: [3 1]
       DataType: "double"

Информация о действии содержит ускоряющие значения, в то время как информация о наблюдении содержит скоростные и скоростные ошибочные значения автомобиля, оборудованного датчиком.

Входные параметры

свернуть все

`env` — Среда обучения укрепления
Объект `SimulinkEnvWithAgent`

Среда обучения укрепления, от которой должна быть извлечена информация о наблюдении, задала как объект SimulinkEnvWithAgent.

Для получения дополнительной информации о среде обучения укрепления смотрите, Создают окружения Simulink для Изучения Укрепления.

`agent` — Агент изучения укрепления
Объект `rlQAgent` | объект `rlSARSAAgent` | объект `rlDQNAgent` | объект `rlDDPGAgent` | объект `rlPGAgent` | объект `rlACAgent`

Агент изучения укрепления, от которого должна быть извлечена информация о наблюдении, задал как один из следующих объектов:

Для получения дополнительной информации об агентах изучения укрепления смотрите, что Укрепление Изучает Агенты.

Выходные аргументы

свернуть все

`obsInfo` — Спецификации данных о наблюдении
массив `rlNumericSpec` возражает | массив объектов `rlFiniteSetSpec`

Спецификации данных о наблюдении извлечены от среды обучения укрепления, возвращенной как массив одного из следующего:

Документация

getObservationInfo

Синтаксис

Описание

Примеры

Извлеките информацию о действии и наблюдении от среды обучения укрепления

Входные параметры

`env` — Среда обучения укрепления
Объект `SimulinkEnvWithAgent`

`agent` — Агент изучения укрепления
Объект `rlQAgent` | объект `rlSARSAAgent` | объект `rlDQNAgent` | объект `rlDDPGAgent` | объект `rlPGAgent` | объект `rlACAgent`

Выходные аргументы

`obsInfo` — Спецификации данных о наблюдении
массив `rlNumericSpec` возражает | массив объектов `rlFiniteSetSpec`

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Документация

getObservationInfo

Синтаксис

Описание

Примеры

Извлеките информацию о действии и наблюдении от среды обучения укрепления

Входные параметры

env — Среда обучения укрепления Объект SimulinkEnvWithAgent

agent — Агент изучения укрепления Объект rlQAgent | объект rlSARSAAgent | объект rlDQNAgent | объект rlDDPGAgent | объект rlPGAgent | объект rlACAgent

Выходные аргументы

obsInfo — Спецификации данных о наблюдении массив rlNumericSpec возражает | массив объектов rlFiniteSetSpec

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

`env` — Среда обучения укрепления
Объект `SimulinkEnvWithAgent`

`agent` — Агент изучения укрепления
Объект `rlQAgent` | объект `rlSARSAAgent` | объект `rlDQNAgent` | объект `rlDDPGAgent` | объект `rlPGAgent` | объект `rlACAgent`

`obsInfo` — Спецификации данных о наблюдении
массив `rlNumericSpec` возражает | массив объектов `rlFiniteSetSpec`