getObservationInfo

Получение спецификаций данных наблюдения из среды обучения армированию или агента

свернуть все на странице

Синтаксис

obsInfo = getTalkedInfo (env)

obsInfo = getTalkedInfo (агент)

Описание

пример

obsInfo = getObservationInfo(env) извлекает информацию наблюдения из среды обучения армированию env.

obsInfo = getObservationInfo(agent) извлекает информацию наблюдения из усиливающего обучающего агента agent.

Примеры

свернуть все

Извлечение информации о действиях и наблюдениях из среды обучения по усилению

Открыть сценарий в реальном времени

Извлеките сведения о действиях и наблюдениях, которые можно использовать для создания других сред или агентов.

Среда обучения армированию для этого примера представляет собой простую продольную динамику для эго-автомобиля и ведущего автомобиля. Целью обучения является обеспечение движения эго-автомобиля с заданной скоростью при сохранении безопасного расстояния от ведущего автомобиля путем управления продольным ускорением (и торможением). В этом примере используется та же модель транспортного средства, что и в примере адаптивной системы круиз-контроля с использованием модельного прогнозирующего управления (Model Predictive Control Toolbox).

Откройте модель и создайте среду обучения армированию.

mdl = 'rlACCMdl';
open_system(mdl);
agentblk = [mdl '/RL Agent'];
% create the observation info
obsInfo = rlNumericSpec([3 1],'LowerLimit',-inf*ones(3,1),'UpperLimit',inf*ones(3,1));
obsInfo.Name = 'observations';
obsInfo.Description = 'information on velocity error and ego velocity';
% action Info
actInfo = rlNumericSpec([1 1],'LowerLimit',-3,'UpperLimit',2);
actInfo.Name = 'acceleration';
% define environment
env = rlSimulinkEnv(mdl,agentblk,obsInfo,actInfo)

env = 
SimulinkEnvWithAgent with properties:

           Model : rlACCMdl
      AgentBlock : rlACCMdl/RL Agent
        ResetFcn : []
  UseFastRestart : on

Среда обучения по усилению env является SimulinkWithAgent с указанными выше свойствами.

Извлечение информации о действиях и наблюдениях из среды обучения армированию env.

actInfoExt = getActionInfo(env)

actInfoExt = 
  rlNumericSpec with properties:

     LowerLimit: -3
     UpperLimit: 2
           Name: "acceleration"
    Description: [0x0 string]
      Dimension: [1 1]
       DataType: "double"

obsInfoExt = getObservationInfo(env)

obsInfoExt = 
  rlNumericSpec with properties:

     LowerLimit: [3x1 double]
     UpperLimit: [3x1 double]
           Name: "observations"
    Description: "information on velocity error and ego velocity"
      Dimension: [3 1]
       DataType: "double"

Информация о действии содержит значения ускорения, в то время как информация о наблюдении содержит значения ошибок скорости и скорости эго-транспортного средства.

Входные аргументы

свернуть все

`env` - Усиливающая среда обучения
`SimulinkEnvWithAgent` объект

Среда обучения армированию, из которой должна быть извлечена информация наблюдения, указанная как SimulinkEnvWithAgent объект.

Дополнительные сведения об учебных средах для усиления см. в разделе Создание учебных сред для усиления Simulink.

`agent` - Усиливающий обучающий агент
`rlQAgent` объект | `rlSARSAAgent` объект | `rlDQNAgent` объект | `rlDDPGAgent` объект | `rlPGAgent` объект | `rlACAgent` объект

Усиливающий обучающий агент, из которого должна быть извлечена информация наблюдения, указанный как один из следующих объектов:

Дополнительные сведения об агентах обучения усилению см. в разделе Агенты обучения усилению.

Выходные аргументы

свернуть все

`obsInfo` - Спецификации данных наблюдений
массив `rlNumericSpec` объекты | массив `rlFiniteSetSpec` объекты

Спецификации данных наблюдений, извлеченные из среды обучения армированию, возвращены в виде массива одного из следующих элементов:

rlNumericSpec объекты
rlFiniteSetSpec объекты
Сочетание rlNumericSpec и rlFiniteSetSpec объекты

См. также

Темы

Представлен в R2019a

Документация

getObservationInfo

Синтаксис

Описание

Примеры

Извлечение информации о действиях и наблюдениях из среды обучения по усилению

Входные аргументы

`env` - Усиливающая среда обучения
`SimulinkEnvWithAgent` объект

`agent` - Усиливающий обучающий агент
`rlQAgent` объект | `rlSARSAAgent` объект | `rlDQNAgent` объект | `rlDDPGAgent` объект | `rlPGAgent` объект | `rlACAgent` объект

Выходные аргументы

`obsInfo` - Спецификации данных наблюдений
массив `rlNumericSpec` объекты | массив `rlFiniteSetSpec` объекты

См. также

Темы

Документация по инструментам обучения для усиления

Поддержка

Документация

getObservationInfo

Синтаксис

Описание

Примеры

Извлечение информации о действиях и наблюдениях из среды обучения по усилению

Входные аргументы

env - Усиливающая среда обучения SimulinkEnvWithAgent объект

agent - Усиливающий обучающий агент rlQAgent объект | rlSARSAAgent объект | rlDQNAgent объект | rlDDPGAgent объект | rlPGAgent объект | rlACAgent объект

Выходные аргументы

obsInfo - Спецификации данных наблюдений массив rlNumericSpec объекты | массив rlFiniteSetSpec объекты

См. также

Темы

Документация по инструментам обучения для усиления

Поддержка

`env` - Усиливающая среда обучения
`SimulinkEnvWithAgent` объект

`agent` - Усиливающий обучающий агент
`rlQAgent` объект | `rlSARSAAgent` объект | `rlDQNAgent` объект | `rlDDPGAgent` объект | `rlPGAgent` объект | `rlACAgent` объект

`obsInfo` - Спецификации данных наблюдений
массив `rlNumericSpec` объекты | массив `rlFiniteSetSpec` объекты