rlPredefinedEnv

Создайте предопределенную среду обучения укрепления

Синтаксис

env = rlPredefinedEnv(keyword)

Описание

пример

env = rlPredefinedEnv(keyword) берет предопределенное ключевое слово keyword, представляющий имя среды, чтобы создать MATLAB® или среду обучения укрепления Simulink® env. Модели env среды динамика, с которой агент взаимодействует, генерируя вознаграждения и наблюдения в ответ на действия агента.

Примеры

свернуть все

Используйте предопределенное ключевое слово 'BasicGridWorld', чтобы создать основную среду обучения укрепления мира сетки.

env = rlPredefinedEnv('BasicGridWorld')
env = 
  rlMDPEnv with properties:

       Model: [1x1 rl.env.GridWorld]
    ResetFcn: []

Используйте предопределенное ключевое слово 'DoubleIntegrator-Continuous', чтобы создать непрерывную двойную среду обучения укрепления интегратора.

env = rlPredefinedEnv('DoubleIntegrator-Continuous')
env = 
  DoubleIntegratorContinuousAction with properties:

             Gain: 1
               Ts: 0.1000
      MaxDistance: 5
    GoalThreshold: 0.0100
                Q: [2×2 double]
                R: 0.0100
         MaxForce: Inf
            State: [2×1 double]

Можно визуализировать среду с помощью plot, функционируют и взаимодействуют с ним с помощью функций step и reset.

plot(env)
observation = reset(env) 
observation = 2×1

     4
     0

[observation, reward, isDone] = step(env,16) 

observation = 2×1

    4.0800
    1.6000

reward = -16.5559
isDone = logical
   0

Используйте предопределенное ключевое слово 'SimplePendulumModel-Continuous', чтобы создать непрерывную среду обучения укрепления модели математического маятника.

env = rlPredefinedEnv('SimplePendulumModel-Continuous')
env = 
  SimulinkWithAgentBlock with properties:

             Model: "SimplePendulumModel"
        AgentBlock: "SimplePendulumModel/RL Agent"
          ResetFcn: []
    UseFastRestart: 'on'

Входные параметры

свернуть все

Предопределенное ключевое слово, представляющее имя среды, заданное как одно из следующего:

Среда MATLAB

  • 'BasicGridWorld'

  • 'CartPole-Discrete'

  • 'CartPole-Continuous'

  • 'DoubleIntegrator-Discrete'

  • 'DoubleIntegrator-Continuous'

  • 'SimplePendulumWithImage-Discrete'

  • 'SimplePendulumWithImage-Continuous'

  • 'WaterFallGridWorld-Stochastic'

  • 'WaterFallGridWorld-Deterministic'

Окружение Simulink

  • 'SimplePendulumModel-Discrete'

  • 'SimplePendulumModel-Continuous'

  • 'CartPoleSimscapeModel-Discrete'

  • 'CartPoleSimscapeModel-Continuous'

Выходные аргументы

свернуть все

MATLAB или объект окружения Simulink, возвращенный как одно из следующего:

  • Объект rlMDPEnv, когда вы используете одно из следующих ключевых слов:

    • 'BasicGridWorld'

    • 'WaterFallGridWorld-Stochastic'

    • 'WaterFallGridWorld-Deterministic'

  • Объект CartPoleDiscreteAction, когда вы используете ключевое слово 'CartPole-Discrete'.

  • Объект CartPoleContinuousAction, когда вы используете ключевое слово 'CartPole-Continuous'.

  • Объект DoubleIntegratorDiscreteAction, когда вы используете ключевое слово 'DoubleIntegrator-Discrete'.

  • Объект DoubleIntegratorContinuousAction, когда вы используете ключевое слово 'DoubleIntegrator-Continuous'.

  • Объект SimplePendlumWithImageDiscreteAction, когда вы используете ключевое слово 'SimplePendulumWithImage-Discrete'.

  • Объект SimplePendlumWithImageContinuousAction, когда вы используете ключевое слово 'SimplePendulumWithImage-Continuous'.

  • Объект SimulinkEnvWithAgent, когда вы используете одно из следующих ключевых слов:

    • 'SimplePendulumModel-Discrete'

    • 'SimplePendulumModel-Continuous'

    • 'CartPoleSimscapeModel-Discrete'

    • 'CartPoleSimscapeModel-Continuous'

Введенный в R2019a

Для просмотра документации необходимо авторизоваться на сайте