rlPredefinedEnv

Создайте предопределённое окружение обучения с подкреплением

Описание

пример

env = rlPredefinedEnv(keyword) принимает предопределенное ключевое слово keyword имя окружения для создания MATLAB® или Simulink® окружение обучения с подкреплением env. Область окружения env моделирует динамику, с которой взаимодействует агент, генерируя вознаграждения и наблюдения в ответ на действия агента.

Примеры

свернуть все

Используйте предопределенную 'BasicGridWorld' ключевое слово для создания базового окружения обучения с подкреплением мира сетки.

env = rlPredefinedEnv('BasicGridWorld')
env = 
  rlMDPEnv with properties:

       Model: [1x1 rl.env.GridWorld]
    ResetFcn: []

Используйте предопределенную 'DoubleIntegrator-Continuous' ключевое слово для создания непрерывного окружения обучения с подкреплением с двойным интегратором.

env = rlPredefinedEnv('DoubleIntegrator-Continuous')
env = 
  DoubleIntegratorContinuousAction with properties:

             Gain: 1
               Ts: 0.1000
      MaxDistance: 5
    GoalThreshold: 0.0100
                Q: [2x2 double]
                R: 0.0100
         MaxForce: Inf
            State: [2x1 double]

Визуализировать окружение можно с помощью plot функционировать и взаимодействовать с ним, используя reset и step функций.

plot(env)
observation = reset(env)
observation = 2×1

     4
     0

[observation,reward,isDone] = step(env,16)

Figure Double Integrator Visualizer contains an axes. The axes contains an object of type rectangle.

observation = 2×1

    4.0800
    1.6000

reward = -16.5559
isDone = logical
   0

Используйте предопределенную 'SimplePendulumModel-Continuous' ключевое слово для создания непрерывного окружения обучения с подкреплением модели математического маятника.

env = rlPredefinedEnv('SimplePendulumModel-Continuous')
env = 
SimulinkEnvWithAgent with properties:

           Model : rlSimplePendulumModel
      AgentBlock : rlSimplePendulumModel/RL Agent
        ResetFcn : []
  UseFastRestart : on

Входные параметры

свернуть все

Предопределенное ключевое слово, представляющее имя окружения, задается как одно из следующего:

Окружение MATLAB

  • 'BasicGridWorld'

  • 'CartPole-Discrete'

  • 'CartPole-Continuous'

  • 'DoubleIntegrator-Discrete'

  • 'DoubleIntegrator-Continuous'

  • 'SimplePendulumWithImage-Discrete'

  • 'SimplePendulumWithImage-Continuous'

  • 'WaterFallGridWorld-Stochastic'

  • 'WaterFallGridWorld-Deterministic'

Окружение Simulink

  • 'SimplePendulumModel-Discrete'

  • 'SimplePendulumModel-Continuous'

  • 'CartPoleSimscapeModel-Discrete'

  • 'CartPoleSimscapeModel-Continuous'

Выходные аргументы

свернуть все

Окружение Simulink, возвращенный как одно из следующего:

  • rlMDPEnv объект, когда вы используете одно из следующих ключевых слов.

    • 'BasicGridWorld'

    • 'WaterFallGridWorld-Stochastic'

    • 'WaterFallGridWorld-Deterministic'

  • CartPoleDiscreteAction объект, когда вы используете 'CartPole-Discrete' ключевое слово.

  • CartPoleContinuousAction объект, когда вы используете 'CartPole-Continuous' ключевое слово.

  • DoubleIntegratorDiscreteAction объект, когда вы используете 'DoubleIntegrator-Discrete' ключевое слово.

  • DoubleIntegratorContinuousAction объект, когда вы используете 'DoubleIntegrator-Continuous' ключевое слово.

  • SimplePendlumWithImageDiscreteAction объект, когда вы используете 'SimplePendulumWithImage-Discrete' ключевое слово.

  • SimplePendlumWithImageContinuousAction объект, когда вы используете 'SimplePendulumWithImage-Continuous' ключевое слово.

  • SimulinkEnvWithAgent объект, когда вы используете одно из следующих ключевых слов.

    • 'SimplePendulumModel-Discrete'

    • 'SimplePendulumModel-Continuous'

    • 'CartPoleSimscapeModel-Discrete'

    • 'CartPoleSimscapeModel-Continuous'

Введенный в R2019a