Создайте предопределенную среду обучения с подкреплением
берет предопределенное ключевое слово env = rlPredefinedEnv(keyword)keyword представление среды называет, чтобы создать MATLAB® или среду обучения с подкреплением Simulink® env. Среда env моделирует динамику, с которой агент взаимодействует, генерируя вознаграждения и наблюдения в ответ на действия агента.
Используйте предопределенный 'BasicGridWorld' ключевое слово, чтобы создать основную среду обучения с подкреплением мира сетки.
env = rlPredefinedEnv('BasicGridWorld')env =
rlMDPEnv with properties:
Model: [1x1 rl.env.GridWorld]
ResetFcn: []
Используйте предопределенный 'DoubleIntegrator-Continuous' ключевое слово, чтобы создать непрерывную двойную среду обучения с подкреплением интегратора.
env = rlPredefinedEnv('DoubleIntegrator-Continuous')env =
DoubleIntegratorContinuousAction with properties:
Gain: 1
Ts: 0.1000
MaxDistance: 5
GoalThreshold: 0.0100
Q: [2x2 double]
R: 0.0100
MaxForce: Inf
State: [2x1 double]
Можно визуализировать среду с помощью plot функционируйте и взаимодействуйте с ним с помощью reset и step функции.
plot(env) observation = reset(env)
observation = 2×1
4
0
[observation,reward,isDone] = step(env,16)

observation = 2×1
4.0800
1.6000
reward = -16.5559
isDone = logical
0
Используйте предопределенный 'SimplePendulumModel-Continuous' ключевое слово, чтобы создать непрерывную среду обучения с подкреплением модели математического маятника.
env = rlPredefinedEnv('SimplePendulumModel-Continuous')env =
SimulinkEnvWithAgent with properties:
Model: "rlSimplePendulumModel"
AgentBlock: "rlSimplePendulumModel/RL Agent"
ResetFcn: []
UseFastRestart: 'on'
keyword — Предопределенное ключевое слово, представляющее имя среды'BasicGridWorld' | 'CartPole-Discrete' | 'CartPole-Continuous' | 'DoubleIntegrator-Discrete' | 'DoubleIntegrator-Continuous' | 'SimplePendulumWithImage-Discrete' | 'SimplePendulumWithImage-Continuous' | 'WaterFallGridWorld-Deterministic' | 'WaterFallGridWorld-Stochastic' | 'SimplePendulumModel-Discrete' | 'SimplePendulumModel-Continuous' | 'CartPoleSimscapeModel-Discrete' | 'CartPoleSimscapeModel-Continuous'Предопределенное ключевое слово, представляющее имя среды, заданное как одно из следующего:
Среда MATLAB
'BasicGridWorld'
'CartPole-Discrete'
'CartPole-Continuous'
'DoubleIntegrator-Discrete'
'DoubleIntegrator-Continuous'
'SimplePendulumWithImage-Discrete'
'SimplePendulumWithImage-Continuous'
'WaterFallGridWorld-Stochastic'
'WaterFallGridWorld-Deterministic'
Окружение Simulink
'SimplePendulumModel-Discrete'
'SimplePendulumModel-Continuous'
'CartPoleSimscapeModel-Discrete'
'CartPoleSimscapeModel-Continuous'
env — MATLAB или объект окружения SimulinkrlMDPEnv возразите | CartPoleDiscreteAction возразите | CartPoleContinuousAction возразите | DoubleIntegratorDiscreteAction возразите | DoubleIntegratorContinuousAction возразите | SimplePendlumWithImageDiscreteAction возразите | SimplePendlumWithImageContinuousAction возразите | SimulinkEnvWithAgent объектMATLAB или объект окружения Simulink, возвращенный как одно из следующего:
rlMDPEnv объект, когда вы используете одно из следующих ключевых слов:
'BasicGridWorld'
'WaterFallGridWorld-Stochastic'
'WaterFallGridWorld-Deterministic'
CartPoleDiscreteAction объект, когда вы используете 'CartPole-Discrete' ключевое слово.
CartPoleContinuousAction объект, когда вы используете 'CartPole-Continuous' ключевое слово.
DoubleIntegratorDiscreteAction объект, когда вы используете 'DoubleIntegrator-Discrete' ключевое слово.
DoubleIntegratorContinuousAction объект, когда вы используете 'DoubleIntegrator-Continuous' ключевое слово.
SimplePendlumWithImageDiscreteAction объект, когда вы используете 'SimplePendulumWithImage-Discrete' ключевое слово.
SimplePendlumWithImageContinuousAction объект, когда вы используете 'SimplePendulumWithImage-Continuous' ключевое слово.
SimulinkEnvWithAgent объект, когда вы используете одно из следующих ключевых слов:
'SimplePendulumModel-Discrete'
'SimplePendulumModel-Continuous'
'CartPoleSimscapeModel-Discrete'
'CartPoleSimscapeModel-Continuous'
У вас есть модифицированная версия этого примера. Вы хотите открыть этот пример со своими редактированиями?
Вы щелкнули по ссылке, которая соответствует команде MATLAB:
Выполните эту команду, введя её в командном окне MATLAB.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.