rlSimulationOptions

Опции для симуляции среды обучения укрепления

Синтаксис

simOpts = rlSimulationOptions

simOpts = rlSimulationOptions(Name,Value)

Описание

simOpts = rlSimulationOptions возвращает опции по умолчанию для симуляции среды обучения укрепления против агента. Вы используете опции симуляции, чтобы задать параметры о симуляции, такие как максимальное количество шагов, чтобы запуститься на симуляцию и количество симуляций, чтобы запуститься. После того, как вы сконфигурируете опции, используйте simOpts в качестве входного параметра для sim.

пример

simOpts = rlSimulationOptions(Name,Value) создает набор опции для симуляции с помощью заданных пар "имя-значение", чтобы заменить значения опции по умолчанию.

Примеры

свернуть все

Сконфигурируйте опции для симуляции

Скрипт Open Live Script

Создайте набор опций для симуляции среды обучения укрепления. Определите номер шагов, чтобы моделировать к 1 000 и сконфигурировать опции, чтобы запустить три симуляции.

Можно определить опции с помощью Имени, пар Значения, когда вы создаете набор опций. Любые опции, которые вы явным образом не устанавливаете, имеют свои значения по умолчанию.

simOpts = rlSimulationOptions(...
    'MaxSteps',1000,...
    'NumSimulations',3)

simOpts = 
  rlSimulationOptions with properties:

          MaxSteps: 1000
    NumSimulations: 3
       StopOnError: "off"

Также создайте набор опций по умолчанию и используйте запись через точку, чтобы изменить некоторые значения.

simOpts = rlSimulationOptions;
simOpts.MaxSteps = 1000;
simOpts.NumSimulations = 3;

simOpts

simOpts = 
  rlSimulationOptions with properties:

          MaxSteps: 1000
    NumSimulations: 3
       StopOnError: "off"

Входные параметры

свернуть все

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'MaxSteps',1000,'StopOnError',"On"

`'MaxSteps'` — Количество шагов, чтобы запустить симуляцию
500 (значений по умолчанию) | положительное целое число

Количество шагов, чтобы запустить симуляцию, заданную как пара, разделенная запятой, состоящая из 'MaxSteps' и положительного целого числа. В целом вы задаете условия завершения эпизода в среде. Это значение является максимальным количеством шагов, чтобы запуститься в симуляции, если те условия завершения не соблюдают.

Пример: 'MaxSteps',1000

`'NumSimulations'` — Количество симуляций
1 (значение по умолчанию) | положительное целое число

Количество симуляций, чтобы запуститься, заданный как пара, разделенная запятой, состоящая из 'NumSimulations' и положительного целого числа. В начале каждой симуляции sim сбрасывает среду. Вы задаете то, что происходит на сбросе среды, когда вы создаете среду. Например, сброс среды в начале каждого эпизода может включать значения начального состояния рандомизации, если вы конфигурируете свою среду, чтобы сделать так. В этом случае выполнение нескольких симуляций позволяет вам подтверждать производительность обученного агента в области значений начальных условий.

Пример: 'NumSimulations',10

`'StopOnError'` — Остановите симуляцию, когда ошибка произойдет
`"on"` (значение по умолчанию) | `"off"`

Остановите симуляцию, когда ошибка произойдет, заданная как "off" или "on". Когда этой опцией является "off", ошибки зафиксированы и возвращены в SimulationInfo вывод sim, и симуляция продолжается.

Выходные аргументы

свернуть все

`simOpts` — Опция установлена для симуляции среды обучения укрепления
Объект `rlSimulationOptions`

Набор опции для симуляции среды обучения укрепления, возвращенной как объект rlSimulationOptions. Значения свойств simOpts инициализируются к значениям по умолчанию или к значениям, которые вы задаете с парами Name,Value. Можно далее изменить значения свойств с помощью записи через точку. Используйте набор опций в качестве входного параметра с sim, когда вы моделируете среду обучения укрепления против агента.

Смотрите также

sim

Документация

rlSimulationOptions

Синтаксис

Описание

Примеры

Сконфигурируйте опции для симуляции

Входные параметры

Аргументы в виде пар имя-значение

`'MaxSteps'` — Количество шагов, чтобы запустить симуляцию
500 (значений по умолчанию) | положительное целое число

`'NumSimulations'` — Количество симуляций
1 (значение по умолчанию) | положительное целое число

`'StopOnError'` — Остановите симуляцию, когда ошибка произойдет
`"on"` (значение по умолчанию) | `"off"`

Выходные аргументы

`simOpts` — Опция установлена для симуляции среды обучения укрепления
Объект `rlSimulationOptions`

Смотрите также

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Документация

rlSimulationOptions

Синтаксис

Описание

Примеры

Сконфигурируйте опции для симуляции

Входные параметры

Аргументы в виде пар имя-значение

'MaxSteps' — Количество шагов, чтобы запустить симуляцию 500 (значений по умолчанию) | положительное целое число

'NumSimulations' — Количество симуляций 1 (значение по умолчанию) | положительное целое число

'StopOnError' — Остановите симуляцию, когда ошибка произойдет "on" (значение по умолчанию) | "off"

Выходные аргументы

simOpts — Опция установлена для симуляции среды обучения укрепления Объект rlSimulationOptions

Смотрите также

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

`'MaxSteps'` — Количество шагов, чтобы запустить симуляцию
500 (значений по умолчанию) | положительное целое число

`'NumSimulations'` — Количество симуляций
1 (значение по умолчанию) | положительное целое число

`'StopOnError'` — Остановите симуляцию, когда ошибка произойдет
`"on"` (значение по умолчанию) | `"off"`

`simOpts` — Опция установлена для симуляции среды обучения укрепления
Объект `rlSimulationOptions`