rlSimulationOptions

Опции для симуляции среды обучения укрепления

Синтаксис

simOpts = rlSimulationOptions
simOpts = rlSimulationOptions(Name,Value)

Описание

пример

simOpts = rlSimulationOptions возвращает опции по умолчанию для симуляции среды обучения укрепления против агента. Вы используете опции симуляции, чтобы задать параметры о симуляции, такие как максимальное количество шагов, чтобы запуститься на симуляцию и количество симуляций, чтобы запуститься. После того, как вы сконфигурируете опции, используйте simOpts в качестве входного параметра для sim.

пример

simOpts = rlSimulationOptions(Name,Value) создает набор опции для симуляции с помощью заданных пар "имя-значение", чтобы заменить значения опции по умолчанию.

Примеры

свернуть все

Создайте набор опций для симуляции среды обучения укрепления. Определите номер шагов, чтобы моделировать к 1 000 и сконфигурировать опции, чтобы запустить три симуляции.

Можно определить опции с помощью Имени, пар Значения, когда вы создаете набор опций. Любые опции, которые вы явным образом не устанавливаете, имеют свои значения по умолчанию.

simOpts = rlSimulationOptions(...
    'MaxSteps',1000,...
    'NumSimulations',3)
simOpts = 
  rlSimulationOptions with properties:

          MaxSteps: 1000
    NumSimulations: 3
       StopOnError: "off"

Также создайте набор опций по умолчанию и используйте запись через точку, чтобы изменить некоторые значения.

simOpts = rlSimulationOptions;
simOpts.MaxSteps = 1000;
simOpts.NumSimulations = 3;

simOpts
simOpts = 
  rlSimulationOptions with properties:

          MaxSteps: 1000
    NumSimulations: 3
       StopOnError: "off"

Входные параметры

свернуть все

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'MaxSteps',1000,'StopOnError',"On"

Количество шагов, чтобы запустить симуляцию, заданную как пара, разделенная запятой, состоящая из 'MaxSteps' и положительного целого числа. В целом вы задаете условия завершения эпизода в среде. Это значение является максимальным количеством шагов, чтобы запуститься в симуляции, если те условия завершения не соблюдают.

Пример: 'MaxSteps',1000

Количество симуляций, чтобы запуститься, заданный как пара, разделенная запятой, состоящая из 'NumSimulations' и положительного целого числа. В начале каждой симуляции sim сбрасывает среду. Вы задаете то, что происходит на сбросе среды, когда вы создаете среду. Например, сброс среды в начале каждого эпизода может включать значения начального состояния рандомизации, если вы конфигурируете свою среду, чтобы сделать так. В этом случае выполнение нескольких симуляций позволяет вам подтверждать производительность обученного агента в области значений начальных условий.

Пример: 'NumSimulations',10

Остановите симуляцию, когда ошибка произойдет, заданная как "off" или "on". Когда этой опцией является "off", ошибки зафиксированы и возвращены в SimulationInfo вывод sim, и симуляция продолжается.

Выходные аргументы

свернуть все

Набор опции для симуляции среды обучения укрепления, возвращенной как объект rlSimulationOptions. Значения свойств simOpts инициализируются к значениям по умолчанию или к значениям, которые вы задаете с парами Name,Value. Можно далее изменить значения свойств с помощью записи через точку. Используйте набор опций в качестве входного параметра с sim, когда вы моделируете среду обучения укрепления против агента.

Смотрите также

Введенный в R2019a

Для просмотра документации необходимо авторизоваться на сайте