Чтобы сконфигурировать симуляцию агента в приложении Reinforcement Learning Designer, задайте опции симуляции на вкладке Simulate.
На вкладке Simulate можно задать следующие основные опции симуляции.
Опция | Описание |
---|---|
Number of Episodes | Количество эпизодов для моделирования агента, заданное как положительное целое число. В начале каждого эпизода симуляции приложение сбрасывает окружение. |
Max Episode Length | Количество шагов для запуска симуляции, заданное как положительное целое число. В целом, вы задаете условия прекращения эпизода в окружении. Это значение является максимальным количеством шагов для выполнения в симуляции, если эти условия завершения не выполняются. |
Stop on Error | Выберите эту опцию, чтобы остановить симуляцию, когда ошибка возникает во время эпизода. |
Чтобы симулировать агента с помощью параллельных вычислений, на вкладке Simulate, нажмите. Для симуляции агентов, использующих параллельные вычисления, требуется программное обеспечение Parallel Computing Toolbox™. Для получения дополнительной информации смотрите Train агентов с использованием параллельных вычислений и графических процессоров.
Чтобы задать опции для параллельной симуляции, выберите Use Parallel > Parallel training options.
В диалоговом окне Опции параллельного моделирования (Parallel Simulation Options) можно задать следующие опции обучения.
Опция | Описание |
---|---|
Transfer workspace variables to workers | Выберите эту опцию, чтобы отправить переменные модели и рабочей области параллельным рабочим. Когда вы выбираете эту опцию, хост отправляет переменные, используемые в моделях и определенные в MATLAB® рабочей области рабочим. |
Random seed for workers | Инициализация рандомизатора для рабочих процессов, заданная как одно из следующих значений.
|
Files to attach to parallel pool | Дополнительные файлы для присоединения к параллельному пулу. Укажите имена файлов в текущей рабочей директории с одним именем в каждой линии. |
Worker setup function | Функция, которая запускается до начала симуляции, задается как имя функции, не имеющей входных параметров. Эта функция запускается один раз на каждого работника перед началом симуляции. Напишите эту функцию, чтобы выполнить любую обработку, которая вам нужна до обучения. |
Worker cleanup function | Функция для выполнения после окончания симуляции, заданная как имя функции, не имеющей входных параметров. Можно записать эту функцию, чтобы очистить рабочую область или выполнить другую обработку после завершения обучения. |
Следующий рисунок показывает пример параллельного строения обучения следующих файлов и функций.
Файл данных, присоединенный к параллельному пулу - workerData.mat
Функция настройки работника - mySetup.m
Функция очистки рабочих - myCleanup.m
Reinforcement Learning Designer