createIntegratedEnv

Создайте модель Simulink для обучения с подкреплением, с помощью образца модели в качестве среды

Синтаксис

env = createIntegratedEnv(refModel,newModel)

[env,agentBlock,obsInfo,actInfo] = createIntegratedEnv(___)

[___] = createIntegratedEnv(___,Name,Value)

Описание

env = createIntegratedEnv(refModel,newModel) создает Simulink^® модель с именем, заданным newModel и возвращает объект среды обучения с подкреплением, env, для этой модели. Новая модель содержит блок RL Agent и использует образец модели refModel как среда обучения с подкреплением для обучения свойство агента задано этим блоком.

пример

[env,agentBlock,obsInfo,actInfo] = createIntegratedEnv(___) возвращает блок path в блок RL Agent в новой модели и технических требованиях данных о наблюдении и действии для образца модели, obsInfo и actInfo, соответственно.

пример

[___] = createIntegratedEnv(___,Name,Value) создает модель и интерфейс среды использование порта, наблюдения, и информация о действии задала использование одного или нескольких Name,Value парные аргументы.

Примеры

свернуть все

Создайте среду из модели Simulink

Этот пример использует:

Скрипт Open Live Script

В этом примере показано, как использовать createIntegratedEnv создать объект среды, начинающий с модели Simulink, которая реализует систему с который агент. Такая система часто упоминается как объект, система разомкнутого контура или ссылочная система, в то время как целая (интегрированная) система включая агента часто упоминается как система с обратной связью.

В данном примере используйте летающую модель робота, описанную в, Обучают Агента DDPG Управлять Летающим Роботом как ссылкой (разомкнутый контур) система.

Откройте летающую модель робота.

open_system('rlFlyingRobotEnv')

Инициализируйте переменные состояния и шаг расчета.

% initial model state variables
theta0 = 0;
x0 = -15;
y0 = 0;

% sample time
Ts = 0.4;

Создайте модель Simulink IntegratedEnv содержа летающую модель робота, соединенную в замкнутом цикле с блоком агента. Функция также возвращает объект env среды обучения с подкреплением использоваться для обучения.

env = createIntegratedEnv('rlFlyingRobotEnv','IntegratedEnv')

env = 
SimulinkEnvWithAgent with properties:

           Model : IntegratedEnv
      AgentBlock : IntegratedEnv/RL Agent
        ResetFcn : []
  UseFastRestart : on

Функция может также возвратить блок path в блок RL Agent в новой интегрированной модели, а также спецификации наблюдений и спецификации действия для образца модели.

[~,agentBlk,observationInfo,actionInfo] = createIntegratedEnv('rlFlyingRobotEnv','IntegratedEnv')

agentBlk = 
'IntegratedEnv/RL Agent'

observationInfo = 
  rlNumericSpec with properties:

     LowerLimit: -Inf
     UpperLimit: Inf
           Name: "observation"
    Description: [0x0 string]
      Dimension: [7 1]
       DataType: "double"

actionInfo = 
  rlNumericSpec with properties:

     LowerLimit: -Inf
     UpperLimit: Inf
           Name: "action"
    Description: [0x0 string]
      Dimension: [2 1]
       DataType: "double"

Возврат блока path и технических требований полезен в случаях, в которых необходимо изменить описания, пределы или имена в observationInfo и actionInfo. После изменения технических требований можно затем создать среду из интегрированной модели IntegratedEnv использование rlSimulinkEnv функция.

Создайте интегрированную среду с заданными именами порта

Этот пример использует:

Скрипт Open Live Script

В этом примере показано, как вызвать createIntegratedEnv использование пар "имя-значение", чтобы задать имена порта.

Первый аргумент createIntegratedEnv имя ссылочной модели Simulink, которая содержит систему, с которой должен взаимодействовать агент. Такая система часто упоминается как объект или система разомкнутого контура. В данном примере ссылочная система является моделью бака с водой.

Откройте модель бака с водой разомкнутого контура.

open_system('rlWatertankOpenloop')

Установите шаг расчета дискретного блока интегратора, используемого, чтобы сгенерировать наблюдение, таким образом, симуляция может запуститься.

Ts = 1;

Входной порт называется u (вместо action), и первые и третьи выходные порты называются y и stop (вместо observation и isdone). Задайте имена порта с помощью пар "имя-значение".

env = createIntegratedEnv('rlWatertankOpenloop','IntegratedWatertank',...
    'ActionPortName','u','ObservationPortName','y','IsDonePortName','stop')

env = 
SimulinkEnvWithAgent with properties:

           Model : IntegratedWatertank
      AgentBlock : IntegratedWatertank/RL Agent
        ResetFcn : []
  UseFastRestart : on

Новая модель IntegratedWatertank содержит образец модели, соединенный в с обратной связью с блоком агента. Функция также возвращает объект среды обучения с подкреплением, который будет использоваться для обучения.

Входные параметры

свернуть все

`refModel` — Имя образца модели
представьте в виде строки | вектор символов

Имя образца модели в виде строки или вектора символов. Это - модель Simulink, реализующая систему, с которой должен взаимодействовать агент. Такая система часто упоминается как объект, система разомкнутого контура или ссылочная система, в то время как целая (интегрированная) система включая агента часто упоминается как система замкнутого цикла. Новая модель Simulink использует этот образец модели в качестве динамической модели среды для обучения с подкреплением.

`newModel` — Новое имя модели
представьте в виде строки | вектор символов

Новое имя модели в виде строки или вектора символов. createIntegratedEnv создает модель Simulink с этим именем, но не сохраняет модель.

Аргументы name-value

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'IsDonePortName',"stopSim" устанавливает stopSim порт образца модели как источник isdone сигнал.

`ObservationPortName` — Имя выходного порта сигнала наблюдения образца модели
`"observation"` (значение по умолчанию) | представляет в виде строки | вектор символов

Выходной порт сигнала наблюдения образца модели называет в виде разделенной запятой пары, состоящей из 'ObservationPortName' и строка или вектор символов. Задайте ObservationPortName когда именем выходного порта сигнала наблюдения образца модели не является "observation".

`ActionPortName` — Имя входного порта действия образца модели
`"action"` (значение по умолчанию) | представляет в виде строки | вектор символов

Входной порт действия образца модели называет в виде разделенной запятой пары, состоящей из 'ActionPortName' и строка или вектор символов. Задайте ActionPortName когда именем входного порта действия образца модели не является "action".

`RewardPortName` — Премиальное имя выходного порта образца модели
`"reward"` (значение по умолчанию) | представляет в виде строки | вектор символов

Премиальный выходной порт образца модели называет в виде разделенной запятой пары, состоящей из 'RewardPortName' и строка или вектор символов. Задайте RewardPortName когда именем премиального выходного порта образца модели не является "reward".

`IsDonePortName` — Образец модели сделанное имя выходного порта флага
`"isdone"` (значение по умолчанию) | представляет в виде строки | вектор символов

Образец модели сделанное имя выходного порта флага в виде разделенной запятой пары, состоящей из 'IsDonePortName' и строка или вектор символов. Задайте IsDonePortName когда именем сделанного выходного порта флага образца модели не является "isdone".

`ObservationBusElementNames` — Имена наблюдения соединяют шиной листовые элементы
массив строк

Имена наблюдения соединяют шиной листовые элементы, для которых можно создать технические требования в виде массива строк. Чтобы создать спецификации наблюдений для подмножества элементов в объекте шины Simulink, задайте BusElementNames. Если вы не задаете BusElementNames, спецификация данных создается для каждого листового элемента в шине.

ObservationBusElementNames применимо только, когда выходной порт сигнала наблюдения является сигналом шины.

Пример: 'ObservationBusElementNames',["sin" "cos"] создает технические требования для элементов шины наблюдения с именами "sin" и "cos".

`ObservationDiscreteElements` — Конечные значения для спецификаций наблюдений
массив ячеек пар "имя-значение"

Конечные значения для дискретных элементов спецификации наблюдений в виде разделенной запятой пары, состоящей из 'ObservationDiscreteElements' и массив ячеек пар "имя-значение". Каждая пара "имя-значение" состоит из имени элемента и массива дискретных значений.

Если выходной порт сигнала наблюдения образца модели:

Сигнал шины, задайте имя одного из листовых элементов шины, заданной в ObservationBusElementNames
Сигнал нешины, задайте имя порта наблюдения, как задано ObservationPortName

Заданные дискретные значения должны быть castable к типу данных заданного сигнала наблюдения.

Если вы не задаете дискретные значения для элемента спецификации наблюдений, элемент непрерывен.

Пример: 'ObservationDiscretElements',{'observation',[-1 0 1]} указывает, что дискретные значения для сигнала наблюдения нешины с портом по умолчанию называют observation.

Пример: 'ObservationDiscretElements',{'gear',[-1 0 1 2],'direction',[1 2 3 4]} задает дискретные значения для 'gear' и 'direction' листовые элементы сигнала действия шины.

`ActionDiscreteElements` — Конечные значения для спецификаций действия
массив ячеек пар "имя-значение"

Конечные значения для дискретных элементов спецификации действия в виде разделенной запятой пары, состоящей из 'ActionDiscreteElements' и массив ячеек пар "имя-значение". Каждая пара "имя-значение" состоит из имени элемента и массива дискретных значений.

Если входной порт действия образца модели:

Сигнал шины, задайте имя листового элемента шины
Сигнал нешины, задайте имя порта действия, как задано ActionPortName

Заданные дискретные значения должны быть castable к типу данных заданного сигнала действия.

Если вы не задаете дискретные значения для элемента спецификации действия, элемент непрерывен.

Пример: 'ActionDiscretElements',{'action',[-1 0 1]} указывает, что дискретные значения для сигнала действия нешины с портом по умолчанию называют 'action'.

Пример: 'ActionDiscretElements',{'force',[-10 0 10],'torque',[-5 0 5]} задает дискретные значения для 'force' и 'torque' листовые элементы сигнала действия шины.

Выходные аргументы

свернуть все

`env` — Среда обучения с подкреплением
`SimulinkEnvWithAgent` объект

Интерфейс среды обучения с подкреплением, возвращенный как SimulinkEnvWithAgent объект.

`agentBlock` — Блок path с блоком агента
символьный вектор

Блок path к агенту блокируется в новой модели, возвращенной как вектор символов. Чтобы обучить агента в новой модели Simulink, необходимо создать агента и задать имя агента в блоке RL Agent, обозначенном agentBlock.

Для получения дополнительной информации о создании агентов смотрите Агентов Обучения с подкреплением.

`obsInfo` — Технические требования данных о наблюдении
`rlNumericSpec` возразите | `rlFiniteSetSpec` возразите | массив объектов спецификации данных

Технические требования данных о наблюдении, возвращенные как одно из следующего:

rlNumericSpec объект для одной непрерывной спецификации наблюдений
rlFiniteSetSpec объект для одной дискретной спецификации наблюдений
Массив спецификации данных возражает для нескольких технических требований

`actInfo` — Технические требования данных о действии
`rlNumericSpec` возразите | `rlFiniteSetSpec` возразите | массив объектов спецификации данных

Технические требования данных о действии, возвращенные как одно из следующего:

rlNumericSpec объект для одной непрерывной спецификации действия
rlFiniteSetSpec объект для одной дискретной спецификации действия
Массив спецификации данных возражает для нескольких спецификаций действия

Смотрите также

Введенный в R2019a

Документация

createIntegratedEnv

Синтаксис

Описание

Примеры

Создайте среду из модели Simulink

Создайте интегрированную среду с заданными именами порта

Входные параметры

`refModel` — Имя образца модели
представьте в виде строки | вектор символов

`newModel` — Новое имя модели
представьте в виде строки | вектор символов

Аргументы name-value

`ObservationPortName` — Имя выходного порта сигнала наблюдения образца модели
`"observation"` (значение по умолчанию) | представляет в виде строки | вектор символов

`ActionPortName` — Имя входного порта действия образца модели
`"action"` (значение по умолчанию) | представляет в виде строки | вектор символов

`RewardPortName` — Премиальное имя выходного порта образца модели
`"reward"` (значение по умолчанию) | представляет в виде строки | вектор символов

`IsDonePortName` — Образец модели сделанное имя выходного порта флага
`"isdone"` (значение по умолчанию) | представляет в виде строки | вектор символов

`ObservationBusElementNames` — Имена наблюдения соединяют шиной листовые элементы
массив строк

`ObservationDiscreteElements` — Конечные значения для спецификаций наблюдений
массив ячеек пар "имя-значение"

`ActionDiscreteElements` — Конечные значения для спецификаций действия
массив ячеек пар "имя-значение"

Выходные аргументы

`env` — Среда обучения с подкреплением
`SimulinkEnvWithAgent` объект

`agentBlock` — Блок path с блоком агента
символьный вектор

`obsInfo` — Технические требования данных о наблюдении
`rlNumericSpec` возразите | `rlFiniteSetSpec` возразите | массив объектов спецификации данных

`actInfo` — Технические требования данных о действии
`rlNumericSpec` возразите | `rlFiniteSetSpec` возразите | массив объектов спецификации данных

Смотрите также

Блоки

Функции

Темы

Документация Reinforcement Learning Toolbox

Поддержка

Документация

createIntegratedEnv

Синтаксис

Описание

Примеры

Создайте среду из модели Simulink

Создайте интегрированную среду с заданными именами порта

Входные параметры

refModel — Имя образца модели представьте в виде строки | вектор символов

newModel — Новое имя модели представьте в виде строки | вектор символов

Аргументы name-value

ObservationPortName — Имя выходного порта сигнала наблюдения образца модели "observation" (значение по умолчанию) | представляет в виде строки | вектор символов

ActionPortName — Имя входного порта действия образца модели "action" (значение по умолчанию) | представляет в виде строки | вектор символов

RewardPortName — Премиальное имя выходного порта образца модели "reward" (значение по умолчанию) | представляет в виде строки | вектор символов

IsDonePortName — Образец модели сделанное имя выходного порта флага "isdone" (значение по умолчанию) | представляет в виде строки | вектор символов

ObservationBusElementNames — Имена наблюдения соединяют шиной листовые элементы массив строк

ObservationDiscreteElements — Конечные значения для спецификаций наблюдений массив ячеек пар "имя-значение"

ActionDiscreteElements — Конечные значения для спецификаций действия массив ячеек пар "имя-значение"

Выходные аргументы

env — Среда обучения с подкреплением SimulinkEnvWithAgent объект

agentBlock — Блок path с блоком агента символьный вектор

obsInfo — Технические требования данных о наблюдении rlNumericSpec возразите | rlFiniteSetSpec возразите | массив объектов спецификации данных

actInfo — Технические требования данных о действии rlNumericSpec возразите | rlFiniteSetSpec возразите | массив объектов спецификации данных

Смотрите также

Блоки

Функции

Темы

Документация Reinforcement Learning Toolbox

Поддержка

`refModel` — Имя образца модели
представьте в виде строки | вектор символов

`newModel` — Новое имя модели
представьте в виде строки | вектор символов

`ObservationPortName` — Имя выходного порта сигнала наблюдения образца модели
`"observation"` (значение по умолчанию) | представляет в виде строки | вектор символов

`ActionPortName` — Имя входного порта действия образца модели
`"action"` (значение по умолчанию) | представляет в виде строки | вектор символов

`RewardPortName` — Премиальное имя выходного порта образца модели
`"reward"` (значение по умолчанию) | представляет в виде строки | вектор символов

`IsDonePortName` — Образец модели сделанное имя выходного порта флага
`"isdone"` (значение по умолчанию) | представляет в виде строки | вектор символов

`ObservationBusElementNames` — Имена наблюдения соединяют шиной листовые элементы
массив строк

`ObservationDiscreteElements` — Конечные значения для спецификаций наблюдений
массив ячеек пар "имя-значение"

`ActionDiscreteElements` — Конечные значения для спецификаций действия
массив ячеек пар "имя-значение"

`env` — Среда обучения с подкреплением
`SimulinkEnvWithAgent` объект

`agentBlock` — Блок path с блоком агента
символьный вектор

`obsInfo` — Технические требования данных о наблюдении
`rlNumericSpec` возразите | `rlFiniteSetSpec` возразите | массив объектов спецификации данных

`actInfo` — Технические требования данных о действии
`rlNumericSpec` возразите | `rlFiniteSetSpec` возразите | массив объектов спецификации данных