rlQAgentOptions

Создайте опции для агента Q-изучения

Синтаксис

opt = rlQAgentOptions

opt = rlQAgentOptions(Name,Value)

Описание

opt = rlQAgentOptions создает объект rlQAgentOptions для использования в качестве аргумента при создании агента Q-изучения с помощью всех настроек по умолчанию. Можно изменить свойства объектов с помощью записи через точку.

пример

opt = rlQAgentOptions(Name,Value) создает объект опций использование заданных пар "имя-значение", чтобы заменить значения свойств по умолчанию.

Примеры

свернуть все

Создайте объект опций агента Q-изучения

Создайте объект rlQAgentOptions, который задает шаг расчета агента.

opt = rlQAgentOptions('SampleTime',0.5)

opt = 

  rlQAgentOptions with properties:

    EpsilonGreedyExploration: [1×1 rl.option.EpsilonGreedyExploration]
                  SampleTime: 0.5000
              DiscountFactor: 0.9900

Можно изменить опции с помощью записи через точку. Например, установите коэффициент дисконтирования агента на 0.95.

opt.DiscountFactor = 0.95;

Входные параметры

свернуть все

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'DiscountFactor',0.95

`'EpsilonGreedyExploration'` — Опции для эпсилона жадное исследование
Объект `EpsilonGreedyExploration`

Опции для эпсилона жадное исследование, заданное как пара, разделенная запятой, состоящая из 'EpsilonGreedyExploration' и объекта EpsilonGreedyExploration со следующими свойствами числового значения.

Свойство	Описание
`Epsilon`	Порог вероятности или к случайным образом выбирает действие или выбирает действие, которое максимизирует функцию значения акта государственной власти. Большее значение `Epsilon` означает, что агент случайным образом исследует пробел действия на более высоком уровне.
`EpsilonMin`	Минимальное значение `Epsilon`
`EpsilonDecay`	Уровень затухания

Epsilon обновляется с помощью следующей формулы, когда это больше, чем EpsilonMin:

Epsilon = Epsilon*(1-EpsilonDecay)

Чтобы задать опции исследования, используйте запись через точку после создания объекта rlQAgentOptions. Например, установите порог вероятности к 0.9.

opt = rlQAgentOptions;
opt.EpsilonGreedyExploration.Epsilon = 0.9;

`'SampleTime'` Шаг расчета агента
`1` (значение по умолчанию) | числовое значение

Шаг расчета агента, заданного как пара, разделенная запятой, состоящая из 'SampleTime' и числового значения.

`'DiscountFactor'` — Коэффициент дисконтирования применился к вознаграждениям
числовое значение

Коэффициент дисконтирования применился к будущим вознаграждениям во время обучения, заданного как пара, разделенная запятой, состоящая из 'DiscountFactor' и положительного числового значения, меньше чем или равного 1.

Выходные аргументы

свернуть все

`opt` — Опции агента Q-изучения
Объект `rlQAgentOptions`

Опции агента Q-изучения, возвращенные как объект rlQAgentOptions. Свойства объектов описаны в Аргументах в виде пар имя-значение.

Смотрите также

rlQAgent

Темы

Агенты Q-изучения

Документация

rlQAgentOptions

Синтаксис

Описание

Примеры

Создайте объект опций агента Q-изучения

Входные параметры

Аргументы в виде пар имя-значение

`'EpsilonGreedyExploration'` — Опции для эпсилона жадное исследование
Объект `EpsilonGreedyExploration`

`'SampleTime'` Шаг расчета агента
`1` (значение по умолчанию) | числовое значение

`'DiscountFactor'` — Коэффициент дисконтирования применился к вознаграждениям
числовое значение

Выходные аргументы

`opt` — Опции агента Q-изучения
Объект `rlQAgentOptions`

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Документация

rlQAgentOptions

Синтаксис

Описание

Примеры

Создайте объект опций агента Q-изучения

Входные параметры

Аргументы в виде пар имя-значение

'EpsilonGreedyExploration' — Опции для эпсилона жадное исследование Объект EpsilonGreedyExploration

'SampleTime' Шаг расчета агента 1 (значение по умолчанию) | числовое значение

'DiscountFactor' — Коэффициент дисконтирования применился к вознаграждениям числовое значение

Выходные аргументы

opt — Опции агента Q-изучения Объект rlQAgentOptions

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

`'EpsilonGreedyExploration'` — Опции для эпсилона жадное исследование
Объект `EpsilonGreedyExploration`

`'SampleTime'` Шаг расчета агента
`1` (значение по умолчанию) | числовое значение

`'DiscountFactor'` — Коэффициент дисконтирования применился к вознаграждениям
числовое значение

`opt` — Опции агента Q-изучения
Объект `rlQAgentOptions`