rlQAgentOptions

Создайте опции для агента Q-изучения

Синтаксис

opt = rlQAgentOptions

opt = rlQAgentOptions(Name,Value)

Описание

opt = rlQAgentOptions создает rlQAgentOptions объект для использования в качестве аргумента при создании агента Q-изучения с помощью всех настроек по умолчанию. Можно изменить свойства объектов с помощью записи через точку.

пример

opt = rlQAgentOptions(Name,Value) создает объект опций использование заданных пар "имя-значение", чтобы заменить значения свойств по умолчанию.

Примеры

свернуть все

Создайте объект опций агента Q-изучения

Создайте rlQAgentOptions объект, который задает шаг расчета агента.

opt = rlQAgentOptions('SampleTime',0.5)

opt = 

  rlQAgentOptions with properties:

    EpsilonGreedyExploration: [1×1 rl.option.EpsilonGreedyExploration]
                  SampleTime: 0.5000
              DiscountFactor: 0.9900

Можно изменить опции с помощью записи через точку. Например, установите коэффициент дисконтирования агента на 0.95.

opt.DiscountFactor = 0.95;

Входные параметры

свернуть все

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'DiscountFactor',0.95

`'EpsilonGreedyExploration'` — Опции для эпсилона жадное исследование
`EpsilonGreedyExploration` объект

Опции для эпсилона жадное исследование, заданное как разделенная запятой пара, состоящая из 'EpsilonGreedyExploration' и EpsilonGreedyExploration объект со следующими свойствами числового значения.

Свойство	Описание
`Epsilon`	Порог вероятности или к случайным образом выбирает действие или выбирает действие, которое максимизирует функцию значения акта государственной власти. Большее значение `Epsilon` средние значения, что агент случайным образом исследует пробел действия на более высоком уровне.
`EpsilonMin`	Минимальное значение `Epsilon`
`EpsilonDecay`	Уровень затухания

Epsilon обновляется с помощью следующей формулы, когда она больше EpsilonMin:

Epsilon = Epsilon*(1-EpsilonDecay)

Чтобы задать опции исследования, используйте запись через точку после создания rlQAgentOptions объект. Например, установите порог вероятности к 0.9.

opt = rlQAgentOptions;
opt.EpsilonGreedyExploration.Epsilon = 0.9;

`'SampleTime'` — Шаг расчета агента
1 (значение по умолчанию) | числовое значение

Шаг расчета агента, заданного как разделенная запятой пара, состоящая из 'SampleTime' и числовое значение.

`'DiscountFactor'` — Коэффициент дисконтирования применился к вознаграждениям
числовое значение

Коэффициент дисконтирования применился к будущим вознаграждениям во время обучения, заданного как разделенная запятой пара, состоящая из 'DiscountFactor' и положительное числовое значение, меньше чем или равное 1.

Выходные аргументы

свернуть все

`opt` — Опции агента Q-изучения
`rlQAgentOptions` объект

Опции агента Q-изучения, возвращенные как rlQAgentOptions объект. Свойства объектов описаны в Аргументах в виде пар имя-значение.

Смотрите также

rlQAgent

Темы

Агенты Q-изучения

Документация

rlQAgentOptions

Синтаксис

Описание

Примеры

Создайте объект опций агента Q-изучения

Входные параметры

Аргументы в виде пар имя-значение

`'EpsilonGreedyExploration'` — Опции для эпсилона жадное исследование
`EpsilonGreedyExploration` объект

`'SampleTime'` — Шаг расчета агента
1 (значение по умолчанию) | числовое значение

`'DiscountFactor'` — Коэффициент дисконтирования применился к вознаграждениям
числовое значение

Выходные аргументы

`opt` — Опции агента Q-изучения
`rlQAgentOptions` объект

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Документация

rlQAgentOptions

Синтаксис

Описание

Примеры

Создайте объект опций агента Q-изучения

Входные параметры

Аргументы в виде пар имя-значение

'EpsilonGreedyExploration' — Опции для эпсилона жадное исследование EpsilonGreedyExploration объект

'SampleTime' — Шаг расчета агента1 (значение по умолчанию) | числовое значение

'DiscountFactor' — Коэффициент дисконтирования применился к вознаграждениям числовое значение

Выходные аргументы

opt — Опции агента Q-изучения rlQAgentOptions объект

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

`'EpsilonGreedyExploration'` — Опции для эпсилона жадное исследование
`EpsilonGreedyExploration` объект

`'SampleTime'` — Шаг расчета агента
1 (значение по умолчанию) | числовое значение

`'DiscountFactor'` — Коэффициент дисконтирования применился к вознаграждениям
числовое значение

`opt` — Опции агента Q-изучения
`rlQAgentOptions` объект