rlQAgentOptions

Создайте опции для агента Q-изучения

Описание

opt = rlQAgentOptions создает rlQAgentOptions объект для использования в качестве аргумента при создании агента Q-изучения с помощью всех настроек по умолчанию. Можно изменить свойства объектов с помощью записи через точку.

пример

opt = rlQAgentOptions(Name,Value) создает объект опций использование заданных пар "имя-значение", чтобы заменить значения свойств по умолчанию.

Примеры

свернуть все

Создайте rlQAgentOptions объект, который задает шаг расчета агента.

opt = rlQAgentOptions('SampleTime',0.5)
opt = 

  rlQAgentOptions with properties:

    EpsilonGreedyExploration: [1×1 rl.option.EpsilonGreedyExploration]
                  SampleTime: 0.5000
              DiscountFactor: 0.9900

Можно изменить опции с помощью записи через точку. Например, установите коэффициент дисконтирования агента на 0.95.

opt.DiscountFactor = 0.95;

Входные параметры

свернуть все

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'DiscountFactor',0.95

Опции для эпсилона жадное исследование, заданное как разделенная запятой пара, состоящая из 'EpsilonGreedyExploration' и EpsilonGreedyExploration объект со следующими свойствами числового значения.

СвойствоОписание
EpsilonПорог вероятности или к случайным образом выбирает действие или выбирает действие, которое максимизирует функцию значения акта государственной власти. Большее значение Epsilon средние значения, что агент случайным образом исследует пробел действия на более высоком уровне.
EpsilonMinМинимальное значение Epsilon
EpsilonDecayУровень затухания

Epsilon обновляется с помощью следующей формулы, когда она больше EpsilonMin:

Epsilon = Epsilon*(1-EpsilonDecay)

Чтобы задать опции исследования, используйте запись через точку после создания rlQAgentOptions объект. Например, установите порог вероятности к 0.9.

opt = rlQAgentOptions;
opt.EpsilonGreedyExploration.Epsilon = 0.9;

Шаг расчета агента, заданного как разделенная запятой пара, состоящая из 'SampleTime' и числовое значение.

Коэффициент дисконтирования применился к будущим вознаграждениям во время обучения, заданного как разделенная запятой пара, состоящая из 'DiscountFactor' и положительное числовое значение, меньше чем или равное 1.

Выходные аргументы

свернуть все

Опции агента Q-изучения, возвращенные как rlQAgentOptions объект. Свойства объектов описаны в Аргументах в виде пар имя-значение.

Смотрите также

Введенный в R2019a