rlQAgentOptions

Создайте опции для агента Q-изучения

Синтаксис

opt = rlQAgentOptions
opt = rlQAgentOptions(Name,Value)

Описание

opt = rlQAgentOptions создает объект rlQAgentOptions для использования в качестве аргумента при создании агента Q-изучения с помощью всех настроек по умолчанию. Можно изменить свойства объектов с помощью записи через точку.

пример

opt = rlQAgentOptions(Name,Value) создает объект опций использование заданных пар "имя-значение", чтобы заменить значения свойств по умолчанию.

Примеры

свернуть все

Создайте объект rlQAgentOptions, который задает шаг расчета агента.

opt = rlQAgentOptions('SampleTime',0.5)
opt = 

  rlQAgentOptions with properties:

    EpsilonGreedyExploration: [1×1 rl.option.EpsilonGreedyExploration]
                  SampleTime: 0.5000
              DiscountFactor: 0.9900

Можно изменить опции с помощью записи через точку. Например, установите коэффициент дисконтирования агента на 0.95.

opt.DiscountFactor = 0.95;

Входные параметры

свернуть все

Аргументы в виде пар имя-значение

Укажите необязательные аргументы в виде пар ""имя, значение"", разделенных запятыми. Имя (Name) — это имя аргумента, а значение (Value) — соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: 'DiscountFactor',0.95

Опции для эпсилона жадное исследование, заданное как пара, разделенная запятой, состоящая из 'EpsilonGreedyExploration' и объекта EpsilonGreedyExploration со следующими свойствами числового значения.

СвойствоОписание
EpsilonПорог вероятности или к случайным образом выбирает действие или выбирает действие, которое максимизирует функцию значения акта государственной власти. Большее значение Epsilon означает, что агент случайным образом исследует пробел действия на более высоком уровне.
EpsilonMinМинимальное значение Epsilon
EpsilonDecayУровень затухания

Epsilon обновляется с помощью следующей формулы, когда это больше, чем EpsilonMin:

Epsilon = Epsilon*(1-EpsilonDecay)

Чтобы задать опции исследования, используйте запись через точку после создания объекта rlQAgentOptions. Например, установите порог вероятности к 0.9.

opt = rlQAgentOptions;
opt.EpsilonGreedyExploration.Epsilon = 0.9;

Шаг расчета агента, заданного как пара, разделенная запятой, состоящая из 'SampleTime' и числового значения.

Коэффициент дисконтирования применился к будущим вознаграждениям во время обучения, заданного как пара, разделенная запятой, состоящая из 'DiscountFactor' и положительного числового значения, меньше чем или равного 1.

Выходные аргументы

свернуть все

Опции агента Q-изучения, возвращенные как объект rlQAgentOptions. Свойства объектов описаны в Аргументах в виде пар имя-значение.

Смотрите также

Введенный в R2019a

Для просмотра документации необходимо авторизоваться на сайте