rlTable

Таблица Value или Q-таблица

Описание

Можно составить таблицы значения и Q-таблицы, чтобы представлять сети критика для обучения с подкреплением. Таблицы значения хранят вознаграждения за конечное множество наблюдений. Q-таблицы хранят вознаграждения за соответствующие конечные пары действия наблюдения.

Создать представление функции значения с помощью rlTable объект, используйте rlRepresentation функция.

Создание

Описание

T = rlTable(obsinfo) составляет таблицу значения для данных дискретных наблюдений.

T = rlTable(obsinfo,actinfo) создает Q-таблицу для данных дискретных наблюдений и действий.

Входные параметры

развернуть все

Спецификация наблюдения, заданная как rlFiniteSetSpec объект.

Спецификация действия, заданная как rlFiniteSetSpec объект.

Свойства

развернуть все

Вознаградите таблицу, возвращенную как массив. Когда Table isa:

  • Таблица Value, это содержит строки NO, где NO является количеством конечных значений наблюдения.

  • Q-таблица, это содержит строки NO и столбцы NA, где NA является количеством возможных конечных действий.

Функции объекта

rlRepresentationПредставление модели для агентов обучения с подкреплением

Введенный в R2019a