rlTable

Таблица Value или таблица Q

Описание

Можно составить таблицы значения и таблицы Q, чтобы представлять сети критика для изучения укрепления. Таблицы значения хранят вознаграждения за конечное множество наблюдений. Q таблицы хранят вознаграждения за соответствующие конечные пары действия наблюдения.

Чтобы создать представление функции значения с помощью объекта rlTable, используйте функцию rlRepresentation.

Создание

Синтаксис

T = rlTable(obsinfo)
T = rlTable(obsinfo,actinfo)

Описание

T = rlTable(obsinfo) составляет таблицу значения для данных дискретных наблюдений.

T = rlTable(obsinfo,actinfo) составляет таблицу Q для данных дискретных наблюдений и действий.

Входные параметры

развернуть все

Спецификация наблюдения, заданная как объект rlFiniteSetSpec.

Спецификация действия, заданная как объект rlFiniteSetSpec.

Свойства

развернуть все

Вознаградите таблицу, возвращенную как массив. Когда Table является a:

  • Таблица Value, это содержит строки NO, где NO является количеством конечных значений наблюдения.

  • Таблица Q, это содержит строки NO и столбцы NA, где NA является количеством возможных конечных действий.

Функции объекта

rlRepresentationПредставление модели для агентов изучения укрепления

Введенный в R2019a

Для просмотра документации необходимо авторизоваться на сайте