Таблица Value или таблица Q
Можно составить таблицы значения и таблицы Q, чтобы представлять сети критика для изучения укрепления. Таблицы значения хранят вознаграждения за конечное множество наблюдений. Q таблицы хранят вознаграждения за соответствующие конечные пары действия наблюдения.
Чтобы создать представление функции значения с помощью объекта rlTable
, используйте функцию rlRepresentation
.
T = rlTable(obsinfo)
T = rlTable(obsinfo,actinfo)
rlRepresentation | Представление модели для агентов изучения укрепления |