Таблица Value или таблица Q
Можно составить таблицы значения и таблицы Q, чтобы представлять сети критика для изучения укрепления. Таблицы значения хранят вознаграждения за конечное множество наблюдений. Q таблицы хранят вознаграждения за соответствующие конечные пары действия наблюдения.
Чтобы создать представление функции значения с помощью объекта rlTable, используйте функцию rlRepresentation.
T = rlTable(obsinfo)T = rlTable(obsinfo,actinfo)rlRepresentation | Представление модели для агентов изучения укрепления |