Таблица значений или таблица Q
Таблицы значений и таблицы Q являются одним из способов представления критических сетей для обучения усилению. В таблицах значений хранятся вознаграждения за ограниченный набор наблюдений. В таблицах Q хранятся вознаграждения для соответствующих пар конечное наблюдение-действие.
Создание представления функции значения с помощью rlTable объект, используйте rlValueRepresentation или rlQValueRepresentation объект.
rlValueRepresentation | Критическое представление функции оценки для агентов обучения по усилению |
rlQValueRepresentation | Критическое представление функции Q-Value для агентов обучения усиления |