rlTable

Таблица Value или Q-таблица

Описание

Можно составить таблицы значения и Q-таблицы, чтобы представлять сети критика для обучения с подкреплением. Таблицы значения хранят вознаграждения за конечное множество наблюдений. Q-таблицы хранят вознаграждения за соответствующие конечные пары действия наблюдения.

Создать представление функции значения с помощью rlTable объект, используйте rlRepresentation функция.

Создание

Синтаксис

T = rlTable(obsinfo)

T = rlTable(obsinfo,actinfo)

Описание

T = rlTable(obsinfo) составляет таблицу значения для данных дискретных наблюдений.

T = rlTable(obsinfo,actinfo) создает Q-таблицу для данных дискретных наблюдений и действий.

Входные параметры

развернуть все

`obsinfo` — Спецификация наблюдения
`rlFiniteSetSpec` объект

Спецификация наблюдения, заданная как rlFiniteSetSpec объект.

`actinfo` — Спецификация действия
`rlFiniteSetSpec` объект

Спецификация действия, заданная как rlFiniteSetSpec объект.

Свойства

развернуть все

`Table` — Таблица Reward
массив

Вознаградите таблицу, возвращенную как массив. Когда Table isa:

Таблица Value, это содержит строки _NO, где _NO является количеством конечных значений наблюдения.
Q-таблица, это содержит строки _NO и столбцы _NA, где _NA является количеством возможных конечных действий.

Функции объекта

rlRepresentation Представление модели для агентов обучения с подкреплением

Смотрите также

Темы

Создайте политику и представления функции значения

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.

Документация

rlTable

Описание

Создание

Синтаксис

Описание

Входные параметры

obsinfo — Спецификация наблюдения rlFiniteSetSpec объект

actinfo — Спецификация действия rlFiniteSetSpec объект

Свойства

Table — Таблица Reward массив

Функции объекта

Смотрите также

Темы

Введенный в R2019a

Документация Reinforcement Learning Toolbox

Поддержка

`obsinfo` — Спецификация наблюдения
`rlFiniteSetSpec` объект

`actinfo` — Спецификация действия
`rlFiniteSetSpec` объект

`Table` — Таблица Reward
массив