newRep = setLearnableParameterValues(oldRep,val) возвращает новую политику или представление функции значения, newRep, с той же структурой как исходное представление, oldRep, и learnable значения параметров заданы в val.
Получите существующее представление функции значения от агента с помощью getCritic
Получите существующее представление политики от агента с помощью getActor.
val — Значения параметров Learnable cellArray
Значения параметров Learnable для объекта представления, заданного как массив ячеек. Параметры в val должно быть совместимо со структурой и параметризацией oldRep.
Чтобы получить массив ячеек learnable значений параметров от существующего представления, которое можно затем изменить, используют getLearnableParameterValues функция.
newRep — Новая политика или представление функции значения rlLayerRepresentation возразите | rlTableRepresentation объект
Новая политика или представление функции значения, возвращенное как объект представления того же типа как oldRep. newRep имеет ту же структуру как oldRep но со значениями параметров от val.
1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.
2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.
3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.
4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.
5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.