После обучения агента обучения усилению можно создать код для развертывания оптимальной политики. Например, используя MATLAB ® Coder™ и GPU Coder™, можно создать код C++ или CUDA и развернуть политики нейронной сети на встраиваемых платформах.
generatePolicyFunction | Создание функции, оценивающей обученную политику усиления агента обучения |
Развертывание обучающих политик для обученного усиления
Можно создать код для агентов обучения усилению с помощью, например, кодера графического процессора или кодера MATLAB.