Создание отчета профиля выполнения для созданного кода CUDA
gpucoder.profile( создает отчет о профилировании выполнения кода CUDA, созданного для файла конструкции func_name,codegen_inputs)func_name. codegen_inputs аргумент задает входные данные для файла конструкции. Для создания отчета о профилировании необходимо установить продукт Embedded Coder ®.
Примечание
Поток операций профилирования зависит от nvprof от NVIDIA ®. В CUDA ® toolkit v10.1 NVIDIA ограничивает доступ к счетчикам производительности пользователей-администраторов. Чтобы включить счетчики производительности графического процессора для всех учетных записей пользователей, см. инструкции в https://developer.nvidia.com/nvidia-development-tools-solutions-ERR_NVGPUCTRPERM-permission-issue-performance-counters.
gpucoder.profile(___, создает отчет о профилировании выполнения с одним или несколькими параметрами профилирования, заданными в качестве аргумента пары имя-значение.Name,Value)