Создайте отчет профиля выполнения для сгенерированного кода CUDA
gpucoder.profile( генерирует отчет о профилировании выполнения кода CUDA, сгенерированного для файла проекта func_name,codegen_inputs)func_name. The codegen_inputs аргумент задает входы для файла проекта. Необходимо установить Embedded Coder® продукт для генерации отчета о профилировании.
Примечание
Рабочий процесс профилирования зависит от nvprof инструмент от NVIDIA®. В CUDA® toolkit v10.1, NVIDIA ограничивает доступ к счетчикам эффективности пользователям admin. Чтобы включить счетчики эффективности графический процессор для всех учетных записей пользователей, смотрите инструкции в https://developer.nvidia.com/nvidia-development-tools-solutions-ERR_NVGPUCTRPERM-permission-issue-performance-counters.
gpucoder.profile(___, генерирует отчет о профилировании выполнения с одной или несколькими опциями профилирования, заданными в качестве аргумента пары "имя-значение".Name,Value)