Создайте отчет профиля выполнения для сгенерированного кода CUDA
gpucoder.profile(
генерирует отчет о профилировании выполнения кода CUDA, сгенерированного для файла проекта func_name
,codegen_inputs
)func_name
. The codegen_inputs
аргумент задает входы для файла проекта. Необходимо установить Embedded Coder® продукт для генерации отчета о профилировании.
Примечание
Рабочий процесс профилирования зависит от nvprof
инструмент от NVIDIA®. В CUDA® toolkit v10.1, NVIDIA ограничивает доступ к счетчикам эффективности пользователям admin. Чтобы включить счетчики эффективности графический процессор для всех учетных записей пользователей, смотрите инструкции в https://developer.nvidia.com/nvidia-development-tools-solutions-ERR_NVGPUCTRPERM-permission-issue-performance-counters.
gpucoder.profile(___,
генерирует отчет о профилировании выполнения с одной или несколькими опциями профилирования, заданными в качестве аргумента пары "имя-значение".Name,Value
)