Создайте отчет профиля выполнения для сгенерированного кода CUDA
gpucoder.profile(
генерирует выполнение профильный отчет кода CUDA, сгенерированного для файла проекта func_name
,codegen_inputs
)func_name
. codegen_inputs
аргумент задает входные параметры к файлу проекта. Необходимо установить продукт Embedded Coder®, чтобы сгенерировать профильный отчет.
Примечание
Профильный рабочий процесс зависит от nvprof
инструмент от NVIDIA®. В инструментарии CUDA® v10.1, NVIDIA ограничивает доступ к счетчикам производительности пользователям администратора. Чтобы включить счетчики производительности графического процессора для всех учетных записей пользователей, см. инструкции в https://developer.nvidia.com/nvidia-development-tools-solutions-ERR_NVGPUCTRPERM-permission-issue-performance-counters.
gpucoder.profile(___,
генерирует отчет профилирования выполнения с одной или несколькими профильными опциями, заданными как аргумент пары "имя-значение".Name,Value
)