Создайте отчет профиля выполнения для сгенерированного кода CUDA
gpucoder.profile(
генерирует выполнение профильный отчет кода CUDA, сгенерированного для файла проекта FUNCNAME
,CODEGENINPUTS
)FUNCNAME
. CODEGENINPUTS
задает входные параметры к файлу проекта. Продукт Embedded Coder® должен быть установлен, чтобы сгенерировать профильный отчет. Профилирование только поддержано на платформе Linux®.
Профильный рабочий процесс зависит от nvprof
инструмент от NVIDIA®. В инструментарии CUDA® v10.1, NVIDIA ограничивает доступ к счетчикам производительности только пользователям администратора. Чтобы позволить счетчикам производительности графического процессора использоваться всеми пользователями, см. инструкции, предоставленные в https://developer.nvidia.com/nvidia-development-tools-solutions-ERR_NVGPUCTRPERM-permission-issue-performance-counters.
gpucoder.profile(___,
генерирует отчет профилирования выполнения с одной или несколькими профильными опциями, заданными как Пара "имя-значение"Name,Value
)