Создайте отчет профиля выполнения для сгенерированного кода CUDA
gpucoder.profile( генерирует выполнение профильный отчет кода CUDA, сгенерированного для файла проекта func_name,codegen_inputs)func_name. codegen_inputs аргумент задает входные параметры к файлу проекта. Необходимо установить Embedded Coder® продукт, чтобы сгенерировать профильный отчет.
Примечание
Профильный рабочий процесс зависит от nvprof инструмент от NVIDIA®. В CUDA® инструментарий v10.1, NVIDIA ограничивает доступ к счетчикам производительности пользователям администратора. Чтобы включить счетчики производительности графического процессора для всех учетных записей пользователей, см. инструкции в https://developer.nvidia.com/ERR_NVGPUCTRPERM (NVIDIA).
gpucoder.profile(___, генерирует отчет профилирования выполнения с одной или несколькими профильными опциями, заданными как аргумент пары "имя-значение".Name,Value)