gpucoder.profile

Создайте отчет профиля выполнения для сгенерированного кода CUDA

Описание

gpucoder.profile(FUNCNAME,CODEGENINPUTS) генерирует выполнение профильный отчет кода CUDA, сгенерированного для файла проекта FUNCNAME. CODEGENINPUTS задает входные параметры к файлу проекта. Продукт Embedded Coder® должен быть установлен, чтобы сгенерировать профильный отчет. Профилирование только поддержано на платформе Linux®.

Примечание

Профильный рабочий процесс зависит от nvprof инструмент от NVIDIA®. В инструментарии CUDA® v10.1, NVIDIA ограничивает доступ к счетчикам производительности только пользователям администратора. Чтобы позволить счетчикам производительности графического процессора использоваться всеми пользователями, см. инструкции, предоставленные в https://developer.nvidia.com/nvidia-development-tools-solutions-ERR_NVGPUCTRPERM-permission-issue-performance-counters.

gpucoder.profile(___,Name,Value) генерирует отчет профилирования выполнения с одной или несколькими профильными опциями, заданными как Пара "имя-значение"

Входные параметры

свернуть все

Имя функции точки входа или файла проекта.

Пример: gpucoder.profile('xdot',{1000,rand(1000,1),1,1,rand(1000,1),1,1})

Время компиляции вводит к функции точки входа или файлу проекта.

Пример: gpucoder.profile('xdot',{1000,rand(1000,1),1,1,rand(1000,1),1,1})

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: gpucoder.profile('xdot', {1000,rand(1000,1),1,1,rand(1000,1),1,1},'NumCalls',2,'CodegenConfig',cfg,'CodegenArguments','-d discrete','Threshold',0.01)

Задайте число раз, профилируемый раздел кода запущен. Значение по умолчанию равняется 6. Первый показ исключен из отчета, поскольку это обычно - выброс.

Укажите, что объект настройки генерации кода раньше генерировал код CUDA и профиль для. coder.EmbeddedCodeConfig по умолчанию объект используется, когда это значение не задано.

Задайте любой дополнительный codegen аргументы как строка. Значением по умолчанию является NULL (пустая строка).

Используйте пороговое значение, чтобы управлять вызовами графического процессора, которые отображены в отчете. Если максимальным временем выполнения от выполнения является x секунды, программное обеспечение сообщает обо всех вызовах графического процессора, которые превышают x * threshold.

Введенный в R2018b