Задайте максимальное количество CUDA® блоки, созданные во время запуска ядра.
Поскольку графические процессоры имеют ограниченные потоковые многопроцессорные (SM) ресурсы, ограничение количества блоков для каждого ядра может избежать падения эффективности от планирования, загрузки и выгрузки блоков.
Если количество итераций в цикле больше максимального количества блоков на ядро, генератор кода создает ядра CUDA с переходом.
Когда вы задаете максимальное количество блоков для каждого ядра, генератор кода создает 1-D ядра. Чтобы заставить генератор кода создать 2-D или 3-D ядра, используйте coder.gpu.kernel
(GPU Coder) прагма. The coder.gpu.kernel
pragma имеет приоритет над максимальным количеством ядер для каждого блока CUDA.
Category: Генерации кода > Код графического процессора
По умолчанию: 0
Задайте максимальное количество блоков CUDA, созданных во время запуска ядра.
Для этого параметра требуется лицензия GPU Coder™.
Чтобы включить этот параметр, выберите Generate GPU code на панели Code Generation.
Параметр: GPUMaximumBlocksPerKernel |
Тип: целое число |
Значение: любое допустимое значение |
По умолчанию:
0
|