Задайте максимальное количество блоков CUDA®, созданных во время запуска ядра.
Поскольку устройства графического процессора ограничили ресурсы потоковой передачи многопроцессорной системы (SM), ограничивание количества блоков для каждого ядра может избежать потерь эффективности от планирования, загрузки и разгрузки блоков.
Если количество итераций в цикле больше максимального количества блоков на ядро, генератор кода создает ядра CUDA с ходьбой.
Когда вы задаете максимальное количество блоков для каждого ядра, генератор кода создает 1D ядра. Чтобы обеспечить генератор кода, чтобы создать 2D или 3-D ядра, используйте coder.gpu.kernel
(GPU Coder) прагма. coder.gpu.kernel
прагма более приоритетна по сравнению с максимальным количеством ядер для каждого блока CUDA.
Генерация кода Category:> Код графического процессора
Значение по умолчанию: 0
Задайте максимальное количество блоков CUDA, созданных во время запуска ядра.
Этот параметр требует лицензии GPU Coder™.
Чтобы включить этот параметр, выберите Generate GPU code на панели Code Generation.
Параметр: GPUMaximumBlocksPerKernel |
Ввод: целое число |
Значение: любое допустимое значение |
Значение по умолчанию:
0 |