Производительность

Диагностируйте проблемы генерации кода, улучшите время выполнения кода и уменьшайте использование памяти сгенерированного кода

Три из наиболее распространенных причин, почему сгенерированный код GPU Coder™ не выполняет как ожидалось:

Ядра CUDA^® не создаются.
Разместите к устройству, и устройство к передачам памяти хоста (cudaMemcpy) регулируют производительность.
Недостаточно параллелизма или проблем устройств.

Этот раздел уточняет частые причины для этих признаков и описывает, как использовать встроенного сотрудника досмотра, чтобы обнаружить эти проблемы. Это также предоставляет информацию о том, как работать вокруг на эти проблемы и сгенерировать более эффективный код CUDA.

Темы

Рабочий процесс

Рабочий процесс поиска и устранения неисправностей GPU Coder.

Проследите между кодом MATLAB и сгенерированным кодом CUDA

Подсветите разделы кода MATLAB, который работает на графическом процессоре

Анализ ядра

Рекомендации для генерации эффективных ядер CUDA.

Анализ узкого места памяти

Уменьшайте проблемы узкого места памяти при использовании GPU Coder.

Анализируйте профили выполнения сгенерированного кода

Мелкомодульное профилирование для данного алгоритма MATLAB и его сгенерированного кода CUDA через SIL.

Анализ с профилировщиком NVIDIA

Улучшайте производительность с помощью информации, полученной от Профилировщика NVIDIA (nvvp).

Ограничения GPU Coder

Смотрите текущие ограничения GPU Coder.

Популярные примеры

GPU Execution Profiling of the Generated Code

Профилирование выполнения графического процессора сгенерированного кода

Сгенерируйте отчет профилирования выполнения для сгенерированного кода CUDA® при помощи функции gpucoder.profile. Исправление вуали используется в качестве примера, чтобы продемонстрировать эту концепцию.

Открыть скрипт

Документация GPU Coder

Поддержка

Сообщество Экспонента

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.