Анализ узких мест в памяти

Выравнивание данных

Состояние

MATLAB является основным столбцом, но алгоритм может быть реализован для оптимизированной реализации основной строки. В сгенерированном коде, если ваша самая быстрая изменяющаяся размерность не является самым внутренним циклом, то память не объединяется. Часто транспонирование входа матриц может просто исправить эту проблему.

Действие

Попробуйте транспонировать данные.

Малые размеры данных

Состояние

Если ваша задача/размер данных слишком мал, то накладные расходы на перемещение данных в графический процессор (даже если он находится просто на контуре ввода-вывода) могут компенсировать любое увеличение эффективности при запуске на графическом процессоре.

Действие

Попробуйте алгоритм с большими размерами данных.

Слишком много cudaMemcpys

Состояние

Если вы используете только coder.gpu.kernel, затем все за пределами цикла переходит к центральный процессор. Чтобы попытаться сохранить большую часть кода на графическом процессоре, рекомендуется использовать обе прагмы. Кроме того, наличие неподдерживаемых функций или любой функции/оператора, который не может запускаться на графическом процессоре, вызывает больше cudaMemcpys будет сгенерирован.

Действие

Использовать coder.gpu.kernelfun в дополнение к coder.gpu.kernel

Постоянные входы

Использование стековой памяти

Документация по GPU Coder

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.

Документация