Анализ узких мест памяти

Выравнивание данных

Состояние

MATLAB является основным столбцом, но алгоритм может быть реализован для оптимизированной реализации основного строки. Если в сгенерированном коде наиболее быстро изменяющееся измерение не является самым внутренним циклом, то память не объединяется. Часто транспонирование входных матриц может просто решить эту проблему.

Действие

Попробуйте перенести данные.

Небольшие размеры данных

Состояние

Если размер проблемы/данных слишком мал, то издержки, связанные с перемещением данных в графический процессор (даже если они находятся только на границе ввода-вывода), могут компенсировать любой прирост производительности работы на графическом процессоре.

Действие

Попробуйте использовать алгоритм с большими размерами данных.

Слишком много cudaMemcpys

Состояние

Если используется только coder.gpu.kernelзатем все, что находится вне цикла, поступает на ЦП. Для сохранения большей части кода на GPU рекомендуется использовать обе прагматики. Кроме того, наличие неподдерживаемых функций или любой функции/оператора, которые не могут выполняться на GPU, приводит к большему cudaMemcpys генерируется.

Действие

Использовать coder.gpu.kernelfun в дополнение к coder.gpu.kernel

Постоянные входы

Использование памяти стека

Связанные темы

Документация по кодеру GPU

Поддержка

Памятка переводчика

1. Если смысл перевода понятен, то лучше оставьте как есть и не придирайтесь к словам, синонимам и тому подобному. О вкусах не спорим.

2. Не дополняйте перевод комментариями “от себя”. В исправлении не должно появляться дополнительных смыслов и комментариев, отсутствующих в оригинале. Такие правки не получится интегрировать в алгоритме автоматического перевода.

3. Сохраняйте структуру оригинального текста - например, не разбивайте одно предложение на два.

4. Не имеет смысла однотипное исправление перевода какого-то термина во всех предложениях. Исправляйте только в одном месте. Когда Вашу правку одобрят, это исправление будет алгоритмически распространено и на другие части документации.

5. По иным вопросам, например если надо исправить заблокированное для перевода слово, обратитесь к редакторам через форму технической поддержки.

Документация