Создание ядра из кода MATLAB

Структуры кода MATLAB и шаблоны, которые создают CUDA^® Ядра графического процессора

GPU Coder™ генерирует и выполняет оптимизированные ядра CUDA для определенных структур алгоритма и шаблонов в вашем MATLAB^® код. Вызовы сгенерированного кода оптимизировали NVIDIA^® Библиотеки CUDA, включая cuFFT, cuSolver, cuBLAS, cuDNN, и TensorRT. Сгенерированный код может быть интегрирован в ваш проект как исходный код, статические библиотеки или динамические библиотеки, и может быть скомпилирован для рабочих столов, серверов и графических процессоров, встроенных в NVIDIA Джетсон, ДИСК и другие платформы. GPU Coder позволяет вам включить рукописный код CUDA в свои алгоритмы и в сгенерированный код.

Приложения

развернуть все

GPU Coder

GPU Coder	Сгенерируйте код графического процессора из кода MATLAB
GPU Environment Check	Проверьте и настройте среду генерации кода графического процессора

Функции

развернуть все

Генерация кода

`codegen`	Сгенерируйте код C/C++ из кода MATLAB
`gpucoder`	Открытое приложение GPU Coder
`coder.checkGpuInstall`	Проверьте среду генерации кода графического процессора
`coder.gpuConfig`	Параметры конфигурации для генерации кода CUDA из кода MATLAB при помощи GPU Coder

Прагмы ядра графического процессора

`coder.gpu.kernel`	Прагма, которая сопоставляет `for`- циклы к ядрам графического процессора
`coder.gpu.kernelfun`	Прагма, которая сопоставляет функцию с ядрами графического процессора
`coder.gpu.nokernel`	Прагма, чтобы отключить циклы for создания ядра
`coder.ceval`	Вызовите внешнюю функцию C/C++
`coder.gpu.iterations`	Прагма, которая предоставляет информацию генератору кода для того, чтобы принять решения распараллеливания о переменной, связала циклы

Прагмы памяти графического процессора

`coder.gpu.constantMemory`	Прагма, которая сопоставляет переменную с постоянной памятью на графическом процессоре
`coder.gpu.persistentMemory`	Прагма, чтобы выделить переменную как постоянную память на графическом процессоре

Графический процессор атомарные операции

`gpucoder.atomicAdd`	Атомарно добавьте заданное значение в переменную в глобальной памяти или общей памяти
`gpucoder.atomicAnd`	Атомарно выполните побитовое И между заданным значением и переменной в глобальной памяти или общей памяти
`gpucoder.atomicCAS`	Атомарно сравните и подкачайте значение переменной в глобальной памяти или общей памяти
`gpucoder.atomicDec`	Атомарно постепенно уменьшите переменную в глобальной памяти или общей памяти в заданной верхней границе
`gpucoder.atomicExch`	Атомарно обменивайтесь переменной в глобальной памяти или общей памяти с заданным значением
`gpucoder.atomicInc`	Атомарно постепенно увеличьте переменную в глобальной памяти или общей памяти в заданной верхней границе
`gpucoder.atomicMax`	Атомарно найдите максимум между заданным значением и переменной в глобальной памяти или общей памяти
`gpucoder.atomicMin`	Атомарно найдите минимум между заданным значением и переменной в глобальной памяти или общей памяти
`gpucoder.atomicOr`	Атомарно выполните побитовое ИЛИ между заданным значением и переменной в глобальной памяти или общей памяти
`gpucoder.atomicSub`	Атомарно вычтите заданное значение из переменной в глобальной памяти или общей памяти
`gpucoder.atomicXor`	Атомарно выполните побитовое исключающее ИЛИ между заданным значением и переменной в глобальной памяти или общей памяти

Программирование для генерации кода

`gpucoder.stencilKernel`	Создайте код CUDA для функций шаблона
`gpucoder.matrixMatrixKernel`	Оптимизированная реализация графического процессора функций, содержащих матричные операции над матрицей
`gpucoder.batchedMatrixMultiply`	Оптимизированная реализация графического процессора пакетных умножение матриц операция
`gpucoder.stridedMatrixMultiply`	Оптимизированная реализация графического процессора strided и обработанный в пакетном режиме умножение матриц операция
`gpucoder.batchedMatrixMultiplyAdd`	Оптимизированная реализация графического процессора пакетных умножение матриц с, добавляет операция
`gpucoder.stridedMatrixMultiplyAdd`	Оптимизированная реализация графического процессора strided, обработанного в пакетном режиме, умножение матриц с, добавляет операция
`gpucoder.sort`	Оптимизированная реализация графического процессора функции вида MATLAB
`gpucoder.transpose`	Оптимизированная реализация графического процессора MATLAB транспонирует функцию
`gpucoder.reduce`	Оптимизированная реализация графического процессора для операций сокращения

Объекты

развернуть все

Настройка кода

`coder.gpuConfig`	Параметры конфигурации для генерации кода CUDA из кода MATLAB при помощи GPU Coder
`coder.CodeConfig`	Параметры конфигурации для генерации кода C/C++ из кода MATLAB
`coder.EmbeddedCodeConfig`	Параметры конфигурации для генерации кода C/C++ из кода MATLAB с Embedded Coder
`coder.gpuEnvConfig`	Создайте объект настройки, содержащий параметры, переданные `coder.checkGpuInstall` для того, чтобы выполнить проверки среды генерации кода графического процессора

Темы

Ядра от поэлементных циклов

Создайте ядра из функций MATLAB, содержащих scalarized, поэлементных математических операций.

Ядра от рассеяния - собирают операции типа

Создайте ядра из функций MATLAB, содержащих операции сокращения.

Ядра от вызовов библиотеки

Предназначайтесь для оптимизированных математических библиотек графического процессора, таких как cuBLAS, cuSOLVER, cuFFT, и Тяга.

Поддержка массивов графического процессора

Сгенерируйте код CUDA, который использует массивы графического процессора.

Интегрирование унаследованного кода

Интегрируйте пользовательский код графического процессора с кодом MATLAB, предназначенным для генерации кода.

Шаблоны разработки

Создайте ядра для функций MATLAB, содержащих вычислительные шаблоны разработки.

Выделение памяти графического процессора и минимизация

Опции выделения памяти и оптимизация для GPU Coder.

Что такое Половина Точности?

Введение в тип данных полуточности в MATLAB и Simulink^®.

Половина поддержки генерации кода точности

C/C++ и генерация кода графического процессора поддерживают для функций ту полуточность поддержки входные параметры.

Рекомендуемые примеры

$Simulate Diffraction Patterns Using CUDA FFT Libraries$

Симулируйте дифракционные шаблоны Используя библиотеки БПФ CUDA

Используйте GPU Coder™, чтобы усилить библиотеку CUDA® Fast Fourier Transform (cuFFT), чтобы вычислить двумерный БПФ на графическом процессоре NVIDIA®. Двумерное преобразование Фурье используется в оптике, чтобы вычислить шаблоны дифракции далекого поля. Когда монохроматический источник света проходит через маленькую апертуру, такой как в эксперименте двойного разреза Янга, можно наблюдать эти дифракционные шаблоны. Этот пример также показывает вам, как использовать указатели графического процессора в качестве входных параметров к функции точки входа при генерации MEX CUDA, исходного кода, статических библиотек, динамических библиотек и исполняемых файлов. При помощи этой функциональности производительность сгенерированного кода улучшается путем минимизации количества вызовов cudaMemcpy в сгенерированном коде.

Открыть скрипт

QR Decomposition on NVIDIA GPU Using cuSOLVER Libraries

Разложение QR на NVIDIA графический процессор Используя cuSOLVER Библиотеки

Создайте автономный исполняемый файл CUDA®, который усиливает библиотеку CUDA Solver (cuSOLVER). Пример использует приложение аппроксимирования кривыми, которое подражает автоматическому отслеживанию маршрута на дороге, чтобы проиллюстрировать:

Скрипт Open Live Script

Получите обработку с помощью шаблона на графическом процессоре

Сгенерируйте ядра CUDA® для операций типа шаблона путем реализации "Игры Жизни" Джоном Х. Конуэем.

Открыть скрипт

$Benchmark A\b by Using GPU Coder$

Протестируйте A\b в сравнении с эталоном при помощи GPU Coder

Сравнительный тест решая линейную систему путем генерации кода графического процессора. Используйте матричное левое деление, также известное как mldivide или оператор обратной косой черты (\), чтобы решить систему линейных уравнений A*x = b для x (то есть, вычислите x = A\b).

Открыть скрипт

Вуалируйте исправление

Использование функций обработки изображений для генерации кода графического процессора. Пример берет туманное изображение, как введено и производит изображение defogged. Этим примером является типичная реализация алгоритма исправления вуали. Пример использует conv2, im2gray, и функции imhist.

Скрипт Open Live Script

Несоизмеримость стерео

Сгенерируйте MEX-функцию CUDA® от функции MATLAB®, которая вычисляет несоизмеримость стерео двух изображений.

Скрипт Open Live Script

Документация

Создание ядра из кода MATLAB

Приложения

GPU Coder

Функции

Генерация кода

Прагмы ядра графического процессора

Прагмы памяти графического процессора

Графический процессор атомарные операции

Программирование для генерации кода

Объекты

Настройка кода

Темы

Рекомендуемые примеры

Симулируйте дифракционные шаблоны Используя библиотеки БПФ CUDA

Разложение QR на NVIDIA графический процессор Используя cuSOLVER Библиотеки

Получите обработку с помощью шаблона на графическом процессоре

Протестируйте A\b в сравнении с эталоном при помощи GPU Coder

Вуалируйте исправление

Несоизмеримость стерео

Документация GPU Coder

Поддержка