coder.gpuConfig

Параметры конфигурации для генерации кода CUDA из кода MATLAB с GPU Coder

Описание

coder.gpuConfig объект содержит параметры конфигурации что codegen использование для генерации CUDA^® MEX, статической библиотеки, динамически подключаемой библиотеки или исполняемой программы с GPU Coder™. Передайте объект codegen функция при помощи -config опция.

Создание

Синтаксис

cfg = coder.gpuConfig(build_type)

cfg = coder.gpuConfig(build_type,'ecoder',false)

cfg = coder.gpuConfig(build_type,'ecoder',true)

Описание

пример

cfg = coder.gpuConfig(build_type) создает объект настройки генерации кода для заданного типа сборки, который может быть MEX CUDA, статической библиотекой, динамически подключаемой библиотекой или исполняемой программой. Если продукт Embedded Coder^® установлен, он создает coder.EmbeddedCodeConfig объект для статической библиотеки, динамической библиотеки или исполняемого файла создает типы.

cfg = coder.gpuConfig(build_type,'ecoder',false) создает объект настройки генерации кода сгенерировать 'lib' CUDA, 'dll', или 'exe' выведите, даже если продукт Embedded Coder установлен.

cfg = coder.gpuConfig(build_type,'ecoder',true) создает coder.EmbeddedCodeConfig объект настройки, даже если продукт Embedded Coder не установлен. Однако генерация кода, использующая coder.EmbeddedCodeConfig объект требует лицензии Embedded Coder.

Входные параметры

развернуть все

`build_type` — Выведите, чтобы создать из сгенерированного кода C/C++ CUDA
`'MEX'` | `'LIB'` | `'DLL'` | `'EXE'`

Выведите, чтобы создать из сгенерированного кода C/C++ CUDA, заданного как одно из значений в этой таблице.

Значение	Описание
`'MEX'`	MEX CUDA
`'LIB'`	Статическая библиотека
`'DLL'`	Динамически подключаемая библиотека
`'EXE'`	Исполняемая программа

Свойства

развернуть все

`Enabled` — Управляйте генерацией кода графического процессора
`true` (значение по умолчанию) | `false`

Управляйте генерацией CUDA (*.cu) файлы при помощи одного из значений в этой таблице.

Значение Описание

Значение	Описание
`true`	Это значение является значением по умолчанию. Включает генерацию кода CUDA.
`false`	Отключает генерацию кода CUDA.

true

Это значение является значением по умолчанию.

Включает генерацию кода CUDA.

false

Отключает генерацию кода CUDA.

Пример: cfg.GpuConfig.Enabled = true

`MallocMode` — Выделение памяти графического процессора
`'discrete'` (значение по умолчанию) | `'unified'`

Выделение памяти (malloc) режим, который будет использоваться в сгенерированном коде CUDA, заданном как одно из значений в этой таблице.

Значение Описание

Значение	Описание
`'discrete'`	Это значение является значением по умолчанию. Сгенерированный код использует `cudaMalloc` API для передачи данных между центральным процессором и графическим процессором. С точки зрения программистов дискретный режим имеет традиционную архитектуру памяти с отдельным адресным пространством глобальной памяти центрального процессора и графического процессора.
`'unified'`	Сгенерированный код использует `cudaMallocManaged` API, который использует разделяемое (объединенное) адресное пространство глобальной памяти центрального процессора и графического процессора.

'discrete'

Это значение является значением по умолчанию.

Сгенерированный код использует cudaMalloc API для передачи данных между центральным процессором и графическим процессором. С точки зрения программистов дискретный режим имеет традиционную архитектуру памяти с отдельным адресным пространством глобальной памяти центрального процессора и графического процессора.

'unified'

Сгенерированный код использует cudaMallocManaged API, который использует разделяемое (объединенное) адресное пространство глобальной памяти центрального процессора и графического процессора.

Для получения дополнительной информации смотрите Дискретные и Режимы автоматического управления.

Пример: cfg.GpuConfig.MallocMode = 'discrete'

`KernelNamePrefix` — Пользовательские префиксы имени ядра
'' (значение по умолчанию) | вектор символов

Задайте пользовательский префикс имени для всех ядер в сгенерированном коде. Например, с помощью значения 'CUDA_' создает ядра с именами CUDA_kernel1, CUDA_kernel2, и так далее. Если никакое имя не обеспечивается, GPU Coder предварительно ожидает имя ядра с именем функции точки входа. Имена ядра могут содержать прописные буквы, строчные буквы, цифры 0-9 и символ подчеркивания _. GPU Coder удаляет неподдерживаемые символы из имен ядра и добавляет alpha к префиксам, которые не начинаются с алфавитной буквы.

Пример: cfg.GpuConfig.KernelNamePrefix = 'myKernel'

`EnableCUBLAS` — Используйте `cuBLAS` библиотека
`true` (значение по умолчанию) | `false`

Замена математической функции вызывает с NVIDIA^® cuBLAS вызовы библиотеки, заданные как одно из значений в этой таблице.

Значение Описание

Значение	Описание
`true`	Это значение является значением по умолчанию. Позволяет GPU Coder заменять соответствующие вызовы математической функции на вызовы `cuBLAS` библиотека. Для функций, которые не имеют никаких замен в CUDA, GPU Coder использует портативные функции MATLAB^® и пытается сопоставить их с графическим процессором.
`false`	Отключите использование `cuBLAS` библиотека в сгенерированном коде.

true

Это значение является значением по умолчанию.

Позволяет GPU Coder заменять соответствующие вызовы математической функции на вызовы cuBLAS библиотека. Для функций, которые не имеют никаких замен в CUDA, GPU Coder использует портативные функции MATLAB^® и пытается сопоставить их с графическим процессором.

false

Отключите использование cuBLAS библиотека в сгенерированном коде.

Для получения дополнительной информации смотрите Ядра от Вызовов Библиотеки.

Пример: cfg.GpuConfig.EnableCUBLAS = true

`EnableCUSOLVER` — Используйте `cuSOLVER` библиотека
`true` (значение по умолчанию) | `false`

Замена математической функции вызывает с NVIDIA cuSOLVER вызовы библиотеки, заданные как одно из значений в этой таблице.

Значение Описание

Значение	Описание
`true`	Это значение является значением по умолчанию. Позволяет GPU Coder заменять соответствующие вызовы математической функции на вызовы `cuSOLVER` библиотека. Для функций, которые не имеют никаких замен в CUDA, GPU Coder использует портативные функции MATLAB и пытается сопоставить их с графическим процессором.
`false`	Отключите использование `cuSOLVER` библиотека в сгенерированном коде.

true

Это значение является значением по умолчанию.

Позволяет GPU Coder заменять соответствующие вызовы математической функции на вызовы cuSOLVER библиотека. Для функций, которые не имеют никаких замен в CUDA, GPU Coder использует портативные функции MATLAB и пытается сопоставить их с графическим процессором.

false

Отключите использование cuSOLVER библиотека в сгенерированном коде.

Для получения дополнительной информации смотрите Ядра от Вызовов Библиотеки.

Пример: cfg.GpuConfig.EnableCUSOLVER = true

`EnableCUFFT` — Используйте `cuFFT` библиотека
`true` (значение по умолчанию) | `false`

Замена fft вызовы функции с NVIDIA cuFFT вызовы библиотеки, заданные как одно из значений в этой таблице.

Значение Описание

Значение	Описание
`true`	Это значение является значением по умолчанию. Позволяет GPU Coder заменять соответствующий `fft` вызовы с вызовами `cuFFT` библиотека.
`false`	Отключает использование `cuFFT` библиотека в сгенерированном коде. При использовании этой опции GPU Coder использует `FFTW` C библиотеки, где доступный или генерирует ядра из портативного MATLAB `fft` код.

true

Это значение является значением по умолчанию.

Позволяет GPU Coder заменять соответствующий fft вызовы с вызовами cuFFT библиотека.

false

Отключает использование cuFFT библиотека в сгенерированном коде. При использовании этой опции GPU Coder использует FFTW C библиотеки, где доступный или генерирует ядра из портативного MATLAB fft код.

Для получения дополнительной информации смотрите Ядра от Вызовов Библиотеки.

Пример: cfg.GpuConfig.EnableCUFFT = true

`Benchmarking` — Добавьте сравнительное тестирование в сгенерированный код
`false` (значение по умолчанию) | `true`

Управляйте сложением сравнительного тестирования кода к сгенерированному коду CUDA при помощи одного из значений в этой таблице.

Значение Описание

Значение	Описание
`false`	Это значение является значением по умолчанию. Сгенерированный код CUDA не содержит функциональность сравнительного тестирования.
`true`	Генерирует код CUDA со сравнительным тестированием функциональности. Эта опция использует API CUDA, такие как `cudaEvent` к точно времени `kernel`, `memcpy`, и другие события.

false

Это значение является значением по умолчанию.

Сгенерированный код CUDA не содержит функциональность сравнительного тестирования.

true

Генерирует код CUDA со сравнительным тестированием функциональности. Эта опция использует API CUDA, такие как cudaEvent к точно времени kernel, memcpy, и другие события.

Пример: cfg.GpuConfig.Benchmarking = true

`SafeBuild` — Проверка ошибок в сгенерированном коде
`false` (значение по умолчанию) | `true`

Добавьте функциональность проверки ошибок в сгенерированный код CUDA при помощи одного из значений в этой таблице.

Значение Описание

Значение	Описание
`false`	Это значение является значением по умолчанию. Сгенерированный код CUDA не содержит функциональность проверки ошибок.
`true`	Генерирует код с проверкой ошибок на вызовы API CUDA и вызовы ядра.

false

Это значение является значением по умолчанию.

Сгенерированный код CUDA не содержит функциональность проверки ошибок.

true

Генерирует код с проверкой ошибок на вызовы API CUDA и вызовы ядра.

Пример: cfg.GpuConfig.SafeBuild = true

`ComputeCapability` — Минимум вычисляет возможность генерации кода
'3.5' (значение по умолчанию) | `'3.2'`| '3.7' | '5.0' | '5.2' | '5.3' | '6.0' | '6.1' | '6.2' | '7.0' | '7.1' | '7.2'

Выбор минимум вычисляет возможность генерации кода. Вычислить возможность идентифицирует функции, поддерживавшие оборудованием графического процессора, и используется приложениями во время выполнения, чтобы определить, который показывает оборудование, инструкции доступны на существующем графическом процессоре. Если вы задаете пользовательский, вычисляют возможность, GPU Coder игнорирует эту установку.

Пример: cfg.GpuConfig.ComputeCapability = '6.1'

`CustomComputeCapability` — Управляйте генерацией кода графического процессора
`''` (значение по умолчанию) | вектор символов

Задайте имя NVIDIA виртуальная архитектура графического процессора, для которой должны быть скомпилированы файлы входа CUDA.

Например, чтобы задать виртуальный тип архитектуры -arch=compute_50. Можно задать действительную архитектуру с помощью -arch=sm_50. Для получения дополнительной информации см. Опции для Регулирования темы Генерации кода графического процессора в документации инструментария CUDA.

Пример: cfg.GpuConfig.CustomComputeCapability = '-arch=compute_50'

`CompilerFlags` — Дополнительные флаги к компилятору графического процессора
`''` (значение по умолчанию) | `character vector`

Передайте дополнительные флаги компилятору графического процессора. Например, --fmad=false сообщает nvcc компилятор, чтобы отключить сокращение с плавающей точкой умножается и добавляет к синглу, С плавающей точкой, Умножаются - Добавляет инструкция (FMAD).

Для подобных параметров компилятора NVIDIA смотрите тему на Опциях Команды NVCC в документации инструментария CUDA.

Пример: cfg.GpuConfig.CompilerFlags = '--fmad=false'

`StackLimitPerThread` — Сложите предел на поток графического процессора
1024 (значение по умолчанию) | `integer`

Задайте максимальный предел стека на поток графического процессора как целочисленное значение.

Пример: cfg.GpuConfig.StackLimitPerThread = 1024

`MallocThreshold` — Порог Malloc
200 (значение по умолчанию) | `integer`

Задайте размер, выше которого частные переменные выделяются на куче вместо стека как целочисленное значение.

Пример: cfg.GpuConfig.MallocThreshold = 256

`SelectCudaDevice` — Выбор устройства CUDA
-1 (значение по умолчанию) | `deviceID`

Во много среде графического процессора, такой как платформы Диска NVIDIA, задайте устройство CUDA, чтобы предназначаться.

Пример: cfg.GpuConfig.SelectCudaDevice = <DeviceID>

Примечание

SelectCudaDevice может использоваться с gpuArray только если gpuDevice и SelectCudaDevice укажите на тот же графический процессор. Если gpuDevice точки к различному графическому процессору, CUDA_ERROR_INVALID_VALUE ошибка периода выполнения выдана.

Примеры

свернуть все

Сгенерируйте MEX CUDA

Сгенерируйте MEX-функцию CUDA от функции MATLAB, которая подходит для генерации кода графического процессора. Кроме того, включите отчет генерации кода.

Запишите функции MATLAB VecAdd, это выполняет векторное сложение входных параметров A и B.

function [C] = VecAdd(A,B) %#codegen
    C = coder.nullcopy(zeros(size(A)));
    coder.gpu.kernelfun();
    C = A + B;
end

Создайте объект настройки генерации кода сгенерировать MEX-функцию.

cfg = coder.gpuConfig('mex');

Включите отчет генерации кода.

cfg.GpuConfig.EnableCUBLAS = true;
cfg.GenerateReport = true;

Сгенерируйте MEX-функцию в текущей папке, задающей объект настройки использование -config опция.

% Generate a MEX function and code generation report
codegen -config cfg -args {zeros(512,512,'double'),zeros(512,512,'double')} VecAdd

Документация

coder.gpuConfig

Описание

Создание

Синтаксис

Описание

Входные параметры

`build_type` — Выведите, чтобы создать из сгенерированного кода C/C++ CUDA
`'MEX'` | `'LIB'` | `'DLL'` | `'EXE'`

Свойства

`Enabled` — Управляйте генерацией кода графического процессора
`true` (значение по умолчанию) | `false`

`MallocMode` — Выделение памяти графического процессора
`'discrete'` (значение по умолчанию) | `'unified'`

`KernelNamePrefix` — Пользовательские префиксы имени ядра
'' (значение по умолчанию) | вектор символов

`EnableCUBLAS` — Используйте `cuBLAS` библиотека
`true` (значение по умолчанию) | `false`

`EnableCUSOLVER` — Используйте `cuSOLVER` библиотека
`true` (значение по умолчанию) | `false`

`EnableCUFFT` — Используйте `cuFFT` библиотека
`true` (значение по умолчанию) | `false`

`Benchmarking` — Добавьте сравнительное тестирование в сгенерированный код
`false` (значение по умолчанию) | `true`

`SafeBuild` — Проверка ошибок в сгенерированном коде
`false` (значение по умолчанию) | `true`

`ComputeCapability` — Минимум вычисляет возможность генерации кода
'3.5' (значение по умолчанию) | `'3.2'`| '3.7' | '5.0' | '5.2' | '5.3' | '6.0' | '6.1' | '6.2' | '7.0' | '7.1' | '7.2'

`CustomComputeCapability` — Управляйте генерацией кода графического процессора
`''` (значение по умолчанию) | вектор символов

`CompilerFlags` — Дополнительные флаги к компилятору графического процессора
`''` (значение по умолчанию) | `character vector`

`StackLimitPerThread` — Сложите предел на поток графического процессора
1024 (значение по умолчанию) | `integer`

`MallocThreshold` — Порог Malloc
200 (значение по умолчанию) | `integer`

`SelectCudaDevice` — Выбор устройства CUDA
-1 (значение по умолчанию) | `deviceID`

Примечание

Примеры

Сгенерируйте MEX CUDA

Смотрите также

Введенный в R2017b

Документация GPU Coder

Поддержка

Документация

coder.gpuConfig

Описание

Создание

Синтаксис

Описание

Входные параметры

build_type — Выведите, чтобы создать из сгенерированного кода C/C++ CUDA 'MEX' | 'LIB' | 'DLL' | 'EXE'

Свойства

Enabled — Управляйте генерацией кода графического процессора true (значение по умолчанию) | false

MallocMode — Выделение памяти графического процессора 'discrete' (значение по умолчанию) | 'unified'

KernelNamePrefix — Пользовательские префиксы имени ядра '' (значение по умолчанию) | вектор символов

EnableCUBLAS — Используйте cuBLAS библиотека true (значение по умолчанию) | false

EnableCUSOLVER — Используйте cuSOLVER библиотека true (значение по умолчанию) | false

EnableCUFFT — Используйте cuFFT библиотека true (значение по умолчанию) | false

Benchmarking — Добавьте сравнительное тестирование в сгенерированный код false (значение по умолчанию) | true

SafeBuild — Проверка ошибок в сгенерированном коде false (значение по умолчанию) | true

ComputeCapability — Минимум вычисляет возможность генерации кода'3.5' (значение по умолчанию) | '3.2'| '3.7' | '5.0' | '5.2' | '5.3' | '6.0' | '6.1' | '6.2' | '7.0' | '7.1' | '7.2'

CustomComputeCapability — Управляйте генерацией кода графического процессора '' (значение по умолчанию) | вектор символов

CompilerFlags — Дополнительные флаги к компилятору графического процессора '' (значение по умолчанию) | character vector

StackLimitPerThread — Сложите предел на поток графического процессора1024 (значение по умолчанию) | integer

MallocThreshold — Порог Malloc200 (значение по умолчанию) | integer

SelectCudaDevice — Выбор устройства CUDA-1 (значение по умолчанию) | deviceID

Примечание

Примеры

Сгенерируйте MEX CUDA

Смотрите также

Введенный в R2017b

Документация GPU Coder

Поддержка

`build_type` — Выведите, чтобы создать из сгенерированного кода C/C++ CUDA
`'MEX'` | `'LIB'` | `'DLL'` | `'EXE'`

`Enabled` — Управляйте генерацией кода графического процессора
`true` (значение по умолчанию) | `false`

`MallocMode` — Выделение памяти графического процессора
`'discrete'` (значение по умолчанию) | `'unified'`

`KernelNamePrefix` — Пользовательские префиксы имени ядра
'' (значение по умолчанию) | вектор символов

`EnableCUBLAS` — Используйте `cuBLAS` библиотека
`true` (значение по умолчанию) | `false`

`EnableCUSOLVER` — Используйте `cuSOLVER` библиотека
`true` (значение по умолчанию) | `false`

`EnableCUFFT` — Используйте `cuFFT` библиотека
`true` (значение по умолчанию) | `false`

`Benchmarking` — Добавьте сравнительное тестирование в сгенерированный код
`false` (значение по умолчанию) | `true`

`SafeBuild` — Проверка ошибок в сгенерированном коде
`false` (значение по умолчанию) | `true`

`ComputeCapability` — Минимум вычисляет возможность генерации кода
'3.5' (значение по умолчанию) | `'3.2'`| '3.7' | '5.0' | '5.2' | '5.3' | '6.0' | '6.1' | '6.2' | '7.0' | '7.1' | '7.2'

`CustomComputeCapability` — Управляйте генерацией кода графического процессора
`''` (значение по умолчанию) | вектор символов

`CompilerFlags` — Дополнительные флаги к компилятору графического процессора
`''` (значение по умолчанию) | `character vector`

`StackLimitPerThread` — Сложите предел на поток графического процессора
1024 (значение по умолчанию) | `integer`

`MallocThreshold` — Порог Malloc
200 (значение по умолчанию) | `integer`

`SelectCudaDevice` — Выбор устройства CUDA
-1 (значение по умолчанию) | `deviceID`