Как с любыми файлами MEX, те, которые содержат CUDA® код имеет однократную точку, известную как mexFunction
. MEX-функция содержит код стороны хоста, который взаимодействует с объектами gpuArray из MATLAB® и запускает код CUDA. Код CUDA в файле MEX должен соответствовать API во время выполнения CUDA.
Необходимо вызвать функцию mxInitGPU
при записи в ваш файл MEX. Это гарантирует, что устройство графического процессора правильно инициализируется и известно MATLAB.
Интерфейс, который вы используете, чтобы записать файл MEX для объектов gpuArray, отличается от интерфейса MEX для стандартных массивов MATLAB.
Вы видите пример файла MEX, содержащего код CUDA в:
Этот файл содержит следующую функцию устройства CUDA:
void __global__ TimesTwo(double const * const A, double * const B, int const N) { int i = blockDim.x * blockIdx.x + threadIdx.x; if (i < N) B[i] = 2.0 * A[i]; }
Это содержит следующие линии, чтобы определить размер массивов и запустить сетку соответствующего размера:
N = (int)(mxGPUGetNumberOfElements(A)); blocksPerGrid = (N + threadsPerBlock - 1) / threadsPerBlock; TimesTwo<<<blocksPerGrid, threadsPerBlock>>>(d_A, d_B, N);
MEX-функция в этом примере умножает каждый элемент во входном массиве на 2, чтобы получить значения в выходном массиве. Чтобы протестировать его, начните с gpuArray, в котором каждый элемент равняется 1:
x = ones(4,4,'gpuArray');
y = mexGPUExample(x)
y = 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2
Оба массивы ввода и вывода являются объектами gpuArray:
disp(['class(x) = ',class(x),', class(y) = ',class(y)])
class(x) = gpuArray, class(y) = gpuArray
Parallel Computing Toolbox™ также поддерживает CUDAKernel
объекты, которые могут использоваться, чтобы интегрировать код CUDA с MATLAB. Можно создать CUDAKernel
объекты с помощью CU и файлов PTX. Обычно использование файлов MEX более гибко, чем использование CUDAKernel
объекты:
Файлы MEX могут включать вызовы библиотек стороны хоста, включая NVIDIA® библиотеки, такие как Примитивы эффективности Nvidia (NPP) или cuFFT библиотеки. Файлы MEX могут также содержать вызовы от хоста до функций в библиотеке времени выполнения CUDA.
Файлы MEX могут анализировать размер входа и выделить память о различном размере или запустить сетки различного размера от кода C or C++. В сравнении, код MATLAB, который вызывает CUDAKernel
объекты должны предварительно выделить выход memory и определить размер сетки.
Комплексные данные на устройстве графического процессора хранятся в чередованном сложном формате. Таким образом, для комплексного gpuArray A
, действительные и мнимые части элемента i
хранятся в последовательных адресах. MATLAB использует встроенные типы векторов CUDA, чтобы хранить комплексные данные на устройстве (см. NVIDIA CUDA C Руководство по программированию).
В зависимости от потребностей вашего ядра можно бросить указатель на комплексные данные или как действительный тип или как встроенный тип вектора. Например, в MATLAB, предположите, что вы создаете следующую матрицу:
a = complex(ones(4,'gpuArray'),ones(4,'gpuArray'));
Если вы передаете gpuArray MEX-функции в качестве первого аргумента (prhs [0]), то можно получить указатель на комплексные данные при помощи вызовов:
mxGPUArray const * A = mxGPUCreateFromMxArray(prhs[0]); mwSize numel_complex = mxGPUGetNumberOfElements(A); double2 * d_A = (double2 const *)(mxGPUGetDataReadOnly(A));
Чтобы обработать массив как действительный массив с двойной точностью дважды длины, вы могли сделать это этот путь:
mxGPUArray const * A = mxGPUCreateFromMxArray(prhs[0]); mwSize numel_real =2*mxGPUGetNumberOfElements(A); double * d_A = (double const *)(mxGPUGetDataReadOnly(A));
Различные функции существуют, чтобы преобразовать данные между комплексными и действительными форматами на графическом процессоре. Эти операции требуют, чтобы копия чередовала данные. Функция mxGPUCreateComplexGPUArray
берет два действительных mxGPUArrays и чередует их элементы, чтобы произвести один комплекс mxGPUArray той же длины. Функции mxGPUCopyReal
и mxGPUCopyImag
каждая копия или действительное или мнимые элементы в новый действительный mxGPUArray. (Нет никакого эквивалента mxGetImagData
функция для объектов mxGPUArray.)
Используйте mexcuda
команда в MATLAB, чтобы скомпилировать файл MEX, содержащий код CUDA. Можно скомпилировать файл в качестве примера с помощью команды:
mexcuda mexGPUExample.cu
Если инструментарий CUDA не обнаруживается или не является поддерживаемой версией, MATLAB компилирует код CUDA с помощью nvcc
NVIDIA компилятор установлен с MATLAB. Проверять который компилятор
mexcuda
использует, используйте -v
отметьте для многословного выхода в mexcuda
команда.
Инструментарий CUDA, установленный с MATLAB, не содержит все библиотеки, которые доступны в инструментарии CUDA. Если вы хотите соединить определенную библиотеку, которая не установлена с MATLAB, установите инструментарий CUDA. Можно проверять, какая версия инструментария CUDA MATLAB требует использования gpuDevice
. Для получения дополнительной информации об Инструментарии CUDA, см. Инструментарий CUDA.
Если mexcuda
испытывает затруднения при определении местоположения компилятора NVIDIA (nvcc
) в вашем установленном инструментарии CUDA это может быть установлено в месте не по умолчанию. Можно задать местоположение nvcc
в вашей системе путем хранения его в переменной окружения MW_NVCC_PATH
. Можно установить эту переменную с помощью MATLAB setenv
команда. Например,
setenv('MW_NVCC_PATH','/usr/local/CUDA/bin')
Только подмножество Visual Studio® компиляторы поддерживаются для mexcuda. Для получения дополнительной информации консультируйтесь с документацией инструментария NVIDIA.
mexcuda
| CUDAKernel
| mex