gpucoder.stridedMatrixMultiplyAdd

Оптимизированная реализация графического процессора strided, обработанного в пакетном режиме, умножение матриц с, добавляет операция

свернуть все на странице

Синтаксис

D = gpucoder.stridedMatrixMultiplyAdd(A,B,C)

___ = gpucoder.stridedMatrixMultiplyAdd(___,Name,Value)

Описание

D = gpucoder.stridedMatrixMultiplyAdd(A,B,C) выполняет strided матричное умножение матриц, и добавьте пакета матриц. Входные матрицы AB, и C поскольку каждый экземпляр пакета расположен при фиксированных смещениях адреса от их адресов в предыдущем экземпляре. gpucoder.stridedMatrixMultiplyAdd выполняет матричное умножение матриц формы:

$D = α A B + β C$

где $α$ и $β$ факторы скалярного умножения, ABC, и D матрицы с размерностями m- kK- nM- n, и m- n соответственно. AB, и C может опционально транспонироваться или спрягаться эрмитовым образом. По умолчанию, $α$ и $β$ установлены в одного, и матрицы не транспонированы. Используйте Name,Value парные аргументы, чтобы задать различный фактор скалярного умножения и задать транспонируют операции на входных матрицах.

Все пакеты передали gpucoder.stridedMatrixMultiplyAdd функция должна быть универсальной. Таким образом, все экземпляры должны иметь те же размерности m,n,k.

пример

___ = gpucoder.stridedMatrixMultiplyAdd(___,Name,Value) выполняет обработанный в пакетном режиме, умножение матриц и добавляют операцию с помощью опций, заданных одним или несколькими Name,Value парные аргументы.

Примеры

свернуть все

Матричное Умножение матриц Strided с добавляет

Этот пример выполняет простое пакетное матричное умножение матриц с, добавляют, и использует gpucoder.stridedMatrixMultiplyAdd функция, чтобы сгенерировать код CUDA^®, который вызывает соответствующий cublas<t>gemmStridedBatched API.

В одном файле запишите функции точки входа myStridedMatMulAdd это признает, что матрица вводит AB, и C. Входные матрицы не транспонированы, поэтому используют 'nn' опция.

function [D] = myStridedMatMulAdd(A,B,C,alpha,beta)

[D] = gpucoder.stridedMatrixMultiplyAdd(A,B,C,'alpha',alpha,...
    'beta',beta,'transpose','nn');

end

Используйте coder.newtype функция, чтобы создать тип для матрицы удваивается для использования в генерации кода.

A = coder.newtype('double',[12,14],[0 0]);
B = coder.newtype('double',[14,16],[0 0]);
C = coder.newtype('double',[12,16],[0 0]);
alpha = 0.3;
beta = 0.6;
inputs = {A,B,C,alpha,beta};

Используйте codegen функция, чтобы сгенерировать библиотеку CUDA.

cfg = coder.gpuConfig('lib');
cfg.GpuConfig.EnableCUBLAS = true;
cfg.GpuConfig.EnableCUSOLVER = true;
cfg.GenerateReport = true;
codegen -config cfg-args inputs myStridedMatMulAdd

Сгенерированный код CUDA содержит ядра: myStridedMatMulAdd_kernelNN для инициализации матриц ввода и вывода. Это также содержит cublasDgemmStridedBatched Вызовы API cuBLAS библиотеки. Следующее является отрывком сгенерированного кода.

//
// File: myStridedMatMulAdd.cu
...

void myStridedMatMulAdd(const double A[168], const double B[224], const double
  C[192], double alpha, double beta, double D[192])
{
  double alpha1;
...
  cudaMemcpy(gpu_C, (void *)&C[0], 1536UL, cudaMemcpyHostToDevice);
  myStridedMatMulAdd_kernel1<<<dim3(1U, 1U, 1U), dim3(192U, 1U, 1U)>>>(*gpu_C,
    *gpu_D);
  cudaMemcpy(gpu_alpha1, &alpha1, 8UL, cudaMemcpyHostToDevice);
  cudaMemcpy(gpu_A, (void *)&A[0], 1344UL, cudaMemcpyHostToDevice);
  cudaMemcpy(gpu_B, (void *)&B[0], 1792UL, cudaMemcpyHostToDevice);
  cudaMemcpy(gpu_beta1, &beta1, 8UL, cudaMemcpyHostToDevice);
  cublasDgemmStridedBatched(getCublasGlobalHandle(), CUBLAS_OP_N, CUBLAS_OP_N,
    12, 16, 14, (double *)gpu_alpha1, (double *)&(*gpu_A)[0], 12, 0, (double *)
    &(*gpu_B)[0], 14, 0, (double *)gpu_beta1, (double *)&(*gpu_D)[0], 12, 192, 1);
  cudaMemcpy(&D[0], gpu_D, 1536UL, cudaMemcpyDeviceToHost);
...
}

Входные параметры

свернуть все

`ABC` — Операнды
векторы | матрицы

Операнды в виде векторов или матриц. AB, и C должны быть 2D массивы. Количество столбцов в A должно быть равно количеству строк в B. Количество строк в A должно быть равно количеству строк в C. Количество столбцов в B должно быть равно количеству столбцов в C.

Аргументы в виде пар имя-значение

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: D = gpucoder.stridedMatrixMultiplyAdd(A,B,C,'alpha',0.3,'beta',0.6,'transpose','CC');

`'alpha'` — Фактор скалярного умножения
1.0 (значение по умолчанию) | скаляр

Значение скаляра используется в умножении с A. Значением по умолчанию является то.

`'beta'` — Фактор скалярного умножения
1.0 (значение по умолчанию) | скаляр

Значение скаляра используется в умножении с C. Значением по умолчанию является то.

`'transpose'` — Операция выполняется на входных матрицах
'NN' (значение по умолчанию) | вектор символов | строка

Вектор символов или строка, состоявшая из двух символов, указывая на операцию, выполнили на матрицах A и B до умножения матриц. Возможные значения нормальны ('N'), транспонированный ('T'), или комплексное сопряженное транспонирование ('C').

Выходные аргументы

свернуть все

`D` — Продукт
скаляр | вектор | матрица

Продукт, возвращенный как скаляр, вектор или матрица. Массив D имеет одинаковое число строк как вход A и одинаковое число столбцов как вход B.

Документация

gpucoder.stridedMatrixMultiplyAdd

Синтаксис

Описание

Примеры

Матричное Умножение матриц Strided с добавляет

Входные параметры

`ABC` — Операнды
векторы | матрицы

Аргументы в виде пар имя-значение

`'alpha'` — Фактор скалярного умножения
1.0 (значение по умолчанию) | скаляр

`'beta'` — Фактор скалярного умножения
1.0 (значение по умолчанию) | скаляр

`'transpose'` — Операция выполняется на входных матрицах
'NN' (значение по умолчанию) | вектор символов | строка

Выходные аргументы

`D` — Продукт
скаляр | вектор | матрица

Смотрите также

Темы

Введенный в R2020a

Документация GPU Coder

Поддержка

Документация

gpucoder.stridedMatrixMultiplyAdd

Синтаксис

Описание

Примеры

Матричное Умножение матриц Strided с добавляет

Входные параметры

ABC — Операнды векторы | матрицы

Аргументы в виде пар имя-значение

'alpha' — Фактор скалярного умножения 1.0 (значение по умолчанию) | скаляр

'beta' — Фактор скалярного умножения 1.0 (значение по умолчанию) | скаляр

'transpose' — Операция выполняется на входных матрицах 'NN' (значение по умолчанию) | вектор символов | строка

Выходные аргументы

D — Продукт скаляр | вектор | матрица

Смотрите также

Темы

Введенный в R2020a

Документация GPU Coder

Поддержка

`ABC` — Операнды
векторы | матрицы

`'alpha'` — Фактор скалярного умножения
1.0 (значение по умолчанию) | скаляр

`'beta'` — Фактор скалярного умножения
1.0 (значение по умолчанию) | скаляр

`'transpose'` — Операция выполняется на входных матрицах
'NN' (значение по умолчанию) | вектор символов | строка

`D` — Продукт
скаляр | вектор | матрица