gpucoder.stridedMatrixMultiply

Оптимизированная реализация графического процессора strided и обработанный в пакетном режиме умножение матриц операция

Синтаксис

D = gpucoder.stridedMatrixMultiply(A,B)

___ = gpucoder.stridedMatrixMultiply(___,Name,Value)

Описание

D = gpucoder.stridedMatrixMultiply(A,B) выполняет strided матричное умножение матриц пакета матриц. Входные матрицы A и B поскольку каждый экземпляр пакета расположен при фиксированных смещениях адреса от их адресов в предыдущем экземпляре. gpucoder.stridedMatrixMultiply функция выполняет матричное умножение матриц формы:

$D = α A B$

где $α$ фактор скалярного умножения, AB, и D матрицы с размерностями m- kK- n, и m- n соответственно. Можно опционально транспонировать или эрмитов сопряженный A и B. По умолчанию, $α$ установлен в одного, и матрицы не транспонированы. Чтобы задать различный фактор скалярного умножения и выполнить транспонируют операции на входных матрицах, используют Name,Value парные аргументы.

Все пакеты передали gpucoder.stridedMatrixMultiply функция должна быть универсальной. Таким образом, все экземпляры должны иметь те же размерности m,n,k.

пример

___ = gpucoder.stridedMatrixMultiply(___,Name,Value) выполняет обработанный в пакетном режиме strided, умножение матриц операция при помощи опций, заданных одним или несколькими Name,Value парные аргументы.

Примеры

свернуть все

Strided пакетное Матричное Умножение матриц

Выполните простое пакетное матричное умножение матриц и используйте gpucoder.stridedMatrixMultiply функция, чтобы сгенерировать CUDA^® код, который вызывает соответствующий cublas<t>gemmStridedBatched API.

В одном файле запишите функции точки входа myStridedMatMul это признает, что матрица вводит A и B. Поскольку входные матрицы не транспонированы, используйте 'nn' опция.

function [D] = myStridedMatMul(A,B,alpha)

[D] = gpucoder.stridedMatrixMultiply(A,B,'alpha',alpha, ...
    'transpose','nn');

end

Создать тип для матрицы удваивается для использования в генерации кода, используйте coder.newtype функция.

A = coder.newtype('double',[5 4 100],[0 0]);
B = coder.newtype('double',[4 5 100],[0 0]);
alpha = 0.3;
inputs = {A,B,alpha};

Чтобы сгенерировать библиотеку CUDA, используйте codegen функция.

cfg = coder.gpuConfig('lib');
cfg.GpuConfig.EnableCUBLAS = true;
cfg.GpuConfig.EnableCUSOLVER = true;
cfg.GenerateReport = true;
codegen -config cfg-args inputs myStridedMatMul

Сгенерированный код CUDA содержит ядра myStridedMatMul_kernelNN для инициализации матриц ввода и вывода. Код также содержит cublasDgemmStridedBatched Вызовы API cuBLAS библиотеки. Следующий код является отрывком сгенерированного кода.

//
// File: myStridedMatMul.cu
//
...
void myStridedMatMul(const double A_data[], const int A_size[3], const double
                     B_data[], const int B_size[3], double alpha, double D_data[],
                     int D_size[3])
{
  double alpha1;
...
  beta1 = 0.0;
  cudaMemcpy(gpu_alpha1, &alpha1, 8ULL, cudaMemcpyHostToDevice);
  cudaMemcpy(gpu_A_data, (void *)A_data, A_size[0] * A_size[1] * A_size[2] *
             sizeof(double), cudaMemcpyHostToDevice);
  cudaMemcpy(gpu_B_data, (void *)B_data, B_size[0] * B_size[1] * B_size[2] *
             sizeof(double), cudaMemcpyHostToDevice);
  cudaMemcpy(gpu_beta1, &beta1, 8ULL, cudaMemcpyHostToDevice);
  if (D_data_dirtyOnCpu) {
    cudaMemcpy(gpu_D_data, &D_data[0], 25 * D_size[2] * sizeof(double),
               cudaMemcpyHostToDevice);
  }

  if (batchDimsA[2] >= batchDimsB[2]) {
    if (batchDimsA[2] >= 1) {
      ntilecols = batchDimsA[2];
    } else {
      ntilecols = 1;
    }
  } else {
    ntilecols = batchDimsB[2];
  }

  cublasDgemmStridedBatched(getCublasGlobalHandle(), CUBLAS_OP_N, CUBLAS_OP_N, 5,
    5, 4, (double *)gpu_alpha1, (double *)&gpu_A_data[0], 5, strideA, (double *)
    &gpu_B_data[0], 4, strideB, (double *)gpu_beta1, (double *)&gpu_D_data[0], 5,
    25, ntilecols);
  cudaMemcpy(&D_data[0], gpu_D_data, 25 * D_size[2] * sizeof(double),
             cudaMemcpyDeviceToHost);
...
}

Входные параметры

свернуть все

`AB` — Операнды
векторы | матрицы

Операнды в виде векторов или матриц. gpucoder.stridedMatrixMultiply умножается по первым двум измерениям.

Аргументы name-value

Задайте дополнительные разделенные запятой пары Name,Value аргументы. Name имя аргумента и Value соответствующее значение. Name должен появиться в кавычках. Вы можете задать несколько аргументов в виде пар имен и значений в любом порядке, например: Name1, Value1, ..., NameN, ValueN.

Пример: D = gpucoder.stridedMatrixMultiply(A,B,'alpha',0.3,'transpose','CC');

`alpha` — Фактор скалярного умножения
1.0 (значение по умолчанию) | скаляр

Значение скаляра используется для умножения с A. Значением по умолчанию является то.

`transpose` — Операция выполняется на входных матрицах
'NN' (значение по умолчанию) | вектор символов | строка

Вектор символов или строка, состоявшая из двух символов, указывая на операцию, выполнили на матрицах A и B до умножения матриц. Возможные значения нормальны ('N'), транспонированный ('T'), или комплексное сопряженное транспонирование ('C').

Выходные аргументы

свернуть все

`D` — Продукт
скаляр | вектор | матрица

Продукт, возвращенный как скаляр, вектор или матрица. Массив D имеет одинаковое число строк как вход A и одинаковое число столбцов как вход B.

Смотрите также

Темы

Введенный в R2020a

Документация

gpucoder.stridedMatrixMultiply

Синтаксис

Описание

Примеры

Strided пакетное Матричное Умножение матриц

Входные параметры

`AB` — Операнды
векторы | матрицы

Аргументы name-value

`alpha` — Фактор скалярного умножения
1.0 (значение по умолчанию) | скаляр

`transpose` — Операция выполняется на входных матрицах
'NN' (значение по умолчанию) | вектор символов | строка

Выходные аргументы

`D` — Продукт
скаляр | вектор | матрица

Смотрите также

Приложения

Функции

Объекты

Темы

Документация GPU Coder

Поддержка

Документация

gpucoder.stridedMatrixMultiply

Синтаксис

Описание

Примеры

Strided пакетное Матричное Умножение матриц

Входные параметры

AB — Операнды векторы | матрицы

Аргументы name-value

alpha — Фактор скалярного умножения 1.0 (значение по умолчанию) | скаляр

transpose — Операция выполняется на входных матрицах 'NN' (значение по умолчанию) | вектор символов | строка

Выходные аргументы

D — Продукт скаляр | вектор | матрица

Смотрите также

Приложения

Функции

Объекты

Темы

Документация GPU Coder

Поддержка

`AB` — Операнды
векторы | матрицы

`alpha` — Фактор скалярного умножения
1.0 (значение по умолчанию) | скаляр

`transpose` — Операция выполняется на входных матрицах
'NN' (значение по умолчанию) | вектор символов | строка

`D` — Продукт
скаляр | вектор | матрица