Оптимизированная реализация графического процессора strided и обработанный в пакетном режиме умножение матриц операция
выполняет strided матричное умножение матриц пакета матриц. Входные матрицы D
= gpucoder.stridedMatrixMultiply(A
,B
)A
и B
поскольку каждый экземпляр пакета расположен при фиксированных смещениях адреса от их адресов в предыдущем экземпляре. gpucoder.stridedMatrixMultiply
функция выполняет матричное умножение матриц формы:
где фактор скалярного умножения, A
B
, и D
матрицы с размерностями m
- k
K
- n
, и m
- n
соответственно. Можно опционально транспонировать или эрмитов сопряженный A
и B
. По умолчанию, установлен в одного, и матрицы не транспонированы. Чтобы задать различный фактор скалярного умножения и выполнить транспонируют операции на входных матрицах, используют Name,Value
парные аргументы.
Все пакеты передали gpucoder.stridedMatrixMultiply
функция должна быть универсальной. Таким образом, все экземпляры должны иметь те же размерности m,n,k
.
___ = gpucoder.stridedMatrixMultiply(___,
выполняет обработанный в пакетном режиме strided, умножение матриц операция при помощи опций, заданных одним или несколькими Name,Value
)Name,Value
парные аргументы.
codegen
| coder.gpu.kernel
| coder.gpu.kernelfun
| gpucoder.batchedMatrixMultiply
| gpucoder.batchedMatrixMultiplyAdd
| gpucoder.stridedMatrixMultiplyAdd