Оптимизированная реализация графического процессора strided, обработанного в пакетном режиме, умножение матриц с, добавляет операция
выполняет strided матричное умножение матриц, и добавьте пакета матриц. Входные матрицы D
= gpucoder.stridedMatrixMultiplyAdd(A
,B
,C
)A
B
, и C
поскольку каждый экземпляр пакета расположен при фиксированных смещениях адреса от их адресов в предыдущем экземпляре. gpucoder.stridedMatrixMultiplyAdd
выполняет матричное умножение матриц формы:
где и факторы скалярного умножения, A
B
C
, и D
матрицы с размерностями m
- k
K
- n
M
- n
, и m
- n
соответственно. A
B
, и C
может опционально транспонироваться или спрягаться эрмитовым образом. По умолчанию, и установлены в одного, и матрицы не транспонированы. Используйте Name,Value
парные аргументы, чтобы задать различный фактор скалярного умножения и задать транспонируют операции на входных матрицах.
Все пакеты передали gpucoder.stridedMatrixMultiplyAdd
функция должна быть универсальной. Таким образом, все экземпляры должны иметь те же размерности m,n,k
.
___ = gpucoder.stridedMatrixMultiplyAdd(___,
выполняет обработанный в пакетном режиме, умножение матриц и добавляют операцию с помощью опций, заданных одним или несколькими Name,Value
)Name,Value
парные аргументы.
coder.gpu.constantMemory
| coder.gpu.kernel
| coder.gpu.kernelfun
| gpucoder.batchedMatrixMultiply
| gpucoder.batchedMatrixMultiplyAdd
| gpucoder.sort
| gpucoder.stencilKernel
| gpucoder.stridedMatrixMultiply