Оптимизированная реализация графического процессора strided, обработанного в пакетном режиме, умножение матриц с, добавляет операция
выполняет strided матричное умножение матриц, и добавьте пакета матриц. Входные матрицы D
= gpucoder.stridedMatrixMultiplyAdd(A
,B
,C
)A
B
, и C
поскольку каждый экземпляр пакета расположен при фиксированных смещениях адреса от их адресов в предыдущем экземпляре. gpucoder.stridedMatrixMultiplyAdd
функция выполняет матричное умножение матриц формы:
где и факторы скалярного умножения, A
B
C
, и D
матрицы с размерностями m
- k
K
- n
M
- n
, и m
- n
соответственно. A
и B
может опционально транспонироваться или спрягаться эрмитовым образом. По умолчанию, и установлены в одного, и матрицы не транспонированы. Чтобы задать различный фактор скалярного умножения и выполнить транспонируют операции на входных матрицах, используют Name,Value
парные аргументы.
Все пакеты передали gpucoder.stridedMatrixMultiplyAdd
функция должна быть универсальной. Таким образом, все экземпляры должны иметь те же размерности m,n,k
.
___ = gpucoder.stridedMatrixMultiplyAdd(___,
выполняет обработанный в пакетном режиме, умножение матриц и добавляют операцию при помощи опций, заданных одним или несколькими Name,Value
)Name,Value
парные аргументы.
codegen
| coder.gpu.kernel
| coder.gpu.kernelfun
| gpucoder.stridedMatrixMultiply
| gpucoder.batchedMatrixMultiply
| gpucoder.batchedMatrixMultiplyAdd