Оптимизированная реализация графический процессор пакетной матрицы умножает с операцией add
[
выполняет матрично-матричное умножение и добавление пакета матриц D
1,D
2] = gpucoder.batchedMatrixMultiplyAdd(A
1,B
1,C
1,A
2,B
2,C
2)A1,B1,C1
и A2,B2,C2
. gpucoder.batchedMatrixMultiplyAdd
функция выполняет матрично-матричное умножение вида:
где и являются скалярными коэффициентами умножения и A
, B
, C
, и D
являются матрицами с размерностями m
-by- k
, k
-by- n
, m
-by- n
, и m
-by- n
соответственно. A
и B
необязательно может быть транспонирована или конъюгирована с гермитами. По умолчанию, и установлены в единицу, и матрицы не транспонированы. Чтобы задать другой скалярный коэффициент умножения и выполнить операции транспонирования на входных матрицах, используйте Name,Value
аргументы в виде пар.
Все пакеты переданы в gpucoder.batchedMatrixMultiplyAdd
функция должна быть равномерной. То есть все образцы должны иметь одинаковые размерности m,n,k
.
___ = gpucoder.batchedMatrixMultiplyAdd(___,
выполняет пакетное умножение матрицы и добавление операции с помощью опций, заданных одним или несколькими Name,Value
)Name,Value
аргументы в виде пар.
codegen
| coder.gpu.kernel
| coder.gpu.kernelfun
| gpucoder.batchedMatrixMultiply
| gpucoder.stridedMatrixMultiply
| gpucoder.stridedMatrixMultiplyAdd