Оптимизированная реализация графический процессор пакетной матрицы умножает с операцией add
[ выполняет матрично-матричное умножение и добавление пакета матриц D1,D2] = gpucoder.batchedMatrixMultiplyAdd(A1,B1,C1,A2,B2,C2)A1,B1,C1 и A2,B2,C2. gpucoder.batchedMatrixMultiplyAdd функция выполняет матрично-матричное умножение вида:
где и являются скалярными коэффициентами умножения и A, B, C, и D являются матрицами с размерностями m-by- k, k-by- n, m-by- n, и m-by- n соответственно. A и B необязательно может быть транспонирована или конъюгирована с гермитами. По умолчанию, и установлены в единицу, и матрицы не транспонированы. Чтобы задать другой скалярный коэффициент умножения и выполнить операции транспонирования на входных матрицах, используйте Name,Value аргументы в виде пар.
Все пакеты переданы в gpucoder.batchedMatrixMultiplyAdd функция должна быть равномерной. То есть все образцы должны иметь одинаковые размерности m,n,k.
___ = gpucoder.batchedMatrixMultiplyAdd(___, выполняет пакетное умножение матрицы и добавление операции с помощью опций, заданных одним или несколькими Name,Value)Name,Value аргументы в виде пар.
codegen | coder.gpu.kernel | coder.gpu.kernelfun | gpucoder.batchedMatrixMultiply | gpucoder.stridedMatrixMultiply | gpucoder.stridedMatrixMultiplyAdd