Оптимизированная реализация GPU пакетной матрицы умножается на операцию добавления
[ выполняет матрично-матричное умножение и сложение пакета матриц D1,D2] = gpucoder.batchedMatrixMultiplyAdd(A1,B1,C1,A2,B2,C2)A1,B1,C1 и A2,B2,C2. gpucoder.batchedMatrixMultiplyAdd функция выполняет матрично-матричное умножение вида:
+ βC
где и - коэффициенты скалярного умножения и A, B, C, и D - матрицы с размерами mоколо-k, kоколо-n, mоколо-n, и mоколо-n соответственно.A и B необязательно может быть транспонированным или эрмитово-сопряженным. По умолчанию и равны единице, и матрицы не транспонируются. Чтобы задать другой коэффициент скалярного умножения и выполнить операции транспонирования для входных матриц, используйте Name,Value аргументы пары.
Все пакеты, переданные в gpucoder.batchedMatrixMultiplyAdd функция должна быть однородной. То есть все экземпляры должны иметь одинаковые размеры m,n,k.
___ = gpucoder.batchedMatrixMultiplyAdd(___, выполняет пакетное умножение матрицы и операцию сложения с использованием опций, заданных одним или несколькими Name,Value)Name,Value аргументы пары.
codegen | coder.gpu.kernel | coder.gpu.kernelfun | gpucoder.batchedMatrixMultiply | gpucoder.stridedMatrixMultiply | gpucoder.stridedMatrixMultiplyAdd