Оптимизированная реализация GPU полосатой пакетной матрицы умножается на операцию добавления
выполняет пошаговое матрично-матричное умножение и сложение партии матриц. Входные матрицы D = gpucoder.stridedMatrixMultiplyAdd(A,B,C)A, B, и C для каждого экземпляра пакета расположены в фиксированных смещениях адресов от их адресов в предыдущем экземпляре. gpucoder.stridedMatrixMultiplyAdd функция выполняет матрично-матричное умножение вида:
+ βC
где и - коэффициенты скалярного умножения, A, B, C, и D - матрицы с размерами mоколо-k, kоколо-n, mоколо-n, и mоколо-n соответственно. A и B необязательно может быть транспонированным или эрмитово-сопряженным. По умолчанию и равны единице, и матрицы не транспонируются. Чтобы задать другой коэффициент скалярного умножения и выполнить операции транспонирования для входных матриц, используйте Name,Value аргументы пары.
Все пакеты, переданные в gpucoder.stridedMatrixMultiplyAdd функция должна быть однородной. То есть все экземпляры должны иметь одинаковые размеры m,n,k.
___ = gpucoder.stridedMatrixMultiplyAdd(___, выполняет пакетное умножение матрицы и операцию сложения с использованием опций, заданных одним или несколькими Name,Value)Name,Value аргументы пары.
codegen | coder.gpu.kernel | coder.gpu.kernelfun | gpucoder.batchedMatrixMultiply | gpucoder.batchedMatrixMultiplyAdd | gpucoder.stridedMatrixMultiply