Оптимизированная реализация GPU пакетной операции умножения матриц
[ выполняет матрично-матричное умножение пакета матриц D1,D2] = gpucoder.batchedMatrixMultiply(A1,B1,A2,B2)A1,B1 и A2,B2. gpucoder.batchedMatrixMultiply функция выполняет матрично-матричное умножение вида:
αАВ
где - коэффициент скалярного умножения, A, B, и D - матрицы с размерами mоколо-k, kоколо-n, и mоколо-n соответственно. Можно необязательно транспонировать или эрмитово-конъюгатные A и B. По умолчанию устанавливается равным единице, и матрицы не транспонируются. Чтобы задать другой коэффициент скалярного умножения и выполнить операции транспонирования для входных матриц, используйте Name,Value аргументы пары.
Все пакеты, переданные в gpucoder.batchedMatrixMultiply функция должна быть однородной. То есть все экземпляры должны иметь одинаковые размеры m,n,k.
___ = gpucoder.batchedMatrixMultiply(___, выполняет операцию умножения пакетной матрицы с использованием опций, заданных одним или несколькими Name,Value)Name,Value аргументы пары.
codegen | coder.gpu.kernel | coder.gpu.kernelfun | gpucoder.batchedMatrixMultiplyAdd | gpucoder.stridedMatrixMultiply | gpucoder.stridedMatrixMultiplyAdd