Оптимизированная реализация GPU операции умножения пакетных матриц
[ выполняет матрично-матричное умножение пакета матриц D1,D2] = gpucoder.batchedMatrixMultiply(A1,B1,A2,B2)A1,B1 и A2,B2. gpucoder.batchedMatrixMultiply функция выполняет матрично-матричное умножение вида:
где является скалярным коэффициентом умножения, A, B, и D являются матрицами с размерностями m-by- k, k-by- n, и m-by- n соответственно. Можно опционально транспонировать или гермито-сопряженную A и B. По умолчанию, установлено на единицу, и матрицы не транспонированы. Чтобы задать другой скалярный коэффициент умножения и выполнить операции транспонирования на входных матрицах, используйте Name,Value аргументы в виде пар.
Все пакеты переданы в gpucoder.batchedMatrixMultiply функция должна быть равномерной. То есть все образцы должны иметь одинаковые размерности m,n,k.
___ = gpucoder.batchedMatrixMultiply(___, выполняет операцию умножения пакетной матрицы с помощью опций, заданных одним или несколькими Name,Value)Name,Value аргументы в виде пар.
codegen | coder.gpu.kernel | coder.gpu.kernelfun | gpucoder.batchedMatrixMultiplyAdd | gpucoder.stridedMatrixMultiply | gpucoder.stridedMatrixMultiplyAdd