Оптимизированная реализация GPU операции умножения пакетных матриц
[
выполняет матрично-матричное умножение пакета матриц D
1,D
2] = gpucoder.batchedMatrixMultiply(A
1,B
1,A
2,B
2)A1,B1
и A2,B2
. gpucoder.batchedMatrixMultiply
функция выполняет матрично-матричное умножение вида:
где является скалярным коэффициентом умножения, A
, B
, и D
являются матрицами с размерностями m
-by- k
, k
-by- n
, и m
-by- n
соответственно. Можно опционально транспонировать или гермито-сопряженную A
и B
. По умолчанию, установлено на единицу, и матрицы не транспонированы. Чтобы задать другой скалярный коэффициент умножения и выполнить операции транспонирования на входных матрицах, используйте Name,Value
аргументы в виде пар.
Все пакеты переданы в gpucoder.batchedMatrixMultiply
функция должна быть равномерной. То есть все образцы должны иметь одинаковые размерности m,n,k
.
___ = gpucoder.batchedMatrixMultiply(___,
выполняет операцию умножения пакетной матрицы с помощью опций, заданных одним или несколькими Name,Value
)Name,Value
аргументы в виде пар.
codegen
| coder.gpu.kernel
| coder.gpu.kernelfun
| gpucoder.batchedMatrixMultiplyAdd
| gpucoder.stridedMatrixMultiply
| gpucoder.stridedMatrixMultiplyAdd