Оптимизированная реализация GPU операции штрихового и пакетного матричного умножения
выполняет штриховое матрично-матричное умножение пакета матриц. Матрицы входа D
= gpucoder.stridedMatrixMultiply(A
,B
)A
и B
для каждого образца пакета расположены смещения фиксированного адреса от их адресов в предыдущем образце. gpucoder.stridedMatrixMultiply
функция выполняет матрично-матричное умножение вида:
где является скалярным коэффициентом умножения, A
, B
, и D
являются матрицами с размерностями m
-by- k
, k
-by- n
, и m
-by- n
соответственно. Можно опционально транспонировать или гермито-сопряженную A
и B
. По умолчанию, установлено на единицу, и матрицы не транспонированы. Чтобы задать другой скалярный коэффициент умножения и выполнить операции транспонирования на входных матрицах, используйте Name,Value
аргументы в виде пар.
Все пакеты переданы в gpucoder.stridedMatrixMultiply
функция должна быть равномерной. То есть все образцы должны иметь одинаковые размерности m,n,k
.
___ = gpucoder.stridedMatrixMultiply(___,
выполняет операцию умножения полосатых пакетных матриц с помощью опций, заданных одним или несколькими Name,Value
)Name,Value
аргументы в виде пар.
codegen
| coder.gpu.kernel
| coder.gpu.kernelfun
| gpucoder.batchedMatrixMultiply
| gpucoder.batchedMatrixMultiplyAdd
| gpucoder.stridedMatrixMultiplyAdd