Оптимизированная реализация GPU операции штрихового и пакетного матричного умножения
выполняет штриховое матрично-матричное умножение пакета матриц. Матрицы входа D = gpucoder.stridedMatrixMultiply(A,B)A и B для каждого образца пакета расположены смещения фиксированного адреса от их адресов в предыдущем образце. gpucoder.stridedMatrixMultiply функция выполняет матрично-матричное умножение вида:
где является скалярным коэффициентом умножения, A, B, и D являются матрицами с размерностями m-by- k, k-by- n, и m-by- n соответственно. Можно опционально транспонировать или гермито-сопряженную A и B. По умолчанию, установлено на единицу, и матрицы не транспонированы. Чтобы задать другой скалярный коэффициент умножения и выполнить операции транспонирования на входных матрицах, используйте Name,Value аргументы в виде пар.
Все пакеты переданы в gpucoder.stridedMatrixMultiply функция должна быть равномерной. То есть все образцы должны иметь одинаковые размерности m,n,k.
___ = gpucoder.stridedMatrixMultiply(___, выполняет операцию умножения полосатых пакетных матриц с помощью опций, заданных одним или несколькими Name,Value)Name,Value аргументы в виде пар.
codegen | coder.gpu.kernel | coder.gpu.kernelfun | gpucoder.batchedMatrixMultiply | gpucoder.batchedMatrixMultiplyAdd | gpucoder.stridedMatrixMultiplyAdd