Оптимизированная реализация GPU операции дробного и пакетного умножения матриц
выполняет пошаговое матрично-матричное умножение партии матриц. Входные матрицы D = gpucoder.stridedMatrixMultiply(A,B)A и B для каждого экземпляра пакета расположены в фиксированных смещениях адресов от их адресов в предыдущем экземпляре. gpucoder.stridedMatrixMultiply функция выполняет матрично-матричное умножение вида:
αАВ
где - коэффициент скалярного умножения, A, B, и D - матрицы с размерами mоколо-k, kоколо-n, и mоколо-n соответственно. Можно необязательно транспонировать или эрмитово-конъюгатные A и B. По умолчанию устанавливается равным единице, и матрицы не транспонируются. Чтобы задать другой коэффициент скалярного умножения и выполнить операции транспонирования для входных матриц, используйте Name,Value аргументы пары.
Все пакеты, переданные в gpucoder.stridedMatrixMultiply функция должна быть однородной. То есть все экземпляры должны иметь одинаковые размеры m,n,k.
___ = gpucoder.stridedMatrixMultiply(___, выполняет операцию умножения полосатой матрицы с использованием опций, заданных одним или несколькими Name,Value)Name,Value аргументы пары.
codegen | coder.gpu.kernel | coder.gpu.kernelfun | gpucoder.batchedMatrixMultiply | gpucoder.batchedMatrixMultiplyAdd | gpucoder.stridedMatrixMultiplyAdd