Оптимизированная реализация графического процессора strided, обработанного в пакетном режиме, умножение матриц с, добавляет операция
выполняет strided матричное умножение матриц, и добавьте пакета матриц. Входные матрицы D = gpucoder.stridedMatrixMultiplyAdd(A,B,C)AB, и C поскольку каждый экземпляр пакета расположен при фиксированных смещениях адреса от их адресов в предыдущем экземпляре. gpucoder.stridedMatrixMultiplyAdd функция выполняет матричное умножение матриц формы:
где и факторы скалярного умножения, ABC, и D матрицы с размерностями m- kK- nM- n, и m- n соответственно. A и B может опционально транспонироваться или спрягаться эрмитовым образом. По умолчанию, и установлены в одного, и матрицы не транспонированы. Чтобы задать различный фактор скалярного умножения и выполнить транспонируют операции на входных матрицах, используют Name,Value парные аргументы.
Все пакеты передали gpucoder.stridedMatrixMultiplyAdd функция должна быть универсальной. Таким образом, все экземпляры должны иметь те же размерности m,n,k.
___ = gpucoder.stridedMatrixMultiplyAdd(___, выполняет обработанный в пакетном режиме, умножение матриц и добавляют операцию при помощи опций, заданных одним или несколькими Name,Value)Name,Value парные аргументы.
codegen | coder.gpu.kernel | coder.gpu.kernelfun | gpucoder.batchedMatrixMultiply | gpucoder.batchedMatrixMultiplyAdd | gpucoder.stridedMatrixMultiply