Оптимизированная реализация графического процессора strided, обработанного в пакетном режиме, умножение матриц с, добавляет операция
выполняет strided матричное умножение матриц, и добавьте пакета матриц. Входные матрицы D = gpucoder.stridedMatrixMultiplyAdd(A,B,C)AB, и C поскольку каждый экземпляр пакета расположен при фиксированных смещениях адреса от их адресов в предыдущем экземпляре. gpucoder.stridedMatrixMultiplyAdd выполняет матричное умножение матриц формы:
где и факторы скалярного умножения, ABC, и D матрицы с размерностями m- kK- nM- n, и m- n соответственно. AB, и C может опционально транспонироваться или спрягаться эрмитовым образом. По умолчанию, и установлены в одного, и матрицы не транспонированы. Используйте Name,Value парные аргументы, чтобы задать различный фактор скалярного умножения и задать транспонируют операции на входных матрицах.
Все пакеты передали gpucoder.stridedMatrixMultiplyAdd функция должна быть универсальной. Таким образом, все экземпляры должны иметь те же размерности m,n,k.
___ = gpucoder.stridedMatrixMultiplyAdd(___, выполняет обработанный в пакетном режиме, умножение матриц и добавляют операцию с помощью опций, заданных одним или несколькими Name,Value)Name,Value парные аргументы.
coder.gpu.constantMemory | coder.gpu.kernel | coder.gpu.kernelfun | gpucoder.batchedMatrixMultiply | gpucoder.batchedMatrixMultiplyAdd | gpucoder.sort | gpucoder.stencilKernel | gpucoder.stridedMatrixMultiply