Оптимизированная реализация графического процессора пакетных умножение матриц с, добавляет операция
[
выполняет матричное умножение матриц, и добавьте пакета матриц D
1,D
2] = gpucoder.batchedMatrixMultiplyAdd(A
1,B
1,C
1,A
2,B
2,C
2)A1,B1,C1
и A2,B2,C2
. gpucoder.batchedMatrixMultiplyAdd
функция выполняет матричное умножение матриц формы:
где и факторы скалярного умножения и A
B
C
, и D
матрицы с размерностями m
- k
K
- n
M
- n
, и m
- n
соответственно. A
и B
может опционально транспонироваться или спрягаться эрмитовым образом. По умолчанию, и установлены в одного, и матрицы не транспонированы. Чтобы задать различный фактор скалярного умножения и выполнить транспонируют операции на входных матрицах, используют Name,Value
парные аргументы.
Все пакеты передали gpucoder.batchedMatrixMultiplyAdd
функция должна быть универсальной. Таким образом, все экземпляры должны иметь те же размерности m,n,k
.
___ = gpucoder.batchedMatrixMultiplyAdd(___,
выполняет обработанный в пакетном режиме, умножение матриц и добавляют операцию при помощи опций, заданных одним или несколькими Name,Value
)Name,Value
парные аргументы.
codegen
| coder.gpu.kernel
| coder.gpu.kernelfun
| gpucoder.batchedMatrixMultiply
| gpucoder.stridedMatrixMultiply
| gpucoder.stridedMatrixMultiplyAdd