cublas中是否有元素乘法?我正在尝试执行这些 Matlab 操作
x .* s
x ./ s
我有使用 for 循环和另一个 CUDA 的主机实现,但我想知道我是否错过了可以以优化方式完成它的 cublas 库函数。
这是我的 CUDA 内核
__global__ void elementMul(double *A, double *B, double *C){
int i = threadIdx.x;
C[i] = A[i] * B[i];
}