0

cublas中是否有元素乘法?我正在尝试执行这些 Matlab 操作

x .* s
x ./ s

我有使用 for 循环和另一个 CUDA 的主机实现,但我想知道我是否错过了可以以优化方式完成它的 cublas 库函数。

这是我的 CUDA 内核

__global__ void elementMul(double *A, double *B, double *C){
           int i = threadIdx.x;
           C[i] = A[i] * B[i];
       }    
4

0 回答 0