嗨,我正在使用 cuBLAS 进行一些矩阵运算。
有时,我需要获取或设置单个矩阵元素。根据 cuBLAS 文档,矩阵分配如下:
cudaMalloc((void**)&pArrayDev,sizeof(float)*numRows*numCols);
cublasSetMatrix(numRows,numCols,sizeof(float),pArray,numRows,pArrayDev,numRows);
现在,如果我只需要更改一个元素,我可以使用 cudaMemset 之类的东西吗?从主机代码执行此操作的正确方法是什么?每次只更改一个元素时,我都不想将整个数组从主机复制到设备。