-3

我有一个包含 nx1 个项目的向量 V 和一个包含 nxm 个项目的矩阵 M。我想用 CUDA 将 V 与 M 的所有列相加。THRUST 或 CUBLAS 中是否有任何方法可以帮助我解决问题?

4

1 回答 1

1

在这里我用两个反对票做了什么

thrust::device_vector<float> dummy_y(N,1);
alpha = 1.0f;
beta = 0.0f;
stat = cublasSger_v2(handle,K,N,&alpha,thrust::raw_pointer_cast(&dummy_y[0]),1,thrust::raw_pointer_cast(&A_sum_vec_d[0]),1,thrust::raw_pointer_cast(&C_d[0]),K);

我通过将行向量乘以充满 1 的行向量来复制列向量,如矩阵的大小和与 的总和cublasSgerstat正在保持代码的执行状态,您可以检查任何可能的错误。

于 2013-06-28T17:13:48.503 回答