1

我正在尝试使用cublasSaxpycublas 的功能。

看代码:

#include <cublas_v2.h>

float *dev_B;
float *dev_tmp;

cublasStatus_t stat ;
cublasHandle_t handle ;
...
...
stat = cublasCreate(&handle);
if(stat != CUBLAS_STATUS_SUCCESS)
{
    cout << "CUBLAS Initialization failed!" << endl;
    exit(EXIT_FAILURE);
}
...
...
stat = cublasSetVector(N, sizeof(float), vB, N, dev_B, N);
if(stat != CUBLAS_STATUS_SUCCESS)
{
    cout << "CUBLAS setting vector failed" << endl;
    exit(EXIT_FAILURE);
}

stat = cublasSetVector(N, sizeof(float), nullvec, N, dev_tmp, N);
if(stat != CUBLAS_STATUS_SUCCESS)
{
    cout << "CUBLAS setting vector failed" << endl;
    exit(EXIT_FAILURE);
}
...
...
stat = cublasSaxpy(handle, N, 1.0f, dev_B, 1, dev_tmp, 1);

所以,我正在使用来自 CUDA 5.0 RC1 的 eclipse nsight。我没有构建项目,因为我没有完成它,但是 IDE 在 saxpy 操作中给了我一个读取下划线:

Invalid arguments '
Candidates are:
enum {cublas_api.h:3039} cublasSaxpy_v2(cublasContext *, int, const float *, const float *, int, float *, int)
4

1 回答 1

3

在 CUBLAS V2 API 中,所有标量实参都通过引用而不是值传递。正确的要求saxpy是这样的:

const float alpha = 1.0f;
stat = cublasSaxpy(handle, N, &alpha, dev_B, 1, dev_tmp, 1);

这在文档中有明确的讨论。

于 2012-09-15T05:28:20.563 回答