我已经为其他应用程序这样做了,但由于某种原因,它在我当前的应用程序中不起作用。
这是一个代码片段,在 VS2010 中工作,使用 Cuda 4.2。我已经在 VS 内部和 VS 外部编译了 ptx 文件,但没有解决问题:
CUmodule Module = NULL;
int rc7 = cuModuleLoad(&Module, CubinName); // needs bin
if (rc7 == 0) {
rc = cuModuleGetFunction( &cuF_makeProcFrame, Module, "makeProcFrame" );
}
我得到 rc=500 -- 找不到函数。
当我在文本编辑器中打开 ptx 文件时,我看到:
.entry _Z13makeProcFrame14cudaPitchedPtriiii(
.param .align 4 .b8 _Z13makeProcFrame14cudaPitchedPtriiii_param_0[16],
.param .u32 _Z13makeProcFrame14cudaPitchedPtriiii_param_1,
.param .u32 _Z13makeProcFrame14cudaPitchedPtriiii_param_2,
.param .u32 _Z13makeProcFrame14cudaPitchedPtriiii_param_3,
.param .u32 _Z13makeProcFrame14cudaPitchedPtriiii_param_4
)
最后在 CUDA 代码本身中是被调用的行:
__global__ void makeProcFrame(
cudaPitchedPtr YProcBasePtr,
int numFrames,
int width,
int height,
int lineBytes
)
谁能告诉我为什么我得到错误返回而不是找到函数?
编辑:这是编译的批处理文件:
"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v4.2\bin\nvcc.exe" -gencode=arch=compute_20,code=sm_20 -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 10.0 \VC\bin" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v4.2\include" -O -G --machine 32 --maxrregcount=0 -ptx -o="filterKernelHand.ptx"过滤内核.cu