3

我已经为其他应用程序这样做了,但由于某种原因,它在我当前的应用程序中不起作用。

这是一个代码片段,在 VS2010 中工作,使用 Cuda 4.2。我已经在 VS 内部和 VS 外部编译了 ptx 文件,但没有解决问题:

CUmodule    Module = NULL;
int rc7 = cuModuleLoad(&Module, CubinName);  // needs bin
if (rc7 == 0)  {
    rc = cuModuleGetFunction( &cuF_makeProcFrame, Module, "makeProcFrame" );
}

我得到 rc=500 -- 找不到函数。

当我在文本编辑器中打开 ptx 文件时,我看到:

.entry _Z13makeProcFrame14cudaPitchedPtriiii(
    .param .align 4 .b8 _Z13makeProcFrame14cudaPitchedPtriiii_param_0[16],
    .param .u32 _Z13makeProcFrame14cudaPitchedPtriiii_param_1,
    .param .u32 _Z13makeProcFrame14cudaPitchedPtriiii_param_2,
    .param .u32 _Z13makeProcFrame14cudaPitchedPtriiii_param_3,
    .param .u32 _Z13makeProcFrame14cudaPitchedPtriiii_param_4
 )

最后在 CUDA 代码本身中是被调用的行:

__global__ void makeProcFrame(
                    cudaPitchedPtr YProcBasePtr, 
                    int numFrames, 
                    int width,
                    int height,
                    int lineBytes
            ) 

谁能告诉我为什么我得到错误返回而不是找到函数?


编辑:这是编译的批处理文件:

"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v4.2\bin\nvcc.exe" -gencode=arch=compute_20,code=sm_20 -ccbin "C:\Program Files (x86)\Microsoft Visual Studio 10.0 \VC\bin" -I"C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v4.2\include" -O -G --machine 32 --maxrregcount=0 -ptx -o="filterKernelHand.ptx"过滤内核.cu

4

1 回答 1

7

声明 CUDA 内核时使用 "extern "C"" - 这样编译器就不会破坏函数名。

于 2012-09-25T21:25:18.247 回答