我正在使用动态并行性来实现一个程序。每当我编译代码时,它都会抛出致命错误,如下所示:
ptxas fatal : Unresolved extern function 'cudaGetParameterBuffer'
编译如下:
nvcc -o dyn_par dyn_par.cu -arch=sm_35
如何解决?
这cudaGetParameterBuffer
是cudadevrt
您需要在编译器命令中指定并指定--relocatable-device-code
为 true的库的一部分
nvcc -o dyn_par dyn_par.cu -arch=sm_35 -lcudadevrt --relocatable-device-code true
查看来自 Nvidia 的CUDA Dynamic Parallelism Programming Guide(第 21 页描述了上述内容)以获取更多信息