我正在尝试实现简单的动态并行编程示例,例如..
__global__ ChildKernel(void* data){
//Operate on data
}
__global__ ParentKernel(void *data){
ChildKernel<<<16, 1>>>(data);
}
// In Host Code
ParentKernel<<<256, 64>>(data);
他们说它在 CUDA 5.0 及更高版本中受支持。我安装了 CUDA 5.0 并在我的系统上运行,但是 GTX 550 Ti 的设备是否支持动态并行?谢谢你。