我一直在谷歌搜索,并且只能在从此处链接的技术简报之一中找到 Compute Capability 3.0 中新动态并行性的一个简单示例。我知道 HPC 专用卡可能要到明年这个时候才可用(在 nat'l 实验室得到他们的之后)。是的,我意识到他们给出的简单示例足以让您继续前进,但越多越好。
还有其他我错过的例子吗?
为了省去您的麻烦,以下是技术简介中给出的完整示例:
__global__ ChildKernel(void* data){
//Operate on data
}
__global__ ParentKernel(void *data){
ChildKernel<<<16, 1>>>(data);
}
// In Host Code
ParentKernel<<<256, 64>>(data);
// Recursion is also supported
__global__ RecursiveKernel(void* data){
if(continueRecursion == true)
RecursiveKernel<<<64, 16>>>(data);
}
编辑:GTC 谈论CUDA 编程模型中的新功能主要关注 CUDA 5 中的新动态并行。该链接包含视频和幻灯片。仍然只是玩具示例,但比上面的技术简介要详细得多。