我想我对 CUDA 编程模型和一般编程很陌生。我正在尝试并行化期望最大化算法。我正在研究具有计算能力 2.0 的 gtx 480。起初,我有点认为设备没有理由启动自己的线程,但当然,我错了。我遇到了这个pdf。
http://docs.nvidia.com/cuda/pdf/CUDA_Dynamic_Parallelism_Programming_Guide.pdf
不幸的是,动态并行只适用于最新最好的 GPU,计算能力为 3.5。如果不深入探讨太多细节,动态并行的替代方案是什么?CPU EM 算法中的循环有很多依赖关系并且是高度嵌套的,这似乎使动态并行性成为一种有吸引力的能力。我不确定我的问题是否有意义,所以请询问您是否需要澄清。
谢谢!