在 CUDA 中,有、 、__ballot()
和__any()
一堆lanemask 函数可以在warp 内的所有lane(通常大小为32)上执行warp 投票操作。我想知道 OpenCL 中是否有任何此类功能可以在一个波前执行相同的操作。如果没有这样的函数,我可能需要自己将它们实现为内联函数以在我的项目中使用。__all()
__popc()
问问题
1344 次
2 回答
3
根据OpenCL v. 1.1 规范,第 6.11 节“内置函数”,我相信答案是否定的。
但是在 NVIDIA GPU 上,您可能可以使用 inline PTX 来实现这些东西(或者至少这个博主能够使用 inline PTX)。
于 2012-07-11T23:36:30.850 回答