在 CUDA 中,有、 、__ballot()和__any()一堆lanemask 函数可以在warp 内的所有lane(通常大小为32)上执行warp 投票操作。我想知道 OpenCL 中是否有任何此类功能可以在一个波前执行相同的操作。如果没有这样的函数,我可能需要自己将它们实现为内联函数以在我的项目中使用。__all()__popc()
			
			1344 次
		
2 回答
            3        
        
		
根据OpenCL v. 1.1 规范,第 6.11 节“内置函数”,我相信答案是否定的。
但是在 NVIDIA GPU 上,您可能可以使用 inline PTX 来实现这些东西(或者至少这个博主能够使用 inline PTX)。
于 2012-07-11T23:36:30.850   回答