我正在尝试一些 OpenCL,并想知道是否有办法将函数作为参数传递给内核,或者最接近的可用匹配项是什么(使用 OpenCL 1.2)。
例如,考虑一个简单的蒙特卡洛积分,如下所示:
/* this is 1/(2^32) */
#define MULTI (2.3283064365386962890625e-10)
/* for more information see: https://arxiv.org/pdf/2004.06278v2.pdf*/
uint
squares(ulong ctr, ulong key)
{
ulong x, y, z;
y = x = ctr * key;
z = y + key;
x = x * x + y;
x = (x >> 32) | (x << 32); /* round 1 */
x = x * x + z; x = (x >> 32) | (x << 32); /* round 2 */
return (x * x + y) >> 32; /* round 3 */
}
void
kernel
reduce(ulong key,
float low,
float high,
global float* partialSums,
local float* localSums)
{
uint lid = get_local_id(0);
float rand = squares(get_global_id(0), key) * MULTI;
localSums[lid] = f((rand * (high - low)) + low);
for (uint stride = get_local_size(0) / 2; stride > 0; stride /= 2) {
barrier(CLK_LOCAL_MEM_FENCE);
if (lid < stride)
localSums[lid] += localSums[lid + stride];
}
if (lid == 0)
partialSums[get_group_id(0)] = localSums[0];
}
我发现在 OpenCL 中将函数作为参数传递,它告诉我传递函数指针不起作用。所以我猜想在运行时生成带有 f 定义的内核源然后编译它会起作用(以前是否做过?如果是这样,我在哪里可以找到它?)。也许这种问题不使用 OpenCL 而是使用 SYCL(我几乎一无所知)更容易解决?
我对此比较陌生,所以如果这种问题以完全不同的方式解决,请告诉我。