opencl - 将内核全局缓冲区传递给 OpenCL 中的本地函数

Question

假设我们有一个核函数：

kernel void function(global const float* a, global const float* b, global float* c, int nElements)
{
...
c[gid] = a[gid] * b[gid];
}

但想将一个大的复杂内核分解成几个较小的函数。如何将全局缓冲区传递给这些较小的函数？

如果我执行以下操作，我会收到形式为“函数 'cl_axpbyr' 的隐式声明在 OpenCL 中无效”的错误：

kernel void function(global const float* a, global const float* b, global float* c, int     nElements)
{
...
cl_axpbyr(1.0f, a, c, nElements);
}

inline void cl_axpy(float alpha, global const float* x, global float* y, int nElements)
{
int gid = get_global_id(0);
if (gid >= nElements)
 {
      return;
 } 
y[gid] = alpha*x[gid] + y[gid];
}

score 1 · Accepted Answer

首先你称之为：

cl_axpbyr(1.0f, a, c, nElements);

虽然您的功能是：

inline void cl_axpy

您应该调用 cl_axpy 而不是 cl_axpbyr

其次，OpenCL 内核语言只是 C。因此，如果要在要调用它们的位置之后定义函数，则需要预先声明函数。以下代码编译干净：

// This is the normal C style function declaration which must exist
inline void cl_axpy(float alpha, global const float* x, global float* y, int nElements);


kernel void function(global const float* a, global const float* b, global float* c, int     nElements)
{
cl_axpy(1.0f, a, c, nElements);
}


inline void cl_axpy(float alpha, global const float* x, global float* y, int nElements)
{
int gid = get_global_id(0);
if (gid >= nElements)
  {
      return;
  } 
y[gid] = alpha*x[gid] + y[gid];
}

您也可以将整个 cl_axpy 放在内核定义之前。两种方式都可以正常工作。

opencl - 将内核全局缓冲区传递给 OpenCL 中的本地函数

1 回答 1

Related

Reference