struct - OpenCL floatn 与自定义结构有何不同

Question

我在将向量结构传递给 OpenCL 内核时遇到问题。

长话短说，我发现我可以通过 C 结构：

typedef struct {
    cl_float4 vec;
} my_type;

. . . 到内核，如果我这样声明：

typedef struct { float s[4]; } my_float4;
typedef struct { my_float4 vec; } my_type; //use custom float4
__kernel void function(const my_type test) {}

. . . 但不是，如果我这样声明：

typedef struct { float4 vec; } my_type; //use built-in float4
__kernel void function(const my_type test) {}

所以我的问题是，是什么让 float4 与众不同？在第二个示例中，我在 clSetKernelArg 上获得 CL_INVALID_ARG_SIZE。在主机代码中，我使用的是 cl_float4——它不应该与内核中的 float4 配对吗？

编辑：根据要求，clSetKernelArg 代码（错误处理被裁剪）：

template <typename type_data> void set_argument(int arg_index, const type_data* data) {
    cl_int err = clSetKernelArg(kernel,arg_index,sizeof(type_data),data);
    if (err!=CL_SUCCESS) throw "ERROR"; /*simplified*/
}

我使用与上面完全一样声明的结构调用该函数：

my_type test;
my_kernel->set_argument(0,&test);

score 3 · Accepted Answer

这听起来像是你的实现的一个错误——你应该能够毫无问题地将该用户定义的类型传递给内核。您使用的是什么平台/SDK？我能够在主机代码中成功声明这种类型：

typedef struct _mytype {
    cl_float4 val;
} mytype;

...然后稍后使用它：

mytype t;
status = clSetKernelArg(kernel, argc++, sizeof(mytype), &t);
check_status("clSetKernelArg:mytype t", status);

check_status 执行您所期望的操作：检查非CL_SUCCESS返回值。

内核看起来像这样：

typedef struct _mytype {
  float4 value;
} mytype;

kernel void do_it(/* ... */, const mytype test) { /* ... */ }

这会编译并执行，在 CPU 设备上给出正确的结果。

struct - OpenCL floatn 与自定义结构有何不同

1 回答 1

Related

Reference