1

以下 C++ 和 OpenCL 给出的“结果”为 3 而不是预期的 9 (3+6),我不知道为什么。我的意图只是通过使用数组索引并在两个不同的数组索引处添加数字来测试访问以给出“结果”。鉴于我是 C、C++ 和 OpenCL 的新手,这很可能是基本的东西。另外,我使用向量作为输入是有原因的——这是我需要在更大范围内做的事情的试运行。非常感谢。

C++:

    vector<long> v1;
    vector<long> v2;
    long result;

    v1.push_back(3);
    v1.push_back(4);

    v2.push_back(5);
    v2.push_back(6);

    long* a1 = &v1[0];
    long* a2 = &v2[0];

    cl::Buffer bufA(context, CL_MEM_READ_ONLY | CL_MEM_USE_HOST_PTR, v1.size()*sizeof(long), a1);
    cl::Buffer bufB(context, CL_MEM_READ_ONLY | CL_MEM_USE_HOST_PTR, v2.size()*sizeof(long), a2);
    cl::Buffer bufC(context, CL_MEM_READ_WRITE, sizeof(long));

    addKernel.setArg(0, bufA);
    addKernel.setArg(1, bufB);
    addKernel.setArg(2, bufC);

    cl::CommandQueue queue(context, devices[0]);

    queue.enqueueTask(addKernel);

    queue.enqueueReadBuffer(bufC, CL_TRUE, 0, sizeof(long), &result);
    queue.flush();
    queue.finish();

    cout << "Result: " << result << endl;

开放式CL:

__kernel void useHostPtr(__global long *a, __global long *b, __global long *c) {
    *c = a[0] + b[1];
}
4

1 回答 1

1

主机端的long类型可能有不同的长度。它通常是 4 个字节。在 OpenCL 中,long被定义为 64 位整数。您应该在主机代码中使用cl_long而不是。long

于 2012-09-14T20:16:20.487 回答