0

下午好!我正在本教程中学习 OpenCL C++:单击(不是必需的)

该视频使用CL API版本1.2 ,因此我从该回复中的链接下载了OpenCL 1.2标头: https ://stackoverflow.com/a/57017982/11968932

Visual Studio 2022未显示任何错误,但程序会输出以下符号:

╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠╠

应该"Hello World!"

这是程序本身。主持人:

#define CL_USE_DEPRECATED_OPENCL_1_2_APIS

#include <CL/cl.hpp>
#include <iostream>
#include <fstream>

int main() 
{
    std::vector<cl::Platform> platforms;
    cl::Platform::get(&platforms);

    auto platform = platforms.front();
    std::vector<cl::Device> devices;
    platform.getDevices(CL_DEVICE_TYPE_ALL, &devices);

    auto device = devices.front();

    std::ifstream helloWorldFile("HelloWorld.cl");
    std::string src(std::istreambuf_iterator<char>(helloWorldFile), (std::istreambuf_iterator<char>()) );

    cl::Program::Sources sources(1, std::make_pair(src.c_str(), src.length() + 1));

    cl::Context context(device);
    cl::Program program(context, sources);

    auto err = program.build("cl-std=CL1.2");

    char buf[16];
    cl::Buffer memBuf(context, CL_MEM_WRITE_ONLY | CL_MEM_READ_ONLY, sizeof(buf));
    cl::Kernel kernel(program, "HelloWorld", &err);
    kernel.setArg(0, memBuf);

    cl::CommandQueue queue(context, device);
    queue.enqueueTask(kernel);
    queue.enqueueReadBuffer(memBuf, CL_TRUE, 0, sizeof(buf), buf);

    std::cout << buf << " - buf" << std::endl;
}

HelloWorld.cl:

_kernel void HelloWorld(_global char* data)
{
    data[0] = 'H';
    data[1] = 'e';
    data[2] = 'l';
    data[3] = 'l';
    data[4] = 'o';
    data[5] = ' ';
    data[6] = 'W';
    data[7] = 'o';
    data[8] = 'r';
    data[9] = 'l';
    data[10] = 'd';
    data[11] = '!';
    data[12] = '\n';
}

谢谢 ;)

4

1 回答 1

1

三个错误:

  1. 它是__kernelor kernel,但没有_kernel一个下划线;同样的__global
  2. cl::Buffer memBuf(context, CL_MEM_READ_WRITE, 16*sizeof(buf));- 这里有两件事是错误的:CL_MEM_WRITE_ONLY | CL_MEM_READ_ONLY标志意味着设备端的缓冲区完全不可访问,它只为第一个字符分配内存(忘记了16*sizeof(buf)
  3. queue.enqueueReadBuffer(memBuf, CL_TRUE, 0, 16*sizeof(buf), (void*)buf);- 忘记了16*sizeof(buf)

我也不得不做auto err = program.build();没有任何争论。

另请注意:

  • 虽然它有效,但堆栈分配 ( char buf[16];) 会限制缓冲区大小。使用堆分配 ( char* buf = new char[16];) 代替(不要忘记delete[] buf;)。
  • 不要使用queue.enqueueTask(kernel);queue.enqueueNDRangeKernel(cl_kernel, cl::NullRange, cl::NDRange(...), cl::NDRange(32));而是。有了这个,您可以指定全局和局部范围。

最后,有点广告:我创建了一个OpenCL-Wrapper来极大地简化 OpenCL 的学习和工作。这个 Wrapper 消除了跟踪例如缓冲区大小或为 CPU 和设备提供重复缓冲区的需要。您需要为 HelloWorld 示例编写的代码明显更短、更容易:

#include "opencl.hpp"
int main() {
    const Device device(select_device_with_most_flops()); // compile OpenCL C code for the fastest available device
    const uint N = 16u; // size of vectors
    Memory<char> buf(device, N); // allocate memory on both host and device
    const Kernel HelloWorld(device, N, "HelloWorld", buf); // kernel that runs on the device
    HelloWorld.run(); // run add_kernel on the device
    buf.read_from_device(); // copy data from device memory to host memory
    println(buf.data());
}
#include "kernel.hpp" // note: string literals can't be arbitrarily long, so periodically interrupt with )+R(
string opencl_c_container() { return R( // ########################## begin of OpenCL C code ####################################################################

kernel void HelloWorld(global char* data) {
    data[0] = 'H';
    data[1] = 'e';
    data[2] = 'l';
    data[3] = 'l';
    data[4] = 'o';
    data[5] = 32; // spaces are wrongly converted with stringification macro, so use ascii code here instead of ' '
    data[6] = 'W';
    data[7] = 'o';
    data[8] = 'r';
    data[9] = 'l';
    data[10] = 'd';
    data[11] = '!';
    data[12] = '\n';
}

);} // ############################################################### end of OpenCL C code #####################################################################
于 2022-01-30T09:22:14.693 回答