2

在用 C++ 编写 OpenCL 主机程序时,我们使用以下 API 来调用 OpenCL 内核:

cl_int clEnqueueNDRangeKernel (     cl_command_queue command_queue,
    cl_kernel kernel,
    cl_uint work_dim,
    const size_t *global_work_offset,
    const size_t *global_work_size,
    const size_t *local_work_size,
    cl_uint num_events_in_wait_list,
    const cl_event *event_wait_list,
    cl_event *event)

这里第三个参数设置工作维度。在 python 中使用 pyopencl 时,我们将内核作为程序的一部分称为:

<program_name>.<kernel_name>( <command_queue>, <Global_work_size>,
                              <Local_work_size>, <Parameters_to_kernel.....> )

例如:

event = program.square( queue, A.shape, None, 
                        A_buf, B_buf, cl.LocalMemory( A.size), np.int32(COUNT) )

那么如何使用pyopencl在python中显式设置“work_dim”?

4

1 回答 1

2

你没有。 work_dim在 C/C++ OpenCL API 中传递,以便库可以知道一维数组的大小global_work_offset等;global_size在 PyOpenCL 中,这些大小是从传递为、local_size和的对象中推断出来的global_offset

于 2012-10-22T11:38:27.270 回答