0

晚上好!我正在编写一个高性能应用程序并尝试使用 boost 来加速复杂的计算。

我的问题的本质:有没有办法将指向数组的外部指针(如float4_ *)传递给 a BOOST_COMPUTE_CLOSURE?我想得到类似的东西:

float4_ *normals = new float4_[NORMALS_NO];
BOOST_COMPUTE_CLOSURE(void, evalNormals, (int4_ indices), (normals), {
    ...
});
4

2 回答 2

0

库作者在此处报告的文档BOOST_COMPUTE_CLOSURE略显稀疏,但一些测试用例显示了如何捕获s 和s。它实际上是透明地工作的,与标量相同。vectorarray

例如,捕获vec

int data[] = {6, 7, 8, 9};
compute::vector<int> vec(data, data + 4, queue);

BOOST_COMPUTE_CLOSURE(int, get_vec, (int i), (vec), { return vec[i]; });

// run using a counting iterator to copy from vec to output
compute::vector<int> output(4, context);
compute::transform(
    compute::make_counting_iterator(0),
    compute::make_counting_iterator(4),
    output.begin(),
    get_vec,
    queue);
CHECK_RANGE_EQUAL(int, 4, output, (6, 7, 8, 9));
于 2021-01-28T18:00:19.403 回答
0

好的,我终于找到了如何实现声明的选项。首先要做的是将boost::compute::detail::device_ptr<float4_>实例传递给函数。接下来我们应该为`OpenCL backend`声明一个类型名生成器,并将operator<<指针信息写入meta_kernel实例,它在闭包定义中以隐藏的方式使用。所以,代码:

1) 传递device_ptr实例

...
#include <boost/compute/detail/device_ptr.hpp>
...
float4_ *normalsData = new float4_[NORMALS_NO];
device_ptr<float4_> normalsDataDP = normalsData;
...
BOOST_COMPUTE_CLOSURE(void, evalNormals, (int4_ indices), (normalsDataDP), {
    ...
});
...

2)实现类型名生成器:

...
namespace boost {
    namespace compute {
        template<>
        inline const char *type_name<detail::device_ptr<float4_>>()
        {
            return "__global float4 *";
        }
    }
}
...

3) 实施operator<<

...
namespace boost {
    namespace compute {
        namespace detail {
            meta_kernel &operator<<(meta_kernel &kern, 
                                    const device_ptr<float4_> &ptr)
            {
                std::string nodes_info = kern.get_buffer_identifier<float4_>(ptr.get_buffer());
                kern << kern.var<float4_ *>(nodes_info);
                return kern;
            }
        }
    }
}
...
于 2019-02-12T13:30:05.343 回答