0

我正在学习 oneapi,当我在使用 dpcpp 并行版本时尝试执行 Exclusive_scan 时得到错误的结果。

它总是假定第一个元素为零。

代码:

#include <CL/sycl.hpp>
#include <oneapi/dpl/execution>
#include <oneapi/dpl/numeric>
#include <oneapi/dpl/iterator>
#include <iostream>
#include <vector>



int main(){
    sycl::queue Q(sycl::cpu_selector{});

    const u_int32_t n   = 100;
    
    std::vector<u_int32_t> data(n,1);
    
    {    
        sycl::buffer b_data(data);
        auto policy = oneapi::dpl::execution::make_device_policy<class mypolicy>(Q);
        oneapi::dpl::exclusive_scan(
            policy,
            oneapi::dpl::begin(b_data),
            oneapi::dpl::end(b_data),
            oneapi::dpl::begin(b_data),
            0);
    }
    
    for(auto i=0; i<10 ; i++){
        std::cout << data[i] << std::endl;
    }
}

输出:

0
0
1
2
3
4
5
6
7
8

预期输出:

0
1
2
3
4
5
6
7
8
9

构建命令: dpcpp -Wall main.cpp -o main

4

1 回答 1

0

这是以下链接中提到的已知限制: https ://www.intel.com/content/www/us/en/develop/documentation/oneapi-dpcpp-library-guide/top/intel-oneapi-dpc-图书馆-onedpl-overview.html

对于一元运算,建议使用初始值作为 1 而不是 0。

oneapi::dpl::exclusive_scan(
        policy,
        oneapi::dpl::begin(b_data),
        oneapi::dpl::end(b_data),
        oneapi::dpl::begin(b_data),
        1);

谢谢和问候,赫曼思。

于 2022-03-03T12:44:30.430 回答