0

我必须使用 OpenCL 实现一个算法,我已经给出了一些数字来计算每个数字从某个偏移量连续形成的后续零的数量。这是代码:

int count=0;
    for(int i=63-offset; i>=0; i--)
    {
        long long int count_pow_1 = 1;
        long long int base = 2;
        long long int exp = i;
        for(int j=exp; j>=0; j--){
            if(j==0) {break;}
            if(j==1) {count_pow_1 = count_pow_1 * base; break;}
            count_pow_1 = count_pow_1 * base;
        }
        
        unsigned long long int count_pow = count_pow_1;
            
        if(((bits/(count_pow))%2)==1){
            break;
        }else{
            count++;
        }
    }

其中 count 是后面的零的数量。但它不起作用,它给了我一个接近 56 的数字,偏移量为 8,这意味着这些数字被视为全零或几乎全零。你看到问题出在哪里了吗?不使用 opencl 在 CPU 上执行代码似乎可以正常工作。

4

1 回答 1

3

您可以更快、更优雅地做到这一点:要从偏移量中获取后续零的数量,首先将数字向左移动偏移量 ( bits = bits<<offset;),然后计算前导零的数量。

要计算前导零的数量,您可以使用内置的 OpenCL 函数int count = clz(bits);,请参阅OpenCL 1.2 参考卡。或者,您可以利用该强制转换来隐含地为指数执行 log2,这相当于以位为单位的数字的长度减去 1 减去前导零的数量:int count = 63-(int)((as_ulong((double)bits)>>52)-1023);clz执行非常缓慢,因此施法技巧运行得更快。

于 2021-01-27T07:54:15.293 回答