1

是否可以像 Thrust 这样的 CUB 使用迭代器?我想使用 CUB 而不是推力,如下所示:

__global__ void reduce_roster(thrust::device_vector<float>::iterator vect, float * tab_seq, int SEUIL_ROSTER)
{
    int tid = blockIdx.x * blockDim.x + threadIdx.x;
    float resultat = 0;

    int i = TAILLE_ROSTER/TAILLE_SEQ_ROSTER;
    resultat = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER *  (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);


    float tmp;
    i--;

    while (resultat != -1 && i != 0)
    {
        if (resultat > SEUIL_ROSTER)
        {
            resultat = -1; 
        }
        else
        {               

            tmp = thrust::reduce(thrust::device, vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER *  (i - 1), vect + (tid * TAILLE_ROSTER) + TAILLE_SEQ_ROSTER * i);

            resultat = resultat + tmp;


            i--;
        }
    }

由于 CUB 比信任更快,我试图用它来减少数组的段。

4

1 回答 1

1

不。

此外,也不可能使用 CUB 来执行您在代码中显示的相同操作。根据您编译内核的方式,thrust 将发出代码,其中减少由每个线程串行执行,或者由使用动态并行性的子内核启动。另一方面,CUB 具有扭曲和块范围设备缩减功能。它不支持单线程或动态并行范围操作。

于 2018-10-10T08:49:12.183 回答