我有一个映射表,我知道可以通过执行以下操作将其复制到 CUDA 常量内存:
#define LENGTH 4
#define THREAD_BLOCKS 64
const int mapTable[LENGTH] = {0, 1, 3, 5};
int main()
{
//..
__constant__ int dMapTable[LENGTH];
cudaMemcpyToSymbol( dMapTable , mapTable, size_t(LENGTH) * sizeof(int) , 0, cudaMemcpyHostToDevice );
//..
}
现在我要做的是在 CUDA 常量内存中创建该表的多个副本。我要创建的副本数量等于线程块 THREAD_BLOCKS 的数量。谁能建议我如何做到这一点并有效地做到这一点?