我想使用__constant__
所有内核中的所有线程都可以访问的内存。
声明是这样的
extern __constant__ float smooth [8 * 1024];
我正在使用将数据复制到此变量
cudaMemcpyToSymbol("smooth", smooth_local, smooth_size, 0, cudaMemcpyHostToDevice);
smooth_size = 7K 字节
它给了我不正确的输出
但是当我在-deviceemu
模式下运行它并尝试在内核中打印这两个变量的内容时,我得到了所有的零平滑和smooth_local 是正确的。
cudaMemcpyToSymbol
我尝试在它仍然给我 0之后打印输出。
你能解释一下我的问题吗?