我编写了一个简单的代码,它只启动一个块和块内的一个线程。内核创建一个 48 KB的共享内存阵列,填充流式多处理器的整个共享内存。代码设置和取消设置共享内存中的各个位。我注意到前 32 位代码运行良好。然而,当我开始翻转剩余的位时,什么也没有发生,位保持不变。
有什么想法吗?我是 CUDA 编程的新手。有没有理由相信这与内存库冲突有关?
我编写了一个简单的代码,它只启动一个块和块内的一个线程。内核创建一个 48 KB的共享内存阵列,填充流式多处理器的整个共享内存。代码设置和取消设置共享内存中的各个位。我注意到前 32 位代码运行良好。然而,当我开始翻转剩余的位时,什么也没有发生,位保持不变。
有什么想法吗?我是 CUDA 编程的新手。有没有理由相信这与内存库冲突有关?