我知道这可以通过使用带有位操作功能的循环来实现,但是我想知道是否有更快、更直接的方法来做到这一点。我使用大约 64 位作为我的数据结构的标头,这可能是许多不同的东西。线程对标头进行解码,然后分配正确的结构,然后对该数据结构进行操作。但是现在我正在使用位操作函数来读取和写入标题,这不太理想,我阅读了 cuda 和 ptx 文档,但没有找到任何可以帮助我的东西。我想知道我是否确实错过了任何内容,或者实际上没有专门用于一次读取单个位的特定功能。
问问题
57 次