-1

我知道这可以通过使用带有位操作功能的循环来实现,但是我想知道是否有更快、更直接的方法来做到这一点。我使用大约 64 位作为我的数据结构的标头,这可能是许多不同的东西。线程对标头进行解码,然后分配正确的结构,然后对该数据结构进行操作。但是现在我正在使用位操作函数来读取和写入标题,这不太理想,我阅读了 cuda 和 ptx 文档,但没有找到任何可以帮助我的东西。我想知道我是否确实错过了任何内容,或者实际上没有专门用于一次读取单个位的特定功能。

4

1 回答 1

1

你没有找到你要找的东西,因为它不存在。

PTX 仅支持8、16、32和 64 位类型的内存事务,或相同基本类型的 2 或 4 个元素向量。没有用于从内存中的任意字加载或存储单个位的指令。

于 2016-05-27T05:54:22.573 回答