9

我需要在 GPU 上进行大量按位运算,但找不到有关 Nvidia 硬件是大端还是小端的任何信息。

4

2 回答 2

12

请参阅:https ://devtalk.nvidia.com/default/topic/366773/cuda-programming-and-performance/endian-mode-of-the-device/post/2630674/#2630674

所有受支持的 CUDA 平台都使用 little-endian CPU,并且 cudaMemcpy() 可以在不知道数据格式的情况下将数据结构复制到设备,所以我假设 GPU 也是 little-endian。GPU 可能同时支持大端和小端执行(因为一些 CPU 也这样做)作为对未来 CUDA 平台大端的对冲。

我的猜测是答案必须是“小端”或“两者”。

于 2013-03-12T09:23:48.427 回答
9

根据CUDA 指南的硬件实现部分,little-endian。

于 2020-07-14T14:35:01.517 回答