在两台不同机器上编译的同一个 CUDA 内核的计算时间差异约为 3-4 倍。两个版本都在同一台机器和 GPU 设备上运行。解释差异的直接结论是不同的编译器设置。虽然没有单一的完美设置,并且应该根据内核自定义调整,但我想知道是否有任何明确的指导可以帮助选择正确的设置。我使用 Visual Studio 2010。谢谢。
问问题
476 次
在两台不同机器上编译的同一个 CUDA 内核的计算时间差异约为 3-4 倍。两个版本都在同一台机器和 GPU 设备上运行。解释差异的直接结论是不同的编译器设置。虽然没有单一的完美设置,并且应该根据内核自定义调整,但我想知道是否有任何明确的指导可以帮助选择正确的设置。我使用 Visual Studio 2010。谢谢。